GPT-5.4 mini, 더 싸다고요? 이 수치 먼저 보세요

Published on

in

GPT-5.4 mini, 더 싸다고요? 이 수치 먼저 보세요

2026.03.18 출시 기준
GPT-5.4 mini · nano
IT/AI

GPT-5.4 mini, 더 싸다고요?
이 수치 먼저 보세요

2026년 3월 18일, OpenAI가 소형 모델 두 개를 동시 출시했습니다. GPT-5.4 mini는 속도가 2배 빠르고, GPT-5.4 nano는 역대 가장 저렴한 GPT-5.4 계열 모델이라고 합니다. 그런데 “저렴하다”는 말을 그대로 믿으면 기존 워크플로우에서 비용이 3~4배 뛸 수 있습니다. 공식 수치를 직접 따져봤습니다.

mini 입력 토큰 인상폭
(GPT-5 mini 대비)
nano 입력 토큰 인상폭
(GPT-5 nano 대비)
54.4%
mini SWE-Bench Pro
(GPT-5 mini 45.7%)

🚀 출시 배경 — 왜 지금 mini·nano인가

GPT-5.4가 2026년 3월 5일(KST) 출시된 지 13일 만에 mini와 nano가 바로 뒤를 따랐습니다. OpenAI는 공식 발표문에서 이 두 모델이 “고용량 워크로드, 코딩 어시스턴트, 서브에이전트, 멀티모달 작업”을 위한 빠르고 효율적인 선택지라고 설명합니다. (출처: OpenAI 공식 블로그 Introducing GPT-5.4 mini and nano, 2026.03.17)

핵심 맥락은 에이전트 구조입니다. 큰 모델(GPT-5.4)이 계획·판단을 맡고, 병렬로 작동하는 서브에이전트들이 mini나 nano를 써서 빠르게 보조 작업을 처리하는 방식입니다. 속도와 비용을 동시에 잡으려는 설계입니다. 이 흐름은 기업 개발자들이 AI 에이전트 파이프라인을 구축할 때 실질적인 부담을 낮춰줍니다.

다만 “서브에이전트용이니까 무조건 저렴할 것”이라는 기대는 다음 섹션에서 완전히 뒤집힙니다.

💸 API 가격 전격 비교 — “소형 모델 = 저렴”이 틀린 이유

솔직히 말하면, 처음 가격표를 보고 깜짝 놀랐습니다. OpenAI 커뮤니티 포럼에서 실제 사용자가 직접 계산한 세대 간 인상폭은 아래와 같습니다.

모델 입력 (1M 토큰) 출력 (1M 토큰) 캐시 입력
GPT-5.4 mini 신규 $0.75 $4.50 $0.075
GPT-5 mini 구형 $0.25 $2.00 $0.025
인상폭 (mini) +200% (3배) +125% (2.25배) +200%
GPT-5.4 nano 신규 $0.20 $1.25 $0.02
GPT-5 nano 구형 $0.05 $0.40 $0.005
인상폭 (nano) +300% (4배) +213% (3.125배) +300%

출처: OpenAI API Pricing 공식 페이지 (openai.com/api/pricing/) + OpenAI 커뮤니티 포럼 검증 (2026.03.18)

💡 공식 발표문과 실제 가격표를 같이 놓고 보면 이런 차이가 보입니다. OpenAI는 신규 모델을 “더 비용 효율적”이라고 표현했는데, 이건 이전 세대 구형 nano보다 싼 것이 아니라 같은 세대 GPT-5.4 플래그십 대비 싸다는 의미입니다. 기존 GPT-5 nano로 대규모 API 호출을 하던 개발자라면 그대로 버전만 올렸다가는 비용이 4배 뛰는 구조입니다.

Reddit에서도 같은 반응이 나왔습니다. 사용자 Balance-는 “입력 가격이 $0.25에서 $0.75로 3배가 됐다. 드롭인 교체로 쓰기 매우 어렵다”고 직접 지적했습니다. (출처: r/OpenAI, 2026.03.17)

📊 핵심 벤치마크 7종 직접 정리

아래 수치는 OpenAI 공식 발표문에 수록된 벤치마크입니다. (출처: Introducing GPT-5.4 mini and nano, OpenAI, 2026.03.17) 추론 노력 수준은 모두 xhigh 기준이며, GPT-5 mini는 최대 high까지만 지원합니다.

벤치마크 GPT-5.4 5.4 mini 5.4 nano GPT-5 mini
SWE-Bench Pro (코딩) 57.7% 54.4% 52.4% 45.7%
Terminal-Bench 2.0 (터미널) 75.1% 60.0% 46.3% 38.2%
GPQA Diamond (과학추론) 93.0% 88.0% 82.8% 81.6%
OSWorld-Verified (컴퓨터 사용) 75.0% 72.1% 39.0% 42.0%
Toolathlon (도구 호출) 54.6% 42.9% 35.5% 26.9%
τ2-bench (통신 도구) 98.9% 93.4% 92.5% 74.1%
MRCR v2 8-needle 128K~256K (장문) 79.3% 33.6% 33.1% 19.4%

출처: OpenAI 공식 블로그 Introducing GPT-5.4 mini and nano (2026.03.17) / 추론 노력: xhigh (GPT-5 mini는 high 최대)

수치를 보면서 가장 눈에 걸린 부분은 두 가지입니다. 첫째, mini는 코딩·과학추론에서 플래그십에 거의 근접하는데, 장문 컨텍스트에서 갑자기 79.3%에서 33.6%로 추락합니다. 이 격차가 실제로 어떤 의미인지는 섹션 6에서 자세히 다룹니다. 둘째, nano는 OSWorld-Verified에서 구세대 GPT-5 mini(42.0%)보다도 낮은 39.0%를 기록했습니다. 컴퓨터 사용 에이전트에 nano를 붙이면 오히려 후퇴하는 셈입니다.

📱 어디서 쓸 수 있나 — ChatGPT vs API vs Codex

접근 방식이 모델마다, 플랫폼마다 다릅니다. 공식 발표문 기준(2026.03.17)으로 직접 정리했습니다.

GPT-5.4 mini
  • API: 텍스트·이미지·도구·웹검색·컴퓨터 사용 지원, 400K 컨텍스트
  • Codex: GPT-5.4 쿼터의 30%만 소모
  • ChatGPT 무료·Go: ‘+’ 메뉴 → ‘잘 생각하기’로 접근
  • ChatGPT Plus 이상: GPT-5.4 Thinking 한도 소진 시 자동 전환
GPT-5.4 nano
  • API 전용 (ChatGPT UI 미지원)
  • 이미지 입력·도구 호출·함수 콜링·구조화 출력 지원
  • 400K 컨텍스트
  • 컴퓨터 사용(CUA) 공식 비권장

💡 Plus 이상 구독자에게 mini는 사실상 “한도 초과 보험”입니다. 직접 선택해서 쓰는 모델이 아니라, GPT-5.4 Thinking을 다 쓴 뒤 자동으로 붙는 구조입니다. 공식 문서에 이 부분이 작게 적혀 있어서 놓치기 쉽습니다. (출처: OpenAI 공식 블로그, 2026.03.17)

개인 사용자 입장에서 nano는 ChatGPT를 아무리 써도 직접 접근이 안 됩니다. 개발자 API 키가 없으면 nano의 혜택을 전혀 누리지 못하는 구조입니다. 이 부분이 좀 아쉬웠습니다.

⚔️ Gemini 3 Flash·Claude Haiku 4.5와 비교하면

경쟁 모델과 나란히 놓고 보면 GPT-5.4 mini·nano의 포지션이 더 선명하게 보입니다. Reddit 사용자 bortlip이 직접 공식 벤치마크를 엮어 작성한 비교에 DataCamp 분석을 더했습니다.

모델 입력 ($/ 1M) Terminal-Bench 2.0 GPQA Diamond
GPT-5.4 mini $0.75 60.0% 88.0%
GPT-5.4 nano $0.20 46.3% 82.8%
Gemini 3 Flash $0.50 47.6% — (미공개)
Gemini 3.1 Flash Lite $0.25 51.7% — (미공개)
Claude Haiku 4.5 $1.00 — (미공개) — (미공개)

출처: OpenAI 공식 블로그 (2026.03.17), Reddit r/OpenAI (2026.03.17), DataCamp 분석 (2026.03.17) / Gemini 3 Flash는 preview 상태

GPT-5.4 nano($0.20)와 Gemini 3 Flash($0.50)를 Terminal-Bench 2.0으로만 비교하면 nano가 46.3%로 살짝 낮은 대신 가격이 절반도 안 됩니다. 코딩 성능이 조금 낮아도 괜찮은 대량 분류·추출 작업이라면 nano가 비용 면에서 우위입니다.

반면 Claude Haiku 4.5는 입력 $1.00으로 GPT-5.4 mini($0.75)보다 비싼데, DataCamp 분석 기준 GPQA Diamond나 τ2-bench에서 nano보다도 낮은 수치가 확인됩니다. GPT-5.4 nano가 Haiku 4.5를 가격과 범용 추론 두 영역에서 동시에 앞서는 상황입니다. (출처: DataCamp, GPT-5.4 mini and nano: Benchmarks, Access, and Reactions, 2026.03.17)

⚠️ 장문 컨텍스트 함정 — nano가 생각보다 불리한 상황

GPT-5.4 mini와 nano 모두 400K 토큰 컨텍스트 윈도우를 지원합니다. 숫자만 보면 플래그십과 같습니다. 그런데 OpenAI MRCR v2 장문 테스트를 보면 이야기가 달라집니다.

실측 수치 (MRCR v2 8-needle, 128K~256K 구간)

  • GPT-5.4: 79.3%
  • GPT-5.4 mini: 33.6% (플래그십 대비 -45.7%p)
  • GPT-5.4 nano: 33.1%
  • GPT-5 mini: 19.4%

출처: OpenAI 공식 블로그 Introducing GPT-5.4 mini and nano (2026.03.17)

코딩(SWE-Bench)에서 mini가 플래그십과 3.3%p밖에 차이 안 났는데, 장문 컨텍스트에서는 45.7%p가 벌어집니다. 400K 창을 지원한다는 것과 400K 분량의 문서에서 정확히 찾아낸다는 것은 완전히 다른 이야기입니다.

💡 기존에 알려진 “컨텍스트 창 크기 = 장문 처리 능력”이라는 공식이, 실제 수치와 나란히 놓이면 전혀 다르게 보입니다. 레거시 코드베이스 전체를 집어넣고 분석하는 용도로 mini를 쓰려던 계획이라면, 이 수치를 먼저 확인하는 게 맞습니다.

결론부터 말하면, mini와 nano는 “짧고 빠른 작업”에 최적화됐습니다. 긴 문서 요약, 대규모 코드베이스 분석, 복잡한 멀티턴 대화 유지에는 플래그십 GPT-5.4를 써야 하는 상황이 여전히 많습니다. 비용 절감 목적으로 무조건 소형 모델로 교체하려다가 정확도가 뚝 떨어지는 상황이 생길 수 있습니다.

❓ Q&A 5선

Q1. GPT-5.4 mini와 GPT-5 mini, 그냥 교체해도 될까요?
API 비용부터 확인하세요. 입력 토큰 기준으로 mini가 $0.25에서 $0.75로 3배 올랐습니다. 코드베이스를 수정 없이 모델명만 바꾸면 비용 청구서가 3배 가까이 늘어납니다. 성능은 올랐지만, 가격도 같이 올랐습니다.
Q2. ChatGPT Plus 구독자도 GPT-5.4 mini를 선택해서 쓸 수 있나요?
직접 선택은 안 됩니다. GPT-5.4 Thinking 한도를 다 소진했을 때 자동으로 mini로 전환되는 구조입니다. 무료·Go 플랜은 ‘+’ 메뉴의 ‘잘 생각하기’에서 접근 가능합니다. (출처: OpenAI 공식 블로그, 2026.03.17)
Q3. GPT-5.4 nano로 컴퓨터 사용 에이전트를 만들 수 있나요?
공식 비권장입니다. OSWorld-Verified에서 39.0%로 구세대 GPT-5 mini(42.0%)보다 낮게 나왔습니다. 스크린샷 기반 인터페이스 조작이 필요한 작업이라면 mini 또는 플래그십이 적합합니다.
Q4. Codex에서 GPT-5.4 mini는 어떻게 작동하나요?
Codex에서 mini는 GPT-5.4 쿼터의 30%만 소모합니다. 더 간단한 서브에이전트 작업을 mini에 위임하면 플래그십 모델의 한도를 아낄 수 있습니다. 플래그십이 계획하고 mini가 실행하는 구조를 Codex가 자동으로 지원합니다.
Q5. GPT-5 mini가 아직 저렴한데 굳이 5.4 mini로 바꿔야 할까요?
사실 당장 바꿀 필요는 없습니다. 다만 OpenAI는 GPT-5 mini의 지원 종료를 공식 고지하지 않은 상태입니다. 비용이 중요하다면 당분간 기존 모델을 유지하되, 이미 GPT-5.4 mini가 더 빠르고 코딩·추론 성능이 뚜렷하게 높으므로 새 프로젝트는 5.4 mini로 시작하는 것이 현실적입니다.

✍️ 마치며

GPT-5.4 mini·nano는 분명 성능이 좋아졌습니다. 코딩 벤치마크에서 플래그십에 근접하고, 도구 호출 정확도도 전 세대 대비 눈에 띄게 올랐습니다. 다만 “소형 모델 = 저렴”이라는 등식은 이번에도 성립하지 않았습니다. 전 세대보다 3~4배 비싼 채로 나왔고, 장문 컨텍스트에서의 성능 격차는 컨텍스트 창 크기에서 읽히지 않습니다.

개인적으로 GPT-5.4 mini는 빠른 코딩 서브에이전트 용도로 인상적이었습니다. 반면 nano는 분류·데이터 추출처럼 정말 단순하고 대량인 작업 외에는 굳이 선택할 이유가 쉽게 보이지 않습니다. 경쟁사 모델과의 비용-성능 비교를 꼼꼼히 한 번 더 해볼 필요가 있습니다.

DataCamp가 지적한 것처럼, 지금 시대에 단일 모델 최적화보다는 모델을 쉽게 교체할 수 있는 아키텍처를 짜는 것이 더 오래가는 선택입니다. 오늘의 미니가 내일의 기본값이 되고, 오늘의 플래그십이 내년의 무료 티어가 되는 속도로 시장이 움직이고 있습니다.

📎 본 포스팅 참고 자료

  1. OpenAI 공식 블로그 — Introducing GPT-5.4 mini and nano (2026.03.17)
  2. OpenAI API Pricing 공식 페이지 (2026.03.27 기준)
  3. OpenAI 커뮤니티 포럼 — 가격 인상폭 검증 및 이미지 과금 이슈 (2026.03.17~18)
  4. DataCamp — GPT-5.4 mini and nano: Benchmarks, Access, and Reactions (2026.03.17)
  5. 나무위키 GPT-5 문서 (2026.03 업데이트)

※ 본 포스팅은 2026년 3월 27일 기준으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 모든 API 요금과 벤치마크 수치는 공식 출처 기반이나, OpenAI의 업데이트로 달라질 수 있으므로 이용 전 공식 페이지에서 직접 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기