GPT-5.4 mini · nano
IT/AI
GPT-5.4 mini, 더 싸다고요?
이 수치 먼저 보세요
2026년 3월 18일, OpenAI가 소형 모델 두 개를 동시 출시했습니다. GPT-5.4 mini는 속도가 2배 빠르고, GPT-5.4 nano는 역대 가장 저렴한 GPT-5.4 계열 모델이라고 합니다. 그런데 “저렴하다”는 말을 그대로 믿으면 기존 워크플로우에서 비용이 3~4배 뛸 수 있습니다. 공식 수치를 직접 따져봤습니다.
(GPT-5 mini 대비)
(GPT-5 nano 대비)
(GPT-5 mini 45.7%)
🚀 출시 배경 — 왜 지금 mini·nano인가
GPT-5.4가 2026년 3월 5일(KST) 출시된 지 13일 만에 mini와 nano가 바로 뒤를 따랐습니다. OpenAI는 공식 발표문에서 이 두 모델이 “고용량 워크로드, 코딩 어시스턴트, 서브에이전트, 멀티모달 작업”을 위한 빠르고 효율적인 선택지라고 설명합니다. (출처: OpenAI 공식 블로그 Introducing GPT-5.4 mini and nano, 2026.03.17)
핵심 맥락은 에이전트 구조입니다. 큰 모델(GPT-5.4)이 계획·판단을 맡고, 병렬로 작동하는 서브에이전트들이 mini나 nano를 써서 빠르게 보조 작업을 처리하는 방식입니다. 속도와 비용을 동시에 잡으려는 설계입니다. 이 흐름은 기업 개발자들이 AI 에이전트 파이프라인을 구축할 때 실질적인 부담을 낮춰줍니다.
다만 “서브에이전트용이니까 무조건 저렴할 것”이라는 기대는 다음 섹션에서 완전히 뒤집힙니다.
💸 API 가격 전격 비교 — “소형 모델 = 저렴”이 틀린 이유
솔직히 말하면, 처음 가격표를 보고 깜짝 놀랐습니다. OpenAI 커뮤니티 포럼에서 실제 사용자가 직접 계산한 세대 간 인상폭은 아래와 같습니다.
| 모델 | 입력 (1M 토큰) | 출력 (1M 토큰) | 캐시 입력 |
|---|---|---|---|
| GPT-5.4 mini 신규 | $0.75 | $4.50 | $0.075 |
| GPT-5 mini 구형 | $0.25 | $2.00 | $0.025 |
| 인상폭 (mini) | +200% (3배) | +125% (2.25배) | +200% |
| GPT-5.4 nano 신규 | $0.20 | $1.25 | $0.02 |
| GPT-5 nano 구형 | $0.05 | $0.40 | $0.005 |
| 인상폭 (nano) | +300% (4배) | +213% (3.125배) | +300% |
출처: OpenAI API Pricing 공식 페이지 (openai.com/api/pricing/) + OpenAI 커뮤니티 포럼 검증 (2026.03.18)
💡 공식 발표문과 실제 가격표를 같이 놓고 보면 이런 차이가 보입니다. OpenAI는 신규 모델을 “더 비용 효율적”이라고 표현했는데, 이건 이전 세대 구형 nano보다 싼 것이 아니라 같은 세대 GPT-5.4 플래그십 대비 싸다는 의미입니다. 기존 GPT-5 nano로 대규모 API 호출을 하던 개발자라면 그대로 버전만 올렸다가는 비용이 4배 뛰는 구조입니다.
Reddit에서도 같은 반응이 나왔습니다. 사용자 Balance-는 “입력 가격이 $0.25에서 $0.75로 3배가 됐다. 드롭인 교체로 쓰기 매우 어렵다”고 직접 지적했습니다. (출처: r/OpenAI, 2026.03.17)
📊 핵심 벤치마크 7종 직접 정리
아래 수치는 OpenAI 공식 발표문에 수록된 벤치마크입니다. (출처: Introducing GPT-5.4 mini and nano, OpenAI, 2026.03.17) 추론 노력 수준은 모두 xhigh 기준이며, GPT-5 mini는 최대 high까지만 지원합니다.
| 벤치마크 | GPT-5.4 | 5.4 mini | 5.4 nano | GPT-5 mini |
|---|---|---|---|---|
| SWE-Bench Pro (코딩) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 (터미널) | 75.1% | 60.0% | 46.3% | 38.2% |
| GPQA Diamond (과학추론) | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified (컴퓨터 사용) | 75.0% | 72.1% | 39.0% | 42.0% |
| Toolathlon (도구 호출) | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (통신 도구) | 98.9% | 93.4% | 92.5% | 74.1% |
| MRCR v2 8-needle 128K~256K (장문) | 79.3% | 33.6% | 33.1% | 19.4% |
출처: OpenAI 공식 블로그 Introducing GPT-5.4 mini and nano (2026.03.17) / 추론 노력: xhigh (GPT-5 mini는 high 최대)
수치를 보면서 가장 눈에 걸린 부분은 두 가지입니다. 첫째, mini는 코딩·과학추론에서 플래그십에 거의 근접하는데, 장문 컨텍스트에서 갑자기 79.3%에서 33.6%로 추락합니다. 이 격차가 실제로 어떤 의미인지는 섹션 6에서 자세히 다룹니다. 둘째, nano는 OSWorld-Verified에서 구세대 GPT-5 mini(42.0%)보다도 낮은 39.0%를 기록했습니다. 컴퓨터 사용 에이전트에 nano를 붙이면 오히려 후퇴하는 셈입니다.
📱 어디서 쓸 수 있나 — ChatGPT vs API vs Codex
접근 방식이 모델마다, 플랫폼마다 다릅니다. 공식 발표문 기준(2026.03.17)으로 직접 정리했습니다.
- API: 텍스트·이미지·도구·웹검색·컴퓨터 사용 지원, 400K 컨텍스트
- Codex: GPT-5.4 쿼터의 30%만 소모
- ChatGPT 무료·Go: ‘+’ 메뉴 → ‘잘 생각하기’로 접근
- ChatGPT Plus 이상: GPT-5.4 Thinking 한도 소진 시 자동 전환
- API 전용 (ChatGPT UI 미지원)
- 이미지 입력·도구 호출·함수 콜링·구조화 출력 지원
- 400K 컨텍스트
- 컴퓨터 사용(CUA) 공식 비권장
💡 Plus 이상 구독자에게 mini는 사실상 “한도 초과 보험”입니다. 직접 선택해서 쓰는 모델이 아니라, GPT-5.4 Thinking을 다 쓴 뒤 자동으로 붙는 구조입니다. 공식 문서에 이 부분이 작게 적혀 있어서 놓치기 쉽습니다. (출처: OpenAI 공식 블로그, 2026.03.17)
개인 사용자 입장에서 nano는 ChatGPT를 아무리 써도 직접 접근이 안 됩니다. 개발자 API 키가 없으면 nano의 혜택을 전혀 누리지 못하는 구조입니다. 이 부분이 좀 아쉬웠습니다.
⚔️ Gemini 3 Flash·Claude Haiku 4.5와 비교하면
경쟁 모델과 나란히 놓고 보면 GPT-5.4 mini·nano의 포지션이 더 선명하게 보입니다. Reddit 사용자 bortlip이 직접 공식 벤치마크를 엮어 작성한 비교에 DataCamp 분석을 더했습니다.
| 모델 | 입력 ($/ 1M) | Terminal-Bench 2.0 | GPQA Diamond |
|---|---|---|---|
| GPT-5.4 mini | $0.75 | 60.0% | 88.0% |
| GPT-5.4 nano | $0.20 | 46.3% | 82.8% |
| Gemini 3 Flash | $0.50 | 47.6% | — (미공개) |
| Gemini 3.1 Flash Lite | $0.25 | 51.7% | — (미공개) |
| Claude Haiku 4.5 | $1.00 | — (미공개) | — (미공개) |
출처: OpenAI 공식 블로그 (2026.03.17), Reddit r/OpenAI (2026.03.17), DataCamp 분석 (2026.03.17) / Gemini 3 Flash는 preview 상태
GPT-5.4 nano($0.20)와 Gemini 3 Flash($0.50)를 Terminal-Bench 2.0으로만 비교하면 nano가 46.3%로 살짝 낮은 대신 가격이 절반도 안 됩니다. 코딩 성능이 조금 낮아도 괜찮은 대량 분류·추출 작업이라면 nano가 비용 면에서 우위입니다.
반면 Claude Haiku 4.5는 입력 $1.00으로 GPT-5.4 mini($0.75)보다 비싼데, DataCamp 분석 기준 GPQA Diamond나 τ2-bench에서 nano보다도 낮은 수치가 확인됩니다. GPT-5.4 nano가 Haiku 4.5를 가격과 범용 추론 두 영역에서 동시에 앞서는 상황입니다. (출처: DataCamp, GPT-5.4 mini and nano: Benchmarks, Access, and Reactions, 2026.03.17)
⚠️ 장문 컨텍스트 함정 — nano가 생각보다 불리한 상황
GPT-5.4 mini와 nano 모두 400K 토큰 컨텍스트 윈도우를 지원합니다. 숫자만 보면 플래그십과 같습니다. 그런데 OpenAI MRCR v2 장문 테스트를 보면 이야기가 달라집니다.
실측 수치 (MRCR v2 8-needle, 128K~256K 구간)
- GPT-5.4: 79.3%
- GPT-5.4 mini: 33.6% (플래그십 대비 -45.7%p)
- GPT-5.4 nano: 33.1%
- GPT-5 mini: 19.4%
출처: OpenAI 공식 블로그 Introducing GPT-5.4 mini and nano (2026.03.17)
코딩(SWE-Bench)에서 mini가 플래그십과 3.3%p밖에 차이 안 났는데, 장문 컨텍스트에서는 45.7%p가 벌어집니다. 400K 창을 지원한다는 것과 400K 분량의 문서에서 정확히 찾아낸다는 것은 완전히 다른 이야기입니다.
💡 기존에 알려진 “컨텍스트 창 크기 = 장문 처리 능력”이라는 공식이, 실제 수치와 나란히 놓이면 전혀 다르게 보입니다. 레거시 코드베이스 전체를 집어넣고 분석하는 용도로 mini를 쓰려던 계획이라면, 이 수치를 먼저 확인하는 게 맞습니다.
결론부터 말하면, mini와 nano는 “짧고 빠른 작업”에 최적화됐습니다. 긴 문서 요약, 대규모 코드베이스 분석, 복잡한 멀티턴 대화 유지에는 플래그십 GPT-5.4를 써야 하는 상황이 여전히 많습니다. 비용 절감 목적으로 무조건 소형 모델로 교체하려다가 정확도가 뚝 떨어지는 상황이 생길 수 있습니다.
❓ Q&A 5선
✍️ 마치며
GPT-5.4 mini·nano는 분명 성능이 좋아졌습니다. 코딩 벤치마크에서 플래그십에 근접하고, 도구 호출 정확도도 전 세대 대비 눈에 띄게 올랐습니다. 다만 “소형 모델 = 저렴”이라는 등식은 이번에도 성립하지 않았습니다. 전 세대보다 3~4배 비싼 채로 나왔고, 장문 컨텍스트에서의 성능 격차는 컨텍스트 창 크기에서 읽히지 않습니다.
개인적으로 GPT-5.4 mini는 빠른 코딩 서브에이전트 용도로 인상적이었습니다. 반면 nano는 분류·데이터 추출처럼 정말 단순하고 대량인 작업 외에는 굳이 선택할 이유가 쉽게 보이지 않습니다. 경쟁사 모델과의 비용-성능 비교를 꼼꼼히 한 번 더 해볼 필요가 있습니다.
DataCamp가 지적한 것처럼, 지금 시대에 단일 모델 최적화보다는 모델을 쉽게 교체할 수 있는 아키텍처를 짜는 것이 더 오래가는 선택입니다. 오늘의 미니가 내일의 기본값이 되고, 오늘의 플래그십이 내년의 무료 티어가 되는 속도로 시장이 움직이고 있습니다.
📎 본 포스팅 참고 자료
※ 본 포스팅은 2026년 3월 27일 기준으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 모든 API 요금과 벤치마크 수치는 공식 출처 기반이나, OpenAI의 업데이트로 달라질 수 있으므로 이용 전 공식 페이지에서 직접 확인하시기 바랍니다.











댓글 남기기