“소형 모델은 싸다”는 상식이 GPT-5.4 mini·nano에서 그대로 적용되지 않습니다.
공식 벤치마크와 API 가격표를 나란히 놓고, 숫자로 직접 따져봤습니다.
API 입력가: $0.75/1M — GPT-5 mini 대비 3배↑
Codex 쿼터: GPT-5.4의 30%만 소모
2026년 3월 18일 오전 3시(KST), OpenAI가 GPT-5.4 mini와 GPT-5.4 nano를 동시에 공개했습니다. 출시 발표문에서 OpenAI는 “가장 좋은 모델이 항상 가장 큰 모델은 아니다”라고 못 박으면서, 두 경량 모델을 빠른 응답성과 안정적인 도구 사용 능력 중심으로 설계했다고 설명했습니다. (출처: OpenAI 공식 출시 발표, 2026.03.17)
GPT-5.4 mini는 API·Codex·ChatGPT에서 모두 쓸 수 있고, GPT-5.4 nano는 현재 API 전용입니다. 컨텍스트 윈도우는 두 모델 모두 400,000 토큰으로, GPT-5.4 본 모델(1,050,000 토큰)보다 제한적입니다. (출처: 나무위키 GPT-5 문서, 2026.03.28 기준) 이 차이가 나중에 설명할 nano의 함정과 직접 연결됩니다.
모델 ID는 gpt-5.4-mini와 gpt-5.4-nano입니다. Codex 환경에서는 GPT-5.4가 계획·판단을 맡고, mini가 세부 병렬 작업을 처리하는 서브에이전트 역할을 수행합니다.
“저렴한 소형 모델”인데 가격이 3배 오른 이유
💡 공식 가격표와 이전 세대 수치를 함께 놓고 보니, “경량 모델 = 저렴”이라는 공식이 GPT-5.4 세대부터 달라진 게 보였습니다.
그런데 이전 세대와 비교하면 이야기가 달라집니다. GPT-5 mini는 입력 $0.25/1M, 출력 $2.00/1M이었습니다. GPT-5.4 mini는 입력이 3배, 출력이 2.25배 올랐습니다. (출처: 나무위키 GPT-5 문서, 2026.03.28) 경량 모델을 쓴다고 해서 비용이 자동으로 내려간다고 보기 어렵습니다.
| 모델 | 입력 (1M 토큰) | 출력 (1M 토큰) | 이전 대비 |
|---|---|---|---|
| GPT-5 mini (전 세대) | $0.25 | $2.00 | 기준 |
| GPT-5.4 mini (신규) | $0.75 (+3배) | $4.50 (+2.25배) | 입력 3배↑ |
| GPT-5 nano (전 세대) | $0.05 | $0.40 | 기준 |
| GPT-5.4 nano (신규) | $0.20 (+4배) | $1.25 (+3.125배) | 입력 4배↑ |
※ 전 세대 GPT-5 nano 수치: 나무위키 GPT-5 문서 (2026.03.28) / GPT-5.4 mini·nano 수치: OpenAI 공식 API 가격 페이지 (2026.03.31)
OpenAI는 가격 인상 이유를 별도로 발표하지 않았습니다. 다만 성능이 대폭 오른 만큼 단순 “경량” 모델이라는 포지셔닝보다 “고효율 서브에이전트용” 모델로 보는 게 더 정확합니다.
공식 벤치마크 수치, 직접 계산해 봤습니다
OpenAI 공식 출시 문서에는 GPT-5.4 제품군 전체 벤치마크가 한 표에 담겨 있습니다. (출처: OpenAI introducing-gpt-5-4-mini-and-nano, 2026.03.17) 숫자를 직접 뽑아보면 mini와 full 사이 간격이 생각보다 좁습니다.
| 벤치마크 | GPT-5.4 | GPT-5.4 mini | GPT-5.4 nano | GPT-5 mini |
|---|---|---|---|---|
| SWE-Bench Pro (코딩) | 57.7% | 54.4% | 52.4% | 45.7% |
| OSWorld-Verified (컴퓨터 사용) | 75.0% | 72.1% | 39.0% | 42.0% |
| GPQA Diamond (지식) | 93.0% | 88.0% | 82.8% | 81.6% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| MRCR v2 128K–256K (롱컨텍스트) | 79.3% | 33.6% | 33.1% | 19.4% |
※ 출처: OpenAI 공식 GPT-5.4 mini·nano 출시 발표 (2026.03.17) / reasoning_effort 기준: xhigh (GPT-5 mini는 high)
코딩(SWE-Bench Pro)에서 mini는 full과 3.3%p 차이에 불과합니다. 가격 차이(30% 수준)를 감안하면 코딩 서브에이전트로 mini를 쓰는 게 압도적으로 유리합니다. 한 가지만 건집니다 — OSWorld 기준 nano는 39.0%로 GPT-5 mini(42.0%)보다 오히려 낮습니다. 컴퓨터 사용 작업엔 nano가 역효과입니다.
Codex 서브에이전트에서 mini가 유리한 진짜 이유
💡 OpenAI 공식 서브에이전트 문서와 API 가격표를 동시에 보니, Codex 환경에서 mini의 “쿼터 30% 구조”가 단순 비용 절감 이상의 의미를 갖는다는 게 보였습니다.
Codex 공식 서브에이전트 문서에 따르면, GPT-5.4가 오케스트레이터(계획·판단)를 맡고 mini가 병렬 하위 작업을 처리하는 구조가 기본입니다. (출처: OpenAI Codex Subagents 공식 문서, 2026.03) mini는 Codex에서 GPT-5.4 쿼터의 30%만 소비합니다. (출처: OpenAI introducing-gpt-5-4-mini-and-nano, 2026.03.17)
이게 실제로 어떤 의미인지 계산해 봤습니다. Codex Plus($20/월)에서 동일한 쿼터 예산으로 GPT-5.4를 단독으로 쓸 때와 mini를 서브에이전트로 쓸 때를 비교하면, mini 서브에이전트를 쓰면 같은 예산에서 약 3배 더 많은 작업 스텝을 돌릴 수 있습니다. 쿼터를 시간 단위로 재분배할 수 있기 때문에 대형 PR 리뷰 같은 병렬 작업에서 체감 차이가 큽니다.
공식 문서 예시에서는 보안 점검·코드 품질·버그·레이스 컨디션·테스트 안정성·유지보수성 6가지를 각각 별도 서브에이전트에게 맡기는 패턴을 권장합니다. (출처: OpenAI Codex Subagents 공식 문서) 이 때 실무용 reviewer 에이전트는 GPT-5.4, 코드베이스 탐색용 explorer와 문서 조회용 docs_researcher에는 mini를 배치하는 구성이 제안됩니다.
서브에이전트 기본 설정값 — 모르면 비용 폭발합니다
Codex의 서브에이전트 기본값은 max_threads: 6, max_depth: 1입니다. 특히 max_depth를 2 이상으로 올리면 에이전트가 에이전트를 재귀적으로 호출하면서 토큰 사용량이 기하급수적으로 늘어납니다. OpenAI 공식 문서는 명시적으로 “특별히 재귀 위임이 필요한 경우가 아니면 기본값 유지”를 권고합니다. (출처: OpenAI Codex Subagents 공식 문서) 이 설정을 건드리지 않으면 mini를 써도 비용 통제가 안 됩니다.
nano를 고르면 오히려 손해인 조건이 있습니다
첫 번째는 컴퓨터 사용(Computer Use)입니다. OSWorld-Verified 벤치마크에서 nano는 39.0%인데, GPT-5 mini(전 세대)가 42.0%입니다. nano가 오히려 구세대보다 낮습니다. (출처: OpenAI 공식 GPT-5.4 mini·nano 출시 문서, 2026.03.17) 브라우저 자동화나 화면 해석이 포함된 작업에 nano를 쓰면 실패율이 높아집니다.
두 번째는 128K~256K 구간의 롱 컨텍스트입니다. MRCR v2 8-needle 128K–256K 벤치마크에서 GPT-5.4는 79.3%인데 nano는 33.1%로 46.2%p 급락합니다. (출처: 동일) 대형 코드베이스 전체를 한 번에 입력하거나 긴 문서를 컨텍스트로 넣을 때 nano는 절반도 못 따라갑니다. 저렴하다고 선택했다가 답변 품질로 손해를 보는 구간입니다.
요약하면 nano는 “짧고 단순한 대량 처리” 전용입니다. 그 외 용도에는 mini가 낫습니다.
ChatGPT에서 mini 쓰는 법 — 무료 사용자도 됩니다
이 부분이 의외로 알려지지 않았습니다. ChatGPT에서 GPT-5.4 mini는 Free·Go 요금제 사용자에게 ‘+’ 메뉴의 ‘잘 생각하기’ 버튼으로 제공됩니다. (출처: OpenAI 공식 GPT-5.4 mini 출시 문서, 2026.03.17) 무료로 GPT-5.4 세대의 추론 모델을 쓸 수 있다는 뜻입니다.
반면 Plus 이상 요금제에서는 mini가 폴백(fallback) 모델입니다. GPT-5.4 Thinking 한도를 다 소진하면 자동으로 mini로 전환됩니다. 즉, 플러스 사용자는 고를 수 없고 한도 소진 후 자동으로 붙는 모델입니다. 무료 사용자가 오히려 더 의식적으로 mini를 선택할 수 있는 구조입니다.
기존 GPT-5 Thinking mini는 2026년 4월 18일(KST)에 지원이 종료됩니다. (출처: 나무위키 GPT-5 문서, 2026.03.28) 4월 중순 이후에는 GPT-5.4 mini가 유일한 “소형 추론 모델” 선택지가 됩니다.
Q&A
GPT-5.4 mini와 nano 중 코딩에 더 적합한 모델은?
SWE-Bench Pro에서 mini는 54.4%, nano는 52.4%로 mini가 앞섭니다. 단일 파일 단위 빠른 코딩에는 nano도 쓸 만하지만, 대형 코드베이스 탐색(롱 컨텍스트)이 필요한 작업에는 nano가 급격히 성능이 떨어집니다. Codex 서브에이전트 구조에서 코딩 역할에는 mini를 권장합니다.
GPT-5.4 nano는 ChatGPT에서 쓸 수 있나요?
아직 API 전용입니다. ChatGPT 앱이나 Codex에서는 제공되지 않습니다. 분류·데이터 추출처럼 단순하고 반복적인 대량 처리에만 API를 통해 활용하는 게 현재 의도된 사용 방식입니다.
지역별 처리(데이터 레지던시) 요금이 따로 붙나요?
네. OpenAI 공식 API 가격 페이지 기준으로 지역별 처리 엔드포인트를 쓰면 10% 추가 요금이 붙습니다. mini 기준으로 입력이 $0.75가 아닌 $0.825/1M이 됩니다. (출처: OpenAI API 가격 페이지, 2026.03.31) 한국 규정 준수가 필요한 경우 이 점을 사전에 고려해야 합니다.
Codex 서브에이전트의 max_depth를 올리면 어떻게 되나요?
에이전트가 에이전트를 재귀 호출하는 깊이가 늘어납니다. OpenAI 공식 문서는 기본값 1(직접 자식 에이전트까지만 허용)을 유지하도록 권고합니다. max_depth를 2 이상으로 올리면 광범위한 위임 지시가 반복 팬아웃으로 변해 토큰 사용량, 지연 시간, 로컬 리소스 소비가 동시에 폭발할 수 있다고 경고합니다.
GPT-5 Thinking mini는 언제 종료되나요?
2026년 4월 18일(KST)에 지원이 종료됩니다. (출처: 나무위키 GPT-5 문서, 2026.03.28) 이후에는 GPT-5.4 mini가 ChatGPT 내 유일한 소형 추론 모델로 남습니다. 현재 GPT-5 Thinking mini 기반 자동화 파이프라인이 있다면 4월 중순 전에 전환해야 합니다.
마치며
nano는 분류·추출·랭킹처럼 정말 단순한 대량 반복 작업에 한정해서 쓸 때 효과적입니다. 컴퓨터 사용이나 128K 이상의 롱 컨텍스트가 들어가는 순간 nano보다 mini가 훨씬 낫고, 심지어 컴퓨터 사용에서는 이전 세대 GPT-5 mini보다 성능이 낮습니다. 비용만 보고 nano를 골랐다가 실패율로 손해 보는 케이스가 생길 수 있습니다.
한 가지 더 챙겨야 할 건 4월 18일 GPT-5 Thinking mini 종료입니다. 이미 GPT-5 mini 기반으로 자동화 파이프라인을 짜놓은 경우라면 전환 작업이 필요합니다.
본 포스팅 참고 자료
- OpenAI — GPT-5.4 mini·nano 공식 출시 문서 (2026.03.17) openai.com/ko-KR/index/introducing-gpt-5-4-mini-and-nano/
- OpenAI — API 공식 가격 페이지 (2026.03.31 기준) openai.com/ko-KR/api/pricing/
- OpenAI — Codex 서브에이전트 공식 문서 developers.openai.com/codex/subagents/
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. OpenAI API 가격 및 모델 스펙은 공식 페이지(openai.com/ko-KR/api/pricing/)에서 최신 정보를 확인하세요.











댓글 남기기