API 전용 모델
OpenAI 공식 발표 기반
GPT-5.4 nano, 싸다고요?
이 수치가 다릅니다
2026년 3월 18일, OpenAI가 GPT-5.4 nano를 조용히 공개했습니다. 대부분의 반응은 “작고 빠른 모델이니 당연히 저렴하겠지”였습니다. 그런데 직전 세대인 GPT-5 nano와 가격을 나란히 놓으면, 예상과 전혀 다른 숫자가 나옵니다.
GPT-5.4 nano, 정확히 어떤 모델인가
2026년 3월 18일(한국 기준 오전 3시), OpenAI가 GPT-5.4 mini와 함께 GPT-5.4 nano를 공식 출시했습니다. nano는 GPT-5.4 패밀리에서 가장 작은 모델로, OpenAI 공식 블로그는 이 모델을 “속도와 비용이 가장 중요한 작업을 위한 GPT-5.4의 최소 버전”으로 정의했습니다. (출처: OpenAI 공식 블로그, 2026.03.17)
접근 경로가 명확하게 제한되어 있습니다. GPT-5.4 mini는 ChatGPT 무료·Go 사용자도 ‘+’ 메뉴의 ‘잘 생각하기’ 기능으로 쓸 수 있지만, GPT-5.4 nano는 API에서만 사용 가능합니다. ChatGPT 웹·앱·모바일 어디서도 직접 선택할 수 없습니다. 일반 이용자가 ChatGPT를 켜서 nano를 쓰려고 해도 방법이 없다는 뜻입니다.
컨텍스트 윈도우는 mini와 nano 모두 400,000 토큰으로 동일합니다. 본 모델인 GPT-5.4의 1,050,000 토큰에 비해 절반도 안 되는 수치입니다. (출처: OpenAI 공식 블로그, 2026.03.17) 긴 문서 전체를 한 번에 넣어야 하는 작업에서는 이미 이 시점에 제약이 생깁니다.
💡 공식 발표문과 실제 접근 구조를 같이 놓고 보니 이런 차이가 보였습니다 — nano는 “저렴한 ChatGPT 옵션”이 아니라 처음부터 개발자 API 전용으로 설계된 모델입니다. ChatGPT 사용자에게는 사실상 존재하지 않는 모델입니다.
가격 인상이 예상보다 훨씬 가파릅니다
이름이 ‘nano’인 데다 mini보다도 작은 모델이니, 당연히 GPT-5 nano보다 저렴할 거라고 생각하기 쉽습니다. 실제 숫자를 보면 방향이 반대입니다.
OpenAI 공식 발표에 따르면, GPT-5.4 nano의 API 가격은 입력 $0.20/백만 토큰, 출력 $1.25/백만 토큰입니다. GPT-5 nano의 입력 가격은 $0.05/백만 토큰이었습니다. 계산하면 입력 기준으로 정확히 4배 인상입니다. 출력은 이전 $0.40에서 $1.25로 올라 약 3.1배 뛰었습니다. (출처: 나무위키 GPT-5 문서, 2026.03.28 기준)
| 모델 | 입력 (1M 토큰) | 출력 (1M 토큰) | 컨텍스트 |
|---|---|---|---|
| GPT-5 nano (구) | $0.05 | $0.40 | 400K |
| GPT-5.4 nano (신) | $0.20 (+4배) | $1.25 (+3.1배) | 400K |
| GPT-5.4 mini | $0.75 | $4.50 | 400K |
| GPT-5.4 (본 모델) | $2.50 | $15.00 | 1,050K |
mini의 인상 폭은 입력 기준 3배, 출력 기준 2.25배입니다. nano의 인상 폭이 mini보다 더 큽니다. 나무위키 GPT-5 문서도 “nano는 mini보다 인상 폭이 더 크다”고 직접 기재하고 있습니다. 작을수록 더 비싸진 셈입니다. 이 추세대로라면 다음 세대에서도 소형 모델의 가격이 “저렴하다”는 전제는 점점 흔들릴 가능성이 높습니다.
💡 “소형 모델 = 저렴”이라는 공식은 이미 GPT-5.4 세대에서 무너지기 시작했습니다. 대량 처리 워크플로 비용 계획을 짤 때 GPT-5 nano 기준으로 예산을 잡아뒀다면, 그대로 업그레이드했을 때 비용이 4배까지 올라갑니다.
벤치마크 성적표 — 작은 모델의 한계가 여기서 드러납니다
OpenAI 공식 발표 자료에 담긴 벤치마크 성적표를 직접 옮겨봤습니다. 전반적으로는 GPT-5.4 > GPT-5.4 mini > GPT-5.4 nano > GPT-5 mini 순서가 일관되게 유지됩니다. 그런데 딱 한 곳에서 이 순서가 깨집니다. (출처: OpenAI 공식 블로그 “Introducing GPT-5.4 mini and nano”, 2026.03.17)
| 벤치마크 | GPT-5.4 | GPT-5.4 mini | GPT-5.4 nano | GPT-5 mini (구) |
|---|---|---|---|---|
| SWE-Bench Pro (코딩) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| OSWorld-Verified (컴퓨터 사용) | 75.0% | 72.1% | 39.0% ⚠️ | 42.0% (nano 추월) |
| GPQA Diamond (과학논리) | 93.0% | 88.0% | 82.8% | 81.6% |
| Toolathlon (도구 호출) | 54.6% | 42.9% | 35.5% | 26.9% |
| MRCR 8-needle 128K–256K (장문맥락) | 79.3% | 33.6% | 33.1% | 19.4% |
OSWorld-Verified 점수를 보면, GPT-5.4 nano(39.0%)가 구형 GPT-5 mini(42.0%)보다 낮습니다. OpenAI 공식 발표에서도 “nano는 컴퓨터 사용 작업을 위해 만들어진 모델이 아님을 분명히 한다”고 밝히고 있지만, 전세대 모델보다 낮은 점수가 나온다는 사실은 “신형이면 무조건 낫다”는 기대를 흔드는 부분입니다.
장문 맥락 처리(MRCR 128K–256K)에서는 GPT-5.4 mini(33.6%)와 nano(33.1%)의 격차가 거의 없습니다. 그런데 GPT-5.4 본 모델은 79.3%입니다. 맥락이 길어질수록 mini와 nano는 사실상 같은 수준으로 수렴하고, 플래그십 대비로는 절반에도 못 미칩니다. 장문 분석 용도라면 nano로 비용을 아끼려는 시도가 오히려 품질을 크게 낮추는 결과로 이어질 수 있습니다.
nano가 실제로 유리한 작업과 그렇지 않은 작업
OpenAI가 공식적으로 nano를 추천하는 용도는 분류(classification), 데이터 추출(data extraction), 랭킹, 그리고 단순 서브에이전트 작업입니다. (출처: OpenAI 공식 블로그, 2026.03.17) 반대로 명시적으로 nano를 쓰면 안 된다고 제시한 용도도 있습니다 — 바로 화면(스크린샷) 해석이 필요한 컴퓨터 사용 에이전트, 그리고 고난도 추론 작업입니다.
Hacker News 커뮤니티에서 측정한 실제 API 속도는 약 200 토큰/초입니다. 비교 대상인 Gemini 3 Flash는 약 130 토큰/초(Gemini API 기준)였습니다. 출력 속도만 놓고 보면 nano가 50% 이상 빠릅니다. (출처: Hacker News GPT-5.4 mini/nano 토론 스레드, 2026.03.17) 속도 민감 애플리케이션에서 이 차이는 사용자 경험에 직접 영향을 줍니다.
단, 커뮤니티 내 개발자들의 경험에 따르면 nano(및 mini) 모델은 음성 에이전트처럼 입력 처리 속도(TTFT, Time To First Token)가 중요한 환경에서는 여전히 아쉬운 경우가 있습니다. “출력은 빠른데 첫 토큰이 늦다”는 지적이 나왔고, OpenAI가 TTFT를 공식적으로 발표하지 않은 부분에 대한 불만도 있습니다. 음성 또는 실시간 대화형 앱을 개발 중이라면 출시 직후 직접 측정이 필요합니다.
nano가 맞는 케이스 vs 맞지 않는 케이스
✅ nano가 적합한 작업
- 이메일/문서 분류
- 대용량 데이터 추출·정제
- 단순 텍스트 랭킹
- 멀티에이전트에서 단순 서브 작업
- 실시간 출력 속도가 중요한 경우
❌ nano가 맞지 않는 작업
- 스크린샷/UI 해석 자동화
- 128K 이상 장문 맥락 분석
- 복잡한 도구 호출 체인
- 컴퓨터 사용 에이전트
- 고정밀 추론이 필요한 쿼리
경쟁 모델과 직접 비교해봤습니다
가격과 성능을 동시에 보지 않으면 판단이 어긋납니다. 2026년 3월 기준으로 비슷한 포지셔닝의 소형 모델들과 나란히 놓아봤습니다.
| 모델 | 입력 가격 | 출력 가격 | GPQA Diamond | 비고 |
|---|---|---|---|---|
| GPT-5.4 nano | $0.20 | $1.25 | 82.8% | API 전용 |
| Claude Haiku 4.5 | $1.00 | $5.00 | – | OSWorld 50.7% |
| Gemini 3.1 Flash Lite | $0.25 | $1.50 | – | 약 130 t/s |
| GPT-5.4 mini | $0.75 | $4.50 | 88.0% | ChatGPT 접근 가능 |
가격만 보면 GPT-5.4 nano($0.20)는 Claude Haiku 4.5($1.00)보다 80% 저렴합니다. 그런데 OSWorld 비교에서는 GPT-5.4 nano(39.0%, Verified 기준)가 Claude Haiku 4.5(50.7%, 표준 기준)보다 낮을 수 있다는 분석이 나옵니다. DataCamp 리포트는 “두 테스트가 다른 버전이라 직접 비교는 어렵지만, 12% 이상의 격차가 시사하는 바가 있다”고 짚었습니다. (출처: DataCamp “GPT-5.4 mini and nano: Benchmarks, Access, and Reactions”, 2026.03.17) 싸다는 이유만으로 선택했다가 컴퓨터 사용 자동화에 nano를 쓰면 결과물 품질이 예상보다 낮게 나올 수 있습니다.
반면 GPQA Diamond(과학·논리 추론)와 τ2-bench Telecom(도구 호출)에서는 GPT-5.4 nano가 Haiku 4.5보다 각각 9.8%, 9.5% 높은 점수를 기록했습니다. 단순 추론과 텍스트 처리 능력은 가격 대비 경쟁력이 실제로 존재합니다.
서브에이전트 구조 — 공식 발표문과 실제 사용 흐름을 같이 놓으면 이런 차이가 보였습니다
OpenAI가 GPT-5.4 nano를 출시하면서 가장 많이 강조한 개념은 서브에이전트(subagent)입니다. 큰 모델이 전체를 계획하고, 단순한 세부 작업은 nano에게 위임하는 구조입니다. Codex에서 GPT-5.4 mini를 사용하면 GPT-5.4 쿼터의 30%만 소진한다고 명시되어 있습니다. nano는 그보다도 작은 쿼터를 씁니다. (출처: OpenAI 공식 블로그, 2026.03.17)
그런데 실제 개발자 경험과 공식 발표를 교차해보면 한 가지 주의 지점이 생깁니다. Hacker News 스레드에서 복수의 개발자들이 지적한 것처럼, GPT 시리즈 모델은 `reasoning_effort` 파라미터를 명시적으로 설정하지 않으면 기본값이 ‘none’으로 적용되어 성능이 크게 떨어집니다. “nano를 서브에이전트로 쓰는데 생각보다 결과가 나쁘다”는 경험이 나온다면, reasoning_effort 설정을 먼저 확인해볼 필요가 있습니다. 공식 문서에서 별도로 이 부분을 강조하지 않은 채 “빠르고 저렴하다”는 표현만 전면에 내세우고 있습니다.
또 한 가지 — GPT-5.4 mini는 기존 GPT-5 Thinking mini를 대체하며, GPT-5 Thinking mini는 출시 30일 후인 2026년 4월 18일(한국 시각)에 종료 예정입니다. (출처: OpenAI 공식 릴리스 노트, 2026.03.18) nano와 mini를 이미 프로덕션에 연결해둔 파이프라인이 있다면, 4월 전에 마이그레이션 계획을 세워야 합니다. 모델 ID가 바뀌면 API 호출 자체가 깨질 수 있습니다.
💡 서브에이전트 구조에서 nano를 쓰기로 결정했다면, API 호출 시 reasoning_effort 파라미터를 반드시 명시적으로 지정하는 것이 좋습니다. 기본값 ‘none’은 성능 저하로 이어집니다.
자주 묻는 질문 5가지
마치며 — GPT-5.4 nano를 어떻게 볼 것인가
GPT-5.4 nano는 분명히 잘 만들어진 소형 모델입니다. 코딩 능력은 전세대 mini를 능가하고, 초당 200 토큰이라는 처리 속도는 실시간 파이프라인에서 체감 차이를 만들어냅니다. 단순 분류와 데이터 추출에서의 성능 대비 가격은 경쟁력 있는 수준입니다.
다만 “nano니까 당연히 싸겠지”라는 전제는 이번 세대에서 성립하지 않습니다. 직전 세대 대비 입력 가격이 4배 올랐고, 이 인상 폭은 mini(3배)보다도 큽니다. OSWorld 컴퓨터 사용 벤치마크에서는 전세대 mini보다 낮은 점수가 나오는 구간도 있습니다. “신형이고 nano니까 만능 저비용 솔루션”이라는 기대는 실제 수치와 일치하지 않습니다.
개인적으로는 GPT-5.4 nano의 포지셔닝이 명확하다고 봅니다. ChatGPT 사용자와는 관계 없는 모델이고, 대량 텍스트 처리가 필요한 API 파이프라인에서 플래그십 모델의 서브로 쓸 때 진가가 나오는 구조입니다. 그 틀 밖에서 쓰면 성능도, 비용도 기대를 벗어날 수 있습니다.
본 포스팅 참고 자료
- ① OpenAI 공식 블로그 — Introducing GPT-5.4 mini and nano (https://openai.com/index/introducing-gpt-5-4-mini-and-nano/)
- ② OpenAI 공식 릴리스 노트 — Model Release Notes (https://help.openai.com/en/articles/9624314-model-release-notes)
- ③ DataCamp — GPT-5.4 mini and nano: Benchmarks, Access, and Reactions (https://www.datacamp.com/blog/gpt-5-4-mini-nano)
- ④ 나무위키 GPT-5 문서 (https://namu.wiki/w/GPT-5)
- ⑤ Hacker News GPT-5.4 mini/nano 토론 (https://news.ycombinator.com/item?id=47415441)
본 포스팅은 2026년 3월 31일 기준 공개된 OpenAI 공식 발표 자료를 바탕으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능·가격이 변경될 수 있습니다. 최신 정보는 OpenAI 공식 채널에서 직접 확인하시기 바랍니다.











댓글 남기기