gpt-5.4-nano-2026-03-17
TECH
GPT-5.4 nano, API만 된다고요?
OpenAI가 3월 17일 공개한 GPT-5.4 nano는 “가장 저렴한 GPT-5.4급 모델”이라는 타이틀을 달고 나왔습니다. 입력 100만 토큰당 $0.20, 출력 $1.25. 숫자만 보면 흥분할 만합니다. 그런데 공식 문서를 열어보면 고개가 갸웃해지는 대목이 두 군데 있습니다. ChatGPT 앱에서 아예 쓸 수 없고, Computer Use 성능은 전 세대 mini보다 오히려 낮습니다. 이 글에서 그 이유를 벤치마크 숫자와 함께 풀어봅니다.
GPT-5.4 nano가 뭔지, 딱 한 문장으로
OpenAI 공식 발표문에 따르면 nano는 “분류, 데이터 추출, 랭킹, 그리고 더 단순한 지원 작업을 처리하는 코딩 서브에이전트”에 권장됩니다. (출처: OpenAI 공식 블로그, 2026.03.17) 즉, 무거운 추론보다 속도와 비용이 우선인 파이프라인에서 제 값을 합니다.
여기서 잠깐 — nano가 GPT-5 mini를 대체하는 위치라고 생각하기 쉽습니다. 그런데 실제로 공식 문서를 보면 nano는 GPT-5 nano의 후속이지, mini의 하위 호환이 아닙니다. mini와 nano는 서로 다른 계단에 있습니다.
ChatGPT 앱에서 쓸 수 없는 이유 — 공식 문서에 딱 이렇게 나옵니다
💡 공식 발표문과 개발자 문서를 같이 놓고 보니 이런 차이가 보였습니다
nano가 ChatGPT 앱에 없는 건 단순한 정책 선택입니다. nano는 고용량 API 배치 처리에 최적화된 모델이라 사람이 직접 채팅하는 UX에 맞지 않습니다. Free 요금제 무료 사용자에게 nano를 열어줄 이유도 OpenAI 입장에서는 없고요.
개발자 문서(developers.openai.com)를 보면 Free 티어에서는 아예 “Not supported”로 표기됩니다. Tier 1부터 RPM 500, TPM 200,000으로 시작하고, Tier 5에서 RPM 30,000, TPM 1억 8,000만까지 올라갑니다. 일반 ChatGPT 사용자라면 nano를 쓸 수 있는 방법이 없습니다.
결론부터 말씀드리면, nano는 ChatGPT 앱을 쓰는 사람이 아니라 API 키로 서비스를 만드는 개발자를 위한 모델입니다.
벤치마크 수치를 직접 읽는 법 — Y축 속임수까지
OpenAI가 공개한 벤치마크 비교표를 보면 네 모델의 성능 차이가 꽤 커 보입니다. 그런데 DataCamp의 분석에서 지적한 대로, OpenAI의 그래프는 Y축이 35%에서 시작합니다. (출처: DataCamp 블로그, 2026.03.17) 0부터 시작하면 훨씬 작아 보일 차이가 시각적으로 과장된 셈입니다.
| 벤치마크 | GPT-5.4 | 5.4 mini | 5.4 nano | GPT-5 mini |
|---|---|---|---|---|
| SWE-Bench Pro | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
출처: OpenAI 공식 발표문, 2026.03.17 / xhigh reasoning effort 기준
표에서 가장 눈에 띄는 점은 OSWorld-Verified 항목입니다. nano가 39.0%로 GPT-5 mini의 42.0%에 못 미칩니다. 나머지 항목에서는 nano가 GPT-5 mini를 모두 앞서는데, Computer Use에서만 역전됩니다. 이 비교에는 주의할 점이 하나 있습니다. GPT-5 mini는 최고 reasoning_effort가 ‘high’이고, nano는 ‘xhigh’로 돌린 결과입니다. 즉 nano가 최고 사양으로 돌아도 Computer Use에서 이전 세대에 뒤집힌다는 뜻입니다.
또한 OpenAI 본인도 “레이턴시 추정치는 실제 프로덕션 측정이 아니라 시뮬레이션 기반”이라고 밝혔습니다. (출처: OpenAI 공식 발표문, 2026.03.17) 수치 신뢰도를 판단할 때 이 점은 염두에 둬야 합니다.
Computer Use는 전 세대보다 낮습니다 — 그래도 살 이유가 있나요
솔직히 말하면 이 부분이 제일 신경 쓰였습니다. nano의 OSWorld-Verified 39.0%는 GPT-5 mini 42.0%보다 낮습니다. OpenAI가 이유를 별도로 밝히지 않았습니다. 다만 공식 문서에는 nano에 Computer Use가 아예 지원 안 되는 기능으로 표기돼 있습니다. (출처: OpenAI 개발자 문서, 2026.03.17)
💡 공식 문서의 지원 기능 목록과 벤치마크 수치를 교차해서 보면
nano는 Computer Use를 “Responses API 지원 도구”에서 Not supported로 분류합니다. 벤치마크에 39%라는 수치가 있는 건 테스트는 했지만 실제 API 호출로는 막혀 있다는 뜻입니다. 즉, 벤치마크 숫자를 보고 nano로 화면 조작 자동화를 구현하려 했다면 바로 막힙니다.
그럼에도 nano를 선택할 이유는 있습니다. OpenAI가 권장하는 패턴은 “오케스트레이터-서브에이전트 분리”입니다. GPT-5.4(혹은 mini)가 전체 계획을 짜고 판단하면, nano가 코드베이스 검색, 대용량 파일 검토, 데이터 분류 같은 단순 반복 작업을 병렬로 처리하는 방식입니다. 이 경우 Computer Use 능력이 필요 없습니다.
nano가 빛나는 영역은 SWE-Bench Pro 52.4%입니다. 전 세대인 GPT-5 mini가 45.7%였으니 6.7%p 개선입니다. 단순 숫자보다 의미가 중요합니다 — 코딩 서브에이전트로 nano를 쓰면 이전보다 훨씬 복잡한 코드 문제를 낮은 비용으로 처리할 수 있습니다.
76,000장 사진 설명에 $52 — 이 숫자가 진짜 의미하는 것
Simon Willison이 자신의 블로그에서 직접 실험한 결과입니다. 사진 한 장을 설명하는 데 입력 2,751 토큰, 출력 112 토큰이 소비됐고, 비용은 0.069센트(약 1원)였습니다. (출처: simonwillison.net, 2026.03.17)
🔢 직접 계산해 볼 수 있는 공식
사진 1장: 2,751 입력 토큰 × ($0.20 / 1,000,000) + 112 출력 토큰 × ($1.25 / 1,000,000)
= $0.000550 + $0.000140 = $0.000690 (약 1원)
76,000장 전체: $0.000690 × 76,000 = $52.44
사진 7만 6천 장 설명에 5만 원대. 기존 GPT-4o 기준으로 같은 작업을 하면 어떨까요? GPT-4o의 입력 가격은 $2.50/1M 토큰(GPT-5.4 nano의 12.5배)입니다. 동일 작업 비용이 약 $655로 껑충 뜁니다. nano의 비용 효율이 특정 대용량 파이프라인에서 얼마나 강력한지 체감할 수 있는 수치입니다.
물론 사진 설명처럼 단순한 작업에서는 이 차이가 극명하게 나옵니다. 복잡한 다단계 추론이 필요한 작업이라면 nano 대신 mini나 5.4 본 모델을 써야 합니다. 어떤 작업에 nano를 쓸지 선택 기준이 중요합니다.
reasoning_effort 설정 안 하면 GPT-5.4 nano는 바보가 됩니다
이 부분은 기존 블로그 글에서 잘 다루지 않는 내용입니다. OpenAI 개발자 문서에는 이렇게 나옵니다: GPT-5.4 계열은 reasoning_effort 파라미터의 기본값이 none입니다. (출처: OpenAI 개발자 문서, 2026.03.17)
⚠️ API 호출 시 주의
reasoning_effort를 명시하지 않으면 nano는 추론을 거의 하지 않는 상태로 동작합니다. 공식 벤치마크의 높은 수치는 전부 xhigh 기준입니다. 실제 API 호출 시 반드시 파라미터를 명시해야 합니다.
Hacker News 스레드에서도 “reasoning_effort를 명시하지 않으면 기본값이 None이라 지능이 매우 낮아진다”는 경험이 여러 개발자에게 공유됐습니다. (출처: Hacker News, GPT-5.4 mini and nano 스레드, 2026.03.17) 사용 전 확인해야 할 부분입니다.
또한 같은 스레드에서 확인된 실측 속도는 GPT-5.4 nano 약 200 토큰/초, GPT-5.4 mini 180~190 토큰/초입니다. 비교 대상인 Gemini 3 Flash가 약 130 토큰/초인 점을 감안하면 nano의 처리 속도는 상당히 빠릅니다. 단, 이 수치는 출시 직후 부하가 낮은 시점의 측정값으로, 실제 프로덕션 환경에서는 달라질 수 있습니다.
경쟁 모델 가격 비교 — nano가 정말 가장 쌀까요
| 모델 | 입력 (1M) | 캐시 입력 | 출력 (1M) |
|---|---|---|---|
| GPT-5.4 nano | $0.20 | $0.02 | $1.25 |
| GPT-5.4 mini | $0.75 | $0.075 | $4.50 |
| Gemini 3.1 Flash-Lite | $0.25 | – | $1.50 |
| Claude Haiku 4.5 | $1.00 | – | $5.00 |
| Claude Sonnet 4.6 | $3.00 | – | $15.00 |
| GPT-5.4 | $2.50 | $0.25 | $15.00 |
출처: simonwillison.net, OpenAI 개발자 문서, 2026.03.17 기준
여기서 놓치기 쉬운 포인트가 하나 있습니다. GPT-5.4 mini의 입력 단가 $0.75는 GPT-5 mini($0.15, 2025년 기준)보다 5배 높습니다. (출처: Hacker News 스레드, 2026.03.17) mini를 계속 써온 개발자라면 5.4 mini로 업그레이드할 때 비용이 크게 올라간다는 의미입니다. mini=저렴하다는 인식과 현실이 어긋납니다.
nano의 $0.20 가격은 매력적이지만, nano를 못 쓰는 상황(Computer Use 자동화, ChatGPT UI 등)에서는 mini를 선택해야 하고, 그때 비용은 5배 뛰어오릅니다. 모델 선택 전에 실제 워크로드에서 어떤 기능이 필요한지 먼저 확인하는 것이 순서입니다.
자주 나오는 질문 5가지
마치며 — 누구에게 실질적으로 유용한 모델인가
반면 일반 이용자나 ChatGPT 기반 서비스 기획자에게 nano는 사실상 존재하지 않는 옵션입니다. 그 자리에서 nano 이야기가 나오면 “API 전용입니다”라고 딱 잘라 말하는 게 맞습니다. nano가 아니라 mini가 맞는 선택인지를 먼저 확인하는 것이 현실적인 시작점입니다.
개인적으로 이번 nano 출시에서 흥미로웠던 건 성능보다 구조의 변화입니다. 한 모델이 모든 걸 처리하던 방식에서, 큰 모델은 생각하고 작은 모델은 빠르게 실행하는 분업 구조로 넘어가는 흐름이 뚜렷해졌습니다. nano는 그 흐름의 끝자락에 위치한 부품입니다. 부품을 잘 쓰려면 전체 구조를 먼저 이해해야 합니다.
본 포스팅 참고 자료
-
OpenAI 공식 발표문 — Introducing GPT-5.4 mini and nano
https://openai.com/ko-KR/index/introducing-gpt-5-4-mini-and-nano/ -
OpenAI 개발자 문서 — GPT-5.4 nano 모델 스펙
https://developers.openai.com/api/docs/models/gpt-5.4-nano -
Simon Willison — GPT-5.4 nano and mini 실측 분석
https://simonwillison.net/2026/Mar/17/mini-and-nano/ -
DataCamp — GPT-5.4 mini and nano 벤치마크·가격 분석
https://www.datacamp.com/blog/gpt-5-4-mini-nano -
Hacker News — GPT-5.4 mini and nano 커뮤니티 실측 토론
https://news.ycombinator.com/item?id=47415441
본 포스팅은 2026년 3월 29일 기준으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능·가격이 변경될 수 있습니다. 모든 수치·기능 정보는 반드시 OpenAI 공식 문서에서 최신 버전을 확인하시기 바랍니다.











댓글 남기기