GPT-5.4 nano 기준
공식 문서 직접 확인
GPT-5.4 nano, 싸다고요?
이 4배 가격부터 보세요
OpenAI가 3월 17일 공개한 GPT-5.4 nano — “저렴하고 빠른 경량 모델”이라는 설명은 맞습니다. 그런데 무엇과 비교했을 때 저렴한 건지, 공식 문서 수치를 직접 들여다보니 생각과 다른 부분이 꽤 있었습니다.
GPT-5.4 nano가 정확히 뭔지부터
GPT-5.4 nano는 2026년 3월 17일 OpenAI가 공개한 GPT-5.4 계열 중 가장 작은 경량 모델입니다. GPT-5.4 mini와 같은 날 출시됐고, OpenAI 공식 발표에서는 “분류, 데이터 추출, 순위 매기기, 코딩 서브에이전트의 단순 보조 작업”에 적합하다고 명시하고 있습니다. (출처: OpenAI 공식 발표, 2026.03.17)
한 가지 먼저 짚고 넘어가야 할 것이 있습니다. GPT-5.4 nano는 ChatGPT 앱에서는 선택이 불가능합니다. OpenAI가 공식적으로 “API 전용”으로 출시했기 때문입니다. ChatGPT 화면에서 찾으면 없습니다. 개발자가 API로 직접 호출하는 방식으로만 쓸 수 있습니다.
설계 목적 자체가 다릅니다. 혼자서 복잡한 작업을 끝내는 “메인 모델”이 아니라, 큰 모델이 짜 놓은 계획을 빠르게 처리하는 “서브에이전트”용으로 만들어졌습니다. 이 차이를 모르고 접근하면 기대와 현실이 크게 어긋납니다.
공식 벤치마크, 숫자로 직접 확인
OpenAI 공식 발표 페이지에서 벤치마크 수치를 직접 가져왔습니다. (출처: openai.com/index/introducing-gpt-5-4-mini-and-nano/, 2026.03.17) xhigh 추론 강도(reasoning_effort) 기준입니다.
| 벤치마크 | GPT-5.4 | GPT-5.4 mini | GPT-5.4 nano | GPT-5 mini (구형) |
|---|---|---|---|---|
| SWE-Bench Pro (코딩) | 57.7% | 54.4% | 52.4% | 45.7% |
| OSWorld-Verified (PC 조작) | 75.0% | 72.1% | 39.0% | 42.0% |
| GPQA Diamond (과학 추론) | 93.0% | 88.0% | 82.8% | 81.6% |
| Terminal-Bench 2.0 (터미널) | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon (도구 사용) | 54.6% | 42.9% | 35.5% | 26.9% |
💡 공식 발표문 수치와 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다
OSWorld-Verified 점수가 눈에 띕니다. nano는 39.0%로, 구형 GPT-5 mini(42.0%)보다 낮습니다. “최신 모델이니 구형보다는 낫겠지”라는 생각이 이 항목만큼은 맞지 않습니다. nano가 PC 화면을 직접 보고 조작하는 Computer Use 작업에서는 경량화 과정에서 손실이 크게 났다는 뜻입니다. PC 자동화 에이전트를 만들 계획이라면, nano 대신 mini를 선택해야 합니다.
반면 GPQA Diamond(과학·논리 추론)에서는 82.8%로, 구형 GPT-5 mini(81.6%)를 넘어섭니다. 분류·추론·요약처럼 텍스트 처리에 집중된 작업에서는 여전히 세대 업그레이드 효과가 납니다.
가격이 저렴하다는 말의 함정
GPT-5.4 nano의 가격은 입력 토큰 100만 개당 $0.20, 출력 100만 개당 $1.25입니다. (출처: OpenAI API 가격 페이지, 2026.03.17) GPT-5.4($2.50/$15.00)와 비교하면 확실히 저렴합니다. 그런데 한 세대 전, 즉 GPT-5 nano와 비교하면 완전히 다른 이야기가 됩니다.
| 모델 | 입력 (100만 토큰당) | 출력 (100만 토큰당) | 전 세대 대비 |
|---|---|---|---|
| GPT-5.4 | $2.50 | $15.00 | — |
| GPT-5.4 mini | $0.75 | $4.50 | 3배 인상 |
| GPT-5.4 nano ★ | $0.20 | $1.25 | 4배 인상 |
| GPT-5 mini (구형) | $0.25 | $2.00 | — |
| GPT-5 nano (구형) | $0.05 | $0.40 | — |
GPT-5 nano 기준으로는 입력 가격이 4배 올랐습니다. 만약 기존에 GPT-5 nano로 이미지 설명, 데이터 분류, 텍스트 요약 파이프라인을 구성해 뒀다면, 동일한 작업량에 이제 4배 예산이 필요합니다. 성능이 좋아진 건 맞지만, 파이프라인의 작업 성격이 그 성능 향상을 활용할 수 있는지가 문제입니다.
예를 들어 상품 이미지 76,000장을 설명하는 데 GPT-5.4 nano로 $52가 든다는 계산이 나옵니다. (출처: letsdatascience.com, Simon Willison 계산, 2026.03.17 기준) 이 숫자가 크게 느껴지는지, 싸게 느껴지는지는 처리 규모에 따라 완전히 달라집니다. 대용량 비전 파이프라인이라면 실용적이고, 소규모 스크립트 하나라면 구형 nano로도 충분했던 작업입니다.
ChatGPT에서 못 쓰는 이유가 있습니다
GPT-5.4 mini는 ChatGPT Free·Go 플랜 사용자도 “+” 메뉴 → Thinking 기능을 통해 접근할 수 있습니다. 반면 GPT-5.4 nano는 ChatGPT 어디에도 없습니다. OpenAI 공식 발표에서 “nano는 API에서만 사용 가능”이라고 명시하고 있습니다. (출처: OpenAI 공식 발표, 2026.03.17)
왜 이렇게 됐을까요? OpenAI가 공식 답변을 내놓지 않은 부분이지만, 출력 특성을 보면 짐작은 됩니다. nano는 대화 흐름보다 고속·대량 처리에 최적화돼 있습니다. 사람과 자연스럽게 주고받는 Chat 인터페이스보다는, 코드나 시스템이 수천 건의 요청을 병렬로 던지는 API 환경에 맞게 설계된 모델입니다.
💡 출시 흐름과 제약 조건을 함께 보니 이 패턴이 보였습니다
GPT-5.4 nano에는 Computer Use 기능이 없습니다. (출처: OpenAI API 문서 models/gpt-5.4-nano, 2026.03.17) ChatGPT를 대신해서 화면을 클릭하거나 마우스·키보드를 조작하는 기능이 빠져 있습니다. “nano를 AI 에이전트로 쓰겠다”고 생각한다면, PC 조작이 포함된 작업은 nano가 아예 처리하지 못합니다. 분류·요약·데이터 추출처럼 텍스트 안에서 끝나는 작업만 nano 몫입니다.
Hacker News의 개발자 토론(2026.03.17)에서 실측된 속도를 보면, GPT-5.4 nano는 초당 약 200 토큰 생성 속도를 기록했습니다. (출처: news.ycombinator.com/item?id=47415441) 구형 GPT-5 mini의 55~60 토큰/초와 비교하면 3배 이상 빠릅니다. 빠른 건 실제입니다. 다만 이 속도의 진가는 사람이 기다리는 Chat 화면이 아니라, 코드가 수천 건을 동시에 처리하는 파이프라인에서 납니다.
서브에이전트로 쓸 때 주의할 조건
OpenAI가 nano를 소개하면서 강조한 핵심 사용 시나리오는 “서브에이전트”입니다. 큰 GPT-5.4 모델이 전체 작업을 기획하고 지시하면, nano가 개별 하위 작업을 빠르게 처리하는 구조입니다. Codex에서 GPT-5.4 mini를 쓰면 GPT-5.4 할당량의 30%만 소모한다고 공식 문서에서 밝히고 있습니다. (출처: OpenAI 공식 발표, 2026.03.17)
그런데 nano의 서브에이전트 활용에는 조건이 있습니다. 공식 API 문서에서 nano에 지원되는 기능 목록을 확인하면, Computer Use(컴퓨터 조작), Skills(스킬), Hosted Shell(호스티드 쉘), Apply Patch(패치 적용) 기능이 모두 지원 안 됨으로 표기돼 있습니다. (출처: OpenAI API 문서 models/gpt-5.4-nano, 2026.03.17)
✅ nano가 처리할 수 있는 작업
- 텍스트 분류 및 감정 분석
- 데이터 추출 (이름, 날짜, 수치 등)
- 이미지 설명 및 태깅 (비전 지원)
- 간단한 코딩 서브태스크 (파일 검색, 짧은 코드 리뷰)
- 구조화된 JSON 출력 생성
❌ nano가 처리할 수 없는 작업
- 화면 클릭·마우스 조작 (Computer Use 미지원)
- 터미널 명령 실행 (Hosted Shell 미지원)
- 코드 패치 자동 적용 (Apply Patch 미지원)
- 긴 컨텍스트 추론 (Long-Context 벤치마크에서 mini 대비 크게 낮음)
Long-context 벤치마크에서도 유의할 점이 있습니다. 64K~128K 범위 OpenAI MRCR v2 기준으로 nano는 44.2%, mini는 47.7%입니다. (출처: OpenAI 공식 발표, 2026.03.17) 둘 다 낮지만, 매우 긴 문서를 다루는 작업에서는 특히 nano가 흔들리기 쉽습니다. 긴 컨텍스트가 필요한 법무 문서 분석이나 코드베이스 전체 리뷰는 nano 몫이 아닙니다.
경쟁 모델과 나란히 놓고 보면
같은 가격대의 경쟁 모델과 비교해봤습니다. Hacker News 개발자 토론에서 실측된 속도 수치와 공식 가격을 함께 활용했습니다. (출처: news.ycombinator.com/item?id=47415441, 2026.03.17)
| 모델 | 입력 가격 | 출력 가격 | 속도(t/s) |
|---|---|---|---|
| GPT-5.4 nano ★ | $0.20/M | $1.25/M | 약 200 t/s |
| GPT-5.4 mini | $0.75/M | $4.50/M | 180~190 t/s |
| Gemini 3 Flash | $0.50/M | $3.00/M | 약 130 t/s |
| Claude Haiku 4.5 | $1.00/M | $5.00/M | — |
| Gemini 3.1 Flash Lite | $0.25/M | $1.50/M | — |
가격만 보면 Gemini 3.1 Flash Lite($0.25/M)가 nano($0.20/M)보다 비쌉니다. 속도는 nano가 200 t/s로 Gemini 3 Flash(130 t/s)보다 빠릅니다. 다만 코딩 벤치마크(Terminal-Bench 2.0)에서 nano(46.3%) vs mini(60.0%) 간 격차가 생각보다 큽니다. 코딩 중심 서브에이전트로 쓰려면 nano보다 mini 쪽이 훨씬 유리합니다.
솔직히 말하면 “텍스트·이미지 분류 대용량 파이프라인”이라는 딱 한 가지 목적에서는 GPT-5.4 nano가 속도·가격·품질 균형이 가장 좋습니다. 그 이외의 시나리오에서는 mini나 경쟁 모델이 더 나은 선택지가 될 수 있습니다.
자주 묻는 것들
마치며
GPT-5.4 nano는 “저렴한 최신 모델”이라는 한 줄 요약이 딱 절반만 맞는 모델입니다. GPT-5.4 대비로는 저렴하지만, 전 세대 GPT-5 nano와 비교하면 4배 비싸졌습니다. OSWorld 점수는 구형 mini보다도 낮고, Computer Use와 코드 패치 같은 에이전트 핵심 기능이 빠져 있습니다.
그럼에도 nano가 빛나는 구간은 분명히 있습니다. 수십만 건의 이미지 태깅, 대규모 텍스트 분류, API 기반 데이터 추출 파이프라인에서는 200 t/s의 속도와 $0.20/M 토큰 가격이 실질적인 강점입니다. 대화형 ChatGPT 사용자가 아니라 개발자가 API로 파이프라인을 짤 때 가치가 나옵니다.
막상 수치를 직접 들여다보면, nano는 “가성비 경량 모델”보다는 “특정 조건에서만 최적인 서브에이전트”라는 표현이 더 정확합니다. 그 조건에 맞는다면 지금 출시된 소형 모델 중 속도와 가격 균형이 가장 좋습니다. 아니라면 mini나 경쟁 모델이 더 나은 선택입니다.
본 포스팅 참고 자료
- OpenAI 공식 발표 — GPT-5.4 mini and nano (openai.com/index/introducing-gpt-5-4-mini-and-nano/)
- OpenAI API 문서 — GPT-5 nano 모델 스펙 (developers.openai.com/api/docs/models/gpt-5-nano)
- ZDNET — GPT-5.4 mini and nano launch (zdnet.com/article/gpt-5-4-mini-and-nano/)
- Let’s Data Science — GPT-5.4 Mini and Nano: Pricing vs Performance (letsdatascience.com)
- Hacker News 개발자 토론 — GPT-5.4 mini and nano 실측 속도 (news.ycombinator.com/item?id=47415441)
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 본 포스팅은 2026년 3월 26일 기준 공식 발표 및 공개 문서를 바탕으로 작성됐습니다. OpenAI의 추후 업데이트에 따라 가격, 기능 지원 여부, 벤치마크 수치가 달라질 수 있으니 최신 공식 문서를 직접 확인하시기 바랍니다.











댓글 남기기