GPT-5.4 nano, $0.20인데 mini보다 잘하는 구간이 있습니다

Published on

in

GPT-5.4 nano, alt=

2026.03.17 기준
gpt-5.4-nano-2026-03-17
API Only

GPT-5.4 nano, $0.20인데
mini보다 잘하는 구간이 있습니다

2026년 3월 17일 OpenAI가 GPT-5.4 mini와 nano를 동시 출시했습니다. 근데 솔직히 말하면, nano에 대한 관심이 너무 낮아요. 막상 공식 수치를 들여다보면 GPT-5 mini를 능가하는 구간이 분명히 있는데, ChatGPT에서 쓸 수 없다는 사실 때문인지 한국어 글이 거의 없습니다.

$0.20
입력 1M 토큰당
52.4%
SWE-Bench Pro
400K
컨텍스트 창
API Only
ChatGPT 미지원

GPT-5.4 nano가 뭔가요 — 일단 핵심부터

모델 문자열은 gpt-5.4-nano 또는 특정 버전을 고정하려면 gpt-5.4-nano-2026-03-17로 호출합니다. (출처: OpenAI API 공식 문서, 2026.03.17) 컨텍스트 창은 400K 토큰, 최대 출력은 128K 토큰이고 지식 컷오프는 2025년 8월 31일입니다.

OpenAI가 nano를 권장하는 용도는 분류(Classification), 데이터 추출(Data extraction), 순위 매기기(Ranking), 서브에이전트(Subagent) 등 대량으로 반복되는 단순 작업입니다. 복잡한 추론이 필요한 메인 태스크에는 GPT-5.4를, 보조 처리에는 nano를 붙이는 멀티모델 구조를 공식이 직접 제안하고 있어요.

💡 공식 발표문과 API 문서를 나란히 놓고 보면 이런 차이가 보였습니다 — mini는 사용자 대상 서비스(ChatGPT)의 기본 모델로 설계됐고, nano는 처음부터 개발자용 인프라 부품으로 설계된 겁니다. 결과적으로 nano는 일반 사용자에게 노출 자체가 되지 않는 모델입니다.

▲ 목차로 돌아가기

$0.20인데 GPT-5 mini를 이기는 수치, 직접 확인했습니다

가격만 보면 GPT-5 nano(구세대, $0.05/1M)가 더 싸고, GPT-5.4 nano($0.20/1M)가 4배 비쌉니다. 근데 성능을 같이 보면 이야기가 달라져요. GPT-5.4 nano는 코딩 벤치마크 SWE-Bench Pro에서 52.4%를 기록했는데, 이전 세대인 GPT-5 mini의 45.7%보다 6.7%포인트 높습니다. (출처: OpenAI 공식 발표 벤치마크, 2026.03.17) 더 작고 더 싼 모델이 이전 세대의 중간 모델을 성능에서 넘어선 겁니다.

벤치마크 GPT-5.4 GPT-5.4 mini GPT-5.4 nano GPT-5 mini
SWE-Bench Pro 57.7% 54.4% 52.4% 45.7%
Terminal-Bench 2.0 75.1% 60.0% 46.3% 38.2%
GPQA Diamond 93.0% 88.0% 82.8% 81.6%
OSWorld-Verified 75.0% 72.1% 39.0% 42.0%
MCP Atlas 67.2% 57.7% 56.1% 47.6%

출처: OpenAI 공식 발표 벤치마크 (2026.03.17). 모든 수치는 reasoning_effort xhigh 기준. OSWorld-Verified 빨간 수치는 GPT-5 mini보다 낮은 유일한 영역.

SWE-Bench Pro 기준으로만 보면 nano(52.4%)는 GPT-5 mini(45.7%)보다 6.7%p 앞서고, GPQA Diamond에서도 82.8% vs 81.6%로 근소하게 앞섭니다. 코딩과 일반 추론에서는 이전 세대 mini를 가볍게 넘어서는 수준입니다.

▲ 목차로 돌아가기

nano vs mini — 가격 차이가 3.75배인데 성능 차이는 얼마나 날까요

반면 Terminal-Bench 2.0(복잡한 터미널 에이전트 작업)에서는 mini 60.0%, nano 46.3%로 격차가 13.7%p나 됩니다. 복잡한 에이전트 워크플로우에서는 mini가 명확히 앞섭니다. 결론은 단순 분류·추출 작업이라면 nano가 가성비 승, 멀티스텝 에이전트 작업이면 mini가 낫다는 겁니다.

💡 가격 대비 성능 계산 — 직접 따라해보실 수 있습니다

분류 작업처럼 평균 1,000 토큰짜리 요청을 1만 건 처리한다고 가정하면 총 10M 토큰입니다.
— nano 비용: $0.20 × 10 = $2.00
— mini 비용: $0.75 × 10 = $7.50
동일 작업에 $5.50 차이. SWE-Bench Pro 기준 코딩 정확도가 2%p 높아지는 것의 가치가 $5.50 이상인지 판단하면 됩니다.

▲ 목차로 돌아가기

nano를 쓰면 안 되는 상황이 있습니다

공식 API 문서를 보면 nano에는 Computer Use 기능이 명시적으로 “Not supported”입니다. (출처: OpenAI API 공식 문서, 2026.03.17) mini는 Computer Use를 지원하고, 실제로 OSWorld-Verified에서 72.1%를 기록했습니다. nano의 동일 벤치마크 점수는 39.0%로, 심지어 구세대 GPT-5 mini(42.0%)보다도 낮습니다. Computer Use 자동화 워크플로우에 nano를 붙이면 성능이 오히려 뒤로 가는 상황이 생깁니다.

Tool Search 기능도 nano에는 없습니다. mini에는 지원되는 기능인데, nano는 공식 문서상 “Not supported”로 표기돼 있어요. 수천 개의 툴 정의가 필요한 대형 MCP 워크플로우에서 nano를 쓰면 토큰을 훨씬 많이 소모하게 됩니다.

⚠️ nano가 적합하지 않은 대표적인 시나리오

  • 스크린샷 기반 Computer Use — OSWorld-Verified 39%로 GPT-5 mini(42%)에도 밀림
  • 수천 개 툴 정의가 필요한 MCP 서버 연동 — Tool Search 미지원으로 토큰 낭비
  • ChatGPT·Codex 앱에서 사용자가 직접 선택하는 시나리오 — API 전용이라 불가
  • 긴 컨텍스트 정밀 추론 — 128K~256K 구간에서 mini(33.6%)와 큰 차이 없음(33.1%)이지만, 64K~128K에서는 mini(47.7%)가 nano(44.2%)를 앞섬 (출처: OpenAI 발표 Long Context 벤치마크)

주관적인 의견을 하나 더 붙이자면, 벤치마크 수치보다 더 신경 써야 할 건 오류율입니다. nano는 mini보다 오류율이 높고, 이것이 실제로 시스템 전체 재시도 비용으로 돌아옵니다. API 비용만 보고 nano를 선택했다가 재시도 로직 때문에 오히려 mini보다 비싸지는 경우가 생길 수 있어요. 단순 분류처럼 재시도 코스트가 작은 작업에만 nano를 쓰는 게 안전합니다.

▲ 목차로 돌아가기

Codex에서 nano가 특히 유리한 계산이 있습니다

공식 발표문에서 흥미로운 내용을 하나 찾았습니다. Codex에서 GPT-5.4 mini는 GPT-5.4 quota의 30%만 사용한다고 명시돼 있습니다. (출처: OpenAI 공식 블로그 “Introducing GPT-5.4 mini and nano”, 2026.03.17) nano는 API 전용이라 Codex 앱에서 직접 선택할 수는 없지만, Codex 서브에이전트로 붙이면 GPT-5.4를 메인으로 쓰면서 간단한 작업은 nano 서브에이전트에 위임하는 구조가 공식으로 지원됩니다.

💡 GPT-5.4 발표문과 nano 스펙을 교차해서 보니 이런 구조가 보입니다

MCP Atlas 벤치마크(36개 MCP 서버 동시 사용 시나리오)에서 nano는 56.1%로, GPT-5.4 mini(57.7%)와 불과 1.6%p 차이입니다. 멀티 에이전트 구조에서 MCP 서버를 다수 붙이는 용도라면 nano가 충분히 경쟁력 있는 선택이에요.

▲ 목차로 돌아가기

Claude Haiku 4.5와 가격·성능 직접 비교

성능 비교는 조심스럽습니다. 두 모델의 벤치마크 버전이 다르기 때문입니다. Haiku 4.5는 SWE-bench Verified(더 쉬운 버전)에서 73.3%를 기록했고, nano는 SWE-bench Pro(더 어려운 버전)에서 52.4%를 기록했습니다. 같은 Verified 버전이었다면 nano가 더 높을 가능성이 있습니다만, OpenAI가 공개한 Verified 버전 점수가 없어 직접 비교는 어렵습니다.

반면 동일 벤치마크로 비교 가능한 항목에서는 nano가 앞섭니다. GPQA Diamond에서 nano 82.8% vs Haiku 4.5 73.0%로 9.8%p 차이, τ2-bench Telecom에서 nano 92.5% vs Haiku 4.5 83.0%로 9.5%p 차이입니다. (출처: DataCamp 벤치마크 비교, 2026.03.17) OSWorld에서는 Haiku 4.5 50.7%(표준) vs nano 39.0%(Verified 버전)인데, OSWorld-Verified가 더 어려운 테스트라 직접 비교는 주의가 필요합니다.

항목 GPT-5.4 nano Claude Haiku 4.5
입력 가격 (1M 토큰) $0.20 $1.00
출력 가격 (1M 토큰) $1.25 $5.00
GPQA Diamond 82.8% 약 73.0%
Computer Use 지원 미지원 지원
컨텍스트 창 400K 200K

출처: OpenAI API 공식 문서, DataCamp GPT-5.4 mini/nano 분석 (2026.03.17). Haiku 4.5 가격은 Anthropic 공식 가격 기준. 벤치마크 버전이 다를 수 있어 직접 비교 시 주의 필요.

개인적인 판단을 말하면, Computer Use가 필요한 자동화 워크플로우라면 Haiku 4.5가 더 나은 선택입니다. 반면 대량 텍스트 분류·추출처럼 단순 처리량이 중심인 파이프라인이라면 GPT-5.4 nano가 가격 측면에서 압도적입니다.

▲ 목차로 돌아가기

자주 나오는 질문 5가지

Q. GPT-5.4 nano를 ChatGPT 앱에서 쓸 수 있나요?
아니요. nano는 API 전용입니다. ChatGPT 앱(웹·모바일)이나 Codex 앱 UI에서는 선택할 수 없습니다. (출처: OpenAI 공식 발표문, 2026.03.17) mini는 ChatGPT Free·Go 플랜의 Thinking 기본 모델로 쓸 수 있지만, nano는 개발자가 직접 API를 호출하는 방식으로만 접근됩니다.
Q. GPT-5.4 nano로 컴퓨터 자동화 에이전트를 만들 수 있나요?
Computer Use 기능 자체가 공식적으로 미지원입니다. 또한 OSWorld-Verified 벤치마크에서 39.0%를 기록했는데, 이는 구세대인 GPT-5 mini(42.0%)보다도 낮습니다. 스크린샷 기반 컴퓨터 조작 작업에는 nano 대신 mini(72.1%) 또는 GPT-5.4(75.0%)를 사용하는 게 맞습니다.
Q. nano의 컨텍스트 창이 400K 토큰인데 긴 문서 처리에 쓸 만한가요?
벤치마크를 보면, 64K~128K 구간에서 nano(44.2%)가 mini(47.7%)보다 낮습니다. 128K~256K에서는 거의 비슷합니다(nano 33.1%, mini 33.6%). 400K 창이 있더라도 긴 컨텍스트 정밀 추론에서는 mini가 더 안정적입니다. 단순 텍스트 처리라면 나쁘지 않지만, 긴 문서 내에서 복잡한 추론이 필요한 작업에는 mini 이상을 권장합니다.
Q. API Free 티어에서 nano를 쓸 수 있나요?
없습니다. API 공식 문서에서 Free 티어는 “Not supported”로 표기되어 있습니다. (출처: OpenAI API 공식 문서, 2026.03.17) Tier 1부터 사용 가능하며, Tier 1 기준 분당 500 RPM, 분당 200K TPM 한도가 적용됩니다.
Q. GPT-5 nano(구세대)를 계속 쓰는 게 나을까요, 아니면 GPT-5.4 nano로 바꿔야 할까요?
가격은 GPT-5 nano($0.05/1M)가 4배 저렴하지만, 성능 차이가 상당합니다. SWE-Bench Pro에서 GPT-5.4 nano는 52.4%, GPT-5 nano는 공개 수치가 없으나 이전 세대 수준입니다. 단순 분류처럼 정확도 요건이 낮은 대규모 파이프라인에서는 GPT-5 nano를 유지하는 게 비용 효율적일 수 있습니다. 다만 코딩 보조나 추론이 필요한 서브에이전트라면 5.4 nano로 업그레이드할 이유가 있습니다.

▲ 목차로 돌아가기

마치며 — $0.20짜리의 자리는 명확합니다

쓸 만한 자리는 생각보다 뚜렷합니다. 분류·추출·순위 매기기 같은 반복 작업의 서브에이전트, 코드 파일 리뷰나 단순 검색을 위임받는 보조 역할, MCP 서버 다수 연결 시 조용히 돌아가는 처리 레이어. 이런 곳에서 $0.20/1M이라는 가격은 실질적입니다.

반면 Computer Use를 붙이거나 ChatGPT에서 직접 쓰거나 복잡한 에이전트 판단이 필요하면 nano는 답이 아닙니다. 그 선택지는 mini 또는 GPT-5.4 본체입니다. nano의 자리를 정확히 알고 써야 가성비가 나옵니다. 잘못된 자리에 쓰면 비용 절감은커녕 재시도 비용이 쌓입니다.

▲ 목차로 돌아가기

📎 본 포스팅 참고 자료

  1. OpenAI 공식 블로그 — “Introducing GPT-5.4 mini and nano” (openai.com, 2026.03.17)
  2. OpenAI API 공식 문서 — GPT-5.4 nano 모델 스펙 (developers.openai.com, 2026.03.17)
  3. OpenAI API 공식 문서 — GPT-5.4 mini 모델 스펙 (developers.openai.com, 2026.03.17)
  4. DataCamp — “GPT-5.4 mini and nano: Benchmarks, Access, and Reactions” (datacamp.com, 2026.03.17)
  5. OpenAI 공식 블로그 — “Introducing GPT-5.4” (openai.com, 2026.03.05)


본 포스팅은 2026년 3월 26일 기준으로 작성됐습니다. OpenAI 서비스 정책·모델 스펙·가격·기능은 업데이트로 변경될 수 있으며, 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 최신 정보는 OpenAI 공식 문서(developers.openai.com)에서 확인하세요.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기