GPT-5.4 nano, ChatGPT에서 안 되는 이유 있습니다

Published on

in

GPT-5.4 nano, ChatGPT에서 안 되는 이유 있습니다

2026.03.17 기준 / GPT-5.4 nano 공식 출시일 기준
OpenAI 공식 릴리스 기준

GPT-5.4 nano, ChatGPT에서 안 되는 이유 있습니다

OpenAI가 3월 17일 GPT-5.4 nano를 출시하면서 “가장 저렴한 GPT-5.4 계열 모델”이라고 소개했습니다. 그런데 막상 ChatGPT 앱을 열어도 nano는 보이지 않습니다. 설정을 잘못 건드린 게 아닙니다. 공식 발표문에 이유가 나와 있습니다.

$0.20
입력 100만 토큰
39.0%
OSWorld-Verified 점수
400K
컨텍스트 윈도우
API 전용
ChatGPT 미지원

ChatGPT에서 보이지 않는 이유 — 설계가 다릅니다

GPT-5.4 nano는 ChatGPT 앱이나 웹에서 쓸 수 없습니다. OpenAI 공식 발표문에 “GPT-5.4 nano는 API를 통해서만 제공된다(GPT‑5.4 nano is available in the API)”고 명시되어 있습니다. 모델 선택기에도 표시되지 않습니다.

이건 배포 지연이 아닙니다. 처음부터 API 전용으로 설계된 모델이기 때문입니다. 공식 발표에 따르면 nano는 “낮은 지연 시간과 단순 작업에 최적화(optimized for low-latency, simple tasks)”된 모델로, 사람이 직접 대화창에서 쓰는 것보다 자동화된 파이프라인에서 API 호출로 쓰는 방식을 전제로 만들어졌습니다.

💡 공식 발표문과 ChatGPT 릴리스 노트를 같이 놓고 보면 이런 차이가 보입니다. GPT-5.4 mini는 “ChatGPT의 Free·Go 사용자가 Thinking 메뉴에서 쓸 수 있다”고 안내한 반면, nano는 ChatGPT 어디에서도 언급이 없습니다. 처음부터 사람을 위한 모델이 아닌 겁니다.

GPT-5.4 계열은 사실 하나의 모델이 아니라 역할 분담 구조입니다. 플래그십 GPT-5.4가 전체 작업을 기획하고, mini와 nano가 하위 작업을 실행하는 ‘서브에이전트’ 구조입니다. nano는 그 중 가장 단순하고 반복적인 작업, 즉 텍스트 분류, 데이터 추출, 간단한 코드 실행 단계를 맡는 실행자로 설계됐습니다. ChatGPT 대화창에 없는 게 오히려 정상입니다.

▲ 목차로 돌아가기

공식 벤치마크로 보는 nano의 실제 위치

OpenAI 공식 발표 기준으로 GPT-5.4 nano의 벤치마크 수치를 정리하면 다음과 같습니다. (출처: OpenAI 공식 블로그 ‘Introducing GPT-5.4 mini and nano’, 2026.03.17)

벤치마크 GPT-5.4 GPT-5.4 mini GPT-5.4 nano GPT-5 mini
SWE-Bench Pro (코딩) 57.7% 54.4% 52.4% 45.7%
Terminal-Bench 2.0 75.1% 60.0% 46.3% 38.2%
OSWorld-Verified (화면 제어) 75.0% 72.1% 39.0% 42.0%
GPQA Diamond (추론) 93.0% 88.0% 82.8% 81.6%
τ2-bench (도구 호출) 98.9% 93.4% 92.5% 74.1%

수치를 보면 특이한 패턴이 있습니다. GPQA Diamond(추론·과학 지식)에서는 nano가 82.8%로 mini(88.0%)와 6포인트 차이인데, OSWorld-Verified(화면 제어)에서는 nano 39.0%, mini 72.1%로 격차가 33포인트로 벌어집니다. 텍스트 기반 추론은 mini와 비슷한 수준이지만, 화면을 보고 클릭하는 작업에서는 반 토막 수준으로 떨어집니다. nano에게 화면 제어 에이전트를 맡기면 안 된다는 뜻입니다.

▲ 목차로 돌아가기

GPT-5.4 mini와 비교하면 어디서 갈리는가

nano와 mini는 같은 GPT-5.4 계열이지만 쓰임새가 다르게 설계됐습니다. mini는 텍스트, 이미지, 도구 호출을 모두 처리하는 ‘복합 서브에이전트’이고, nano는 텍스트와 단순 도구 호출만 처리하는 ‘경량 실행자’입니다.

항목 GPT-5.4 mini GPT-5.4 nano
ChatGPT 사용 ✅ Free·Go 메뉴 ❌ API 전용
이미지 입력 ✅ 지원 ❌ 텍스트만
컨텍스트 윈도우 400K 토큰 400K 토큰
API 입력 비용 $0.75 / 100만 토큰 $0.20 / 100만 토큰
API 출력 비용 $4.50 / 100만 토큰 $1.25 / 100만 토큰
Codex에서 쿼터 플래그십의 30% 별도 구분 없음
화면 제어(OSWorld) 72.1% 39.0%
생성 속도 (실측) 180~190 t/s 약 200 t/s

※ API 속도는 Hacker News 실사용 측정값(2026.03.17 출시 당일). 공식 수치가 아닌 실측 참고값.

nano가 mini보다 생성 속도가 약간 빠르고 비용은 약 73% 저렴합니다. 이미지를 전혀 다루지 않아도 되는 텍스트 분류, 데이터 추출 작업이라면 nano를 쓰는 게 합리적입니다. 반대로 스크린샷 분석이나 UI 파싱이 들어가는 작업이라면 nano로 전환했다가 정확도가 크게 떨어질 수 있습니다.

▲ 목차로 돌아가기

400K 컨텍스트인데 긴 문서에 약한 이유

GPT-5.4 nano는 컨텍스트 윈도우가 400K 토큰입니다. 약 30만 단어, 대략 300~400쪽 분량의 문서를 한 번에 넣을 수 있는 크기입니다. 그런데 긴 문서 처리에 nano를 쓰는 건 주의가 필요합니다.

OpenAI 공식 발표에 따르면 nano의 장거리 문서 추론 성능을 보여주는 MRCR v2(8-바늘, 64K~128K) 점수는 44.2%입니다. 같은 범위에서 mini는 47.7%, 플래그십 GPT-5.4는 86.0%입니다. 컨텍스트 창 크기와 실제 긴 문서 이해력은 별개의 문제입니다. 400K를 넣을 수는 있지만, 긴 문서 안에서 핵심을 정확히 찾아내는 능력은 플래그십의 절반에 그칩니다.

💡 “400K 컨텍스트 = 긴 문서도 잘 처리”라고 생각하기 쉽지만, 실제로는 다릅니다. GPT-5.4 nano를 긴 계약서 검토나 대규모 코드베이스 분석에 쓰면 비용은 아낄 수 있지만, 중요한 부분을 놓칠 확률이 높아집니다.

nano가 잘하는 건 짧고 반복적인 작업입니다. 10만 건의 고객 리뷰를 긍정·부정으로 분류하거나, 수천 건의 영수증에서 날짜와 금액을 뽑아내는 작업입니다. 문서 하나하나는 짧지만 전체 처리량이 많은 경우에 nano의 가격 우위가 빛납니다.

▲ 목차로 돌아가기

API 요금 계산 — 같은 작업에 mini vs nano 차이

공식 요금 기준으로 직접 계산해보면 차이가 명확해집니다. (출처: OpenAI 공식 블로그, 2026.03.17)

시나리오 A — 대량 텍스트 분류 (월 10억 토큰 입력 기준)

GPT-5.4 mini 사용 시

입력: 10억 × $0.75 / 100만 = $750

출력(약 10%): 1억 × $4.50 / 100만 = $450

GPT-5.4 nano 사용 시

입력: 10억 × $0.20 / 100만 = $200

출력(약 10%): 1억 × $1.25 / 100만 = $125

월 절감액: (750+450) − (200+125) = $875 절감

같은 텍스트 분류 작업을 nano로 전환하면 비용이 약 73% 줄어듭니다. 단, 이 계산은 정확도 감소에 따른 오분류 처리 비용이 없다는 전제입니다. 작업 특성에 따라 nano의 오류율이 높아지면 재처리 비용이 생겨서 실제 절감액이 달라질 수 있습니다. 고정밀도가 필요한 작업이라면 반드시 A/B 테스트로 오류율을 먼저 확인해야 합니다.

참고로 GPT-5.4 mini의 비용은 이전 세대 GPT-5 mini 대비 약 3배 올랐습니다. Hacker News 실사용자 데이터 기준으로 GPT-5 mini는 입력 100만 토큰당 약 $0.25였는데, GPT-5.4 mini는 $0.75로 인상됐습니다. nano가 처음 등장했을 때 “구세대 mini보다 저렴하다”고 느껴지는 이유가 여기 있습니다. nano($0.20)는 구세대 mini($0.25)보다도 저렴합니다.

▲ 목차로 돌아가기

nano를 제대로 쓸 수 있는 조건과 못 쓰는 조건

GPT-5.4 nano는 쓸 수 있는 상황과 없는 상황이 꽤 선명하게 나뉩니다. 공식 벤치마크와 설계 목적을 기준으로 정리하면 이렇습니다.

✅ nano가 적합한 작업

  • 텍스트 분류·감성 분석 — 대량의 짧은 텍스트를 카테고리에 넣는 작업. τ2-bench 92.5%로 도구 호출 정확도가 충분합니다.
  • 정형 데이터 추출 — 이메일, 영수증, 로그에서 날짜·금액·이름을 뽑아내는 작업. GPQA Diamond 82.8%로 단순 추론은 문제 없습니다.
  • 간단한 코드 서브태스크 — SWE-Bench Pro 52.4%는 구세대 GPT-5 mini(45.7%)보다 높습니다. 버그 패치가 아닌 단순 코드 생성·변환 단계에 쓸 수 있습니다.
  • 고빈도·저단가 API 파이프라인 — 1초에 수백~수천 건 처리하는 자동화 시스템. 200 t/s 속도가 실사용에서도 확인됩니다.

❌ nano를 쓰면 안 되는 작업

  • 화면 제어·UI 파싱 — OSWorld 39.0%는 구세대 GPT-5 mini(42.0%)보다도 낮습니다. 스크린샷을 보고 버튼을 찾아 클릭하는 작업은 nano로 안 됩니다.
  • 긴 문서 심층 분석 — MRCR v2(64K~128K) 44.2%입니다. 계약서 전체 검토, 대규모 코드베이스 이해에는 적합하지 않습니다.
  • 멀티모달 입력이 포함된 작업 — nano는 텍스트와 단순 도구만 처리합니다. 이미지·PDF 분석은 처음부터 지원하지 않습니다.
  • ChatGPT 앱에서 직접 사용 — API 전용 모델입니다. 일반 사용자가 ChatGPT 웹·앱에서 쓸 수 없습니다.

솔직히 말하면, 이런 구분 자체가 nano를 쓰기 어렵게 만드는 요인이기도 합니다. 파이프라인에 nano를 넣을 때는 각 단계가 텍스트 전용인지, 이미지가 끼어드는 단계인지를 미리 확인하지 않으면 중간에 에러가 납니다. 아직 대부분의 한국 개발 환경은 GPT 시리즈를 ChatGPT 구독으로 접근하는 경우가 많아서, API 키 없이 nano를 시험해볼 방법도 없습니다.

▲ 목차로 돌아가기

Q&A

Q1. GPT-5.4 nano를 ChatGPT 무료 플랜에서 쓸 수 있나요?

쓸 수 없습니다. OpenAI 공식 발표에 따르면 GPT-5.4 nano는 API 전용 모델로, ChatGPT 앱이나 웹에서는 제공되지 않습니다. ChatGPT Free·Go 사용자에게 제공되는 경량 모델은 GPT-5.4 mini이고, 이는 ‘+ 메뉴 → Thinking’ 경로로 접근할 수 있습니다. nano를 테스트하려면 OpenAI API 키가 필요합니다.

Q2. nano가 mini보다 저렴하면 무조건 nano를 쓰는 게 낫지 않나요?

작업 종류에 따라 다릅니다. 화면 제어, PDF 분석, 이미지가 포함된 작업에서 nano를 쓰면 오류가 나거나 아예 처리가 안 됩니다. 텍스트 분류와 데이터 추출만 하는 파이프라인이라면 nano가 mini 대비 비용을 약 73% 줄일 수 있습니다. 단, 오류율이 높아지면 재처리 비용이 추가로 발생하므로 도입 전 A/B 테스트를 권장합니다.

Q3. GPT-5.4 nano의 OSWorld 점수가 구세대 GPT-5 mini보다도 낮은데, 어떻게 된 건가요?

공식 벤치마크 수치가 맞습니다. OSWorld-Verified에서 nano 39.0%, GPT-5 mini 42.0%입니다. nano는 화면 제어를 위해 설계된 모델이 아니라 텍스트 기반 작업에 최적화된 모델이기 때문에, 멀티모달 능력이 필요한 화면 제어 벤치마크에서 구세대 범용 모델보다 낮게 나옵니다. OpenAI가 nano를 화면 제어 용도로 쓰지 말라고 명시적으로 안내하는 이유도 여기 있습니다.

Q4. nano와 mini의 컨텍스트 윈도우가 둘 다 400K인데, 긴 문서에서 nano를 쓰면 안 되나요?

넣는 것은 가능하지만 성능은 보장할 수 없습니다. MRCR v2(64K~128K) 기준 nano는 44.2%, mini는 47.7%입니다. 플래그십 GPT-5.4(86.0%)와 비교하면 절반 수준입니다. 300~400쪽짜리 계약서나 대규모 코드베이스를 nano에게 넘기면 긴 문서 중간에 있는 중요 조항을 놓칠 확률이 높습니다.

Q5. Codex에서 nano를 서브에이전트로 쓸 수 있나요?

현재 Codex에서 공식적으로 지원되는 경량 서브에이전트 모델은 GPT-5.4 mini입니다. mini는 Codex에서 플래그십 GPT-5.4 쿼터의 30%만 소비하도록 설계됐습니다. nano를 Codex의 서브에이전트로 쓰는 공식 지원은 2026년 4월 기준 별도로 발표되지 않았습니다. API로는 nano를 직접 호출할 수 있지만, Codex 내 자동 라우팅에 nano가 포함되는지는 OpenAI가 공식 답변을 내놓지 않은 부분입니다.

▲ 목차로 돌아가기

마치며

GPT-5.4 nano는 “싸고 빠른 AI”가 맞습니다. 그런데 이 설명 앞에 전제가 하나 더 붙습니다. “API를 쓸 수 있는 개발자가, 텍스트 전용 작업을, 대량으로 처리할 때”라는 조건입니다.

GPT-5.4 mini보다 73% 저렴하고, 구세대 GPT-5 mini보다 입력 비용이 낮습니다. 초당 약 200 토큰으로 Gemini 3 Flash(130 t/s)보다 빠릅니다. 그런데 화면을 보는 일에서는 구세대 mini보다도 못하고, ChatGPT에서 쓸 수 없습니다. 이 조합이 nano의 정확한 위치입니다.

개인 사용자에게는 지금 당장 달라지는 게 없는 모델입니다. 자동화 파이프라인을 구축하는 개발자라면, 각 단계를 텍스트 전용과 멀티모달로 나눠서 nano 투입 가능 여부를 먼저 확인하는 것이 비용을 줄이는 현실적인 방법입니다.

▲ 목차로 돌아가기

📌 본 포스팅 참고 자료

  1. OpenAI 공식 블로그 — Introducing GPT-5.4 mini and nano
    https://openai.com/ko-KR/index/introducing-gpt-5-4-mini-and-nano/
  2. OpenAI 공식 모델 릴리스 노트 — ChatGPT의 GPT-5.3 및 GPT-5.4
    https://help.openai.com/ko-kr/articles/11909943-gpt-53-and-gpt-54-in-chatgpt
  3. OpenAI 공식 모델 릴리스 노트 — 전체 업데이트 이력
    https://help.openai.com/ko-kr/articles/9624314-model-release-notes
  4. Codingscape — LLMs with largest context windows (2026년 3월 업데이트)
    https://codingscape.com/blog/llms-with-largest-context-windows
  5. Hacker News — GPT-5.4 mini and nano 실측 속도·비용 토론 (2026.03.17)
    https://news.ycombinator.com/item?id=47415441

⚠️ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 벤치마크 수치 및 API 요금은 OpenAI 공식 발표 기준이며, OpenAI의 정책 변경에 따라 달라질 수 있습니다. 본 포스팅에 포함된 실측 속도 수치는 Hacker News 커뮤니티의 실사용 측정값으로, 공식 OpenAI 데이터가 아닙니다. 최신 요금 및 지원 범위는 OpenAI 공식 문서에서 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기