GPT-5.4 nano, 4배 비싸졌는데 써야 하는 이유

Published on

in

GPT-5.4 nano, 4배 비싸졌는데 써야 하는 이유

2026.03.18 기준
GPT-5.4 nano 공식 출시 당일
IT/AI

GPT-5.4 nano, 4배 비싸졌는데 써야 하는 이유

2026년 3월 18일, OpenAI가 GPT-5.4 nano를 출시했습니다. 이전 세대 GPT-5 nano 대비 입력 가격이 4배 올랐습니다. 그런데도 개발자들이 눈을 번쩍 뜨는 이유가 있습니다. 공식 벤치마크 수치와 실사용 구조를 같이 놓고 보니 생각보다 복잡한 그림이 나왔습니다.

$0.20
입력 / 100만 토큰
52.4%
SWE-Bench Pro 성능
API 전용
ChatGPT 접근 불가
400K
컨텍스트 윈도우

GPT-5.4 nano가 뭔데 갑자기 화제인가요?

OpenAI는 2026년 3월 18일(KST 기준 오전 3시), GPT-5.4 mini와 GPT-5.4 nano를 동시에 공식 출시했습니다. 이 두 모델은 3월 5일에 나온 GPT-5.4 플래그십 모델의 경량 버전에 해당합니다. 특히 nano는 “가장 작고 가장 저렴한 GPT-5.4 계열 모델”로 소개됐는데, 공식 발표문에 이렇게 딱 나옵니다. “분류, 데이터 추출, 랭킹, 단순 코딩 서브에이전트 작업에 추천한다”고요. (출처: OpenAI 공식 블로그, 2026.03.18)

GPT-5 nano가 2025년 8월 GPT-5와 함께 나온 뒤, OpenAI는 약 7개월간 경량 모델 신규 출시를 하지 않았습니다. 그 사이 Google은 Gemini 3 Flash를 내놓으며 경량 시장을 적극 공략했고, 개발자 커뮤니티에서 “OpenAI 소형 모델이 뒤처지고 있다”는 말이 자주 나왔습니다. GPT-5.4 nano는 바로 그 공백을 채우러 나온 모델입니다.

GPT-5.4 nano의 컨텍스트 윈도우는 400,000 토큰으로, 플래그십 GPT-5.4의 1,050,000 토큰보다 절반 이상 작습니다. API에서만 쓸 수 있고 ChatGPT 인터페이스나 Codex에서는 접근할 수 없습니다. 이 제한이 왜 생겼는지는 섹션 3에서 따로 설명합니다.

▲ 목차로 돌아가기

가격이 4배 올랐는데 써야 하는 진짜 이유

💡 공식 발표 가격표와 이전 세대 벤치마크를 나란히 놓고 보니, “비싸졌다”는 이야기와 “쓸 만해졌다”는 이야기가 동시에 사실이었습니다.

솔직히 말하면, 가격 인상 폭이 꽤 셉니다. GPT-5 nano 입력 가격은 100만 토큰당 $0.05였는데, GPT-5.4 nano는 $0.20입니다. 정확히 4배입니다. 출력도 100만 토큰당 $0.40에서 $1.25로 올랐습니다. 3.125배죠. 나무위키 GPT-5 항목에도 “nano가 mini보다 인상 폭이 더 크다”고 별도로 언급될 정도입니다. (출처: 나무위키 GPT-5 문서, 2026.03.21 접근)

그런데 여기서 공식 벤치마크 수치를 같이 보면 이야기가 달라집니다. OpenAI 공식 발표문에 이런 비교 표가 나옵니다. (출처: openai.com/index/introducing-gpt-5-4-mini-and-nano/, 2026.03.18)

벤치마크 GPT-5.4 nano GPT-5 mini (이전 세대) GPT-5.4 mini
SWE-Bench Pro (코딩) 52.4% 45.7% 54.4%
GPQA Diamond (과학) 82.8% 81.6% 88.0%
Terminal-Bench 2.0 46.3% 38.2% 60.0%
Toolathlon (툴 사용) 35.5% 26.9% 42.9%

표를 보면 GPT-5.4 nano가 이전 세대의 더 큰 모델, 즉 GPT-5 mini를 코딩·과학·툴 사용 등 대부분의 항목에서 앞섭니다. 이전 세대 중간 등급을 이번 세대 가장 작은 모델이 이기는 구조입니다. 가격이 4배 올랐지만, 성능은 세대를 한 단계 건너뛴 셈입니다.

GPT-5.4 nano가 SWE-Bench Pro에서 52.4%를 기록했다는 뜻은, 실제 GitHub 이슈 수준의 코딩 작업 절반 이상을 자율적으로 처리할 수 있다는 얘기입니다. 분류 작업만 하는 모델치고는 과분한 수준이죠.

▲ 목차로 돌아가기

ChatGPT에서 쓸 수 없는 이유가 따로 있습니다

GPT-5.4 nano는 ChatGPT 웹, 모바일 앱, Codex 어디에도 나타나지 않습니다. OpenAI API를 통해서만 접근할 수 있습니다. 공식 발표문에도 이 부분이 명확히 나와 있습니다. “GPT-5.4 nano는 API에서만 제공되며, ChatGPT나 Codex에서는 사용할 수 없습니다.” (출처: openai.com/index/introducing-gpt-5-4-mini-and-nano/, 2026.03.18)

⚠️ nano 접근 전 확인사항

ChatGPT Plus, Pro, Free 어느 요금제로도 nano에 접근할 수 없습니다. OpenAI 계정의 API 키가 필요하고, 별도 사용료가 청구됩니다. ChatGPT 구독 요금과는 완전히 분리된 과금 구조입니다.

반면 GPT-5.4 mini는 다릅니다. ChatGPT Free·Go 사용자는 ‘+’ 메뉴 → ‘잘 생각하기'(Thinking)를 선택하면 mini를 무료로 쓸 수 있습니다. Plus 이상 구독자는 GPT-5.4 Thinking 한도를 다 썼을 때 자동으로 mini로 전환됩니다. 즉, “ChatGPT에서 쓸 수 있는 경량 모델”은 mini이고, nano는 처음부터 개발자·기업 API 전용으로 설계됐습니다.

왜 이런 구분이 생겼을까요? OpenAI가 공식 이유를 따로 밝히지 않았지만, 발표문에서 nano의 권장 용도를 보면 실마리가 보입니다. “분류, 데이터 추출, 랭킹, 단순 코딩 서브에이전트”처럼 모두 배치 처리나 파이프라인 자동화 작업입니다. 사람이 직접 화면을 보며 쓰는 용도가 아닌, 시스템 내부에서 대량으로 돌리는 작업에 최적화된 모델이라는 설계 의도가 반영된 것으로 보입니다.

▲ 목차로 돌아가기

mini와 nano, GPT-5.4 nano를 기준으로 어느 쪽을 골라야 할까요?

💡 공식 발표문과 Perplexity 부CTO Jerry Ma의 실전 코멘트를 나란히 놓으니 이런 구분이 나왔습니다. “사람이 기다릴 때 쓰는 모델 vs 시스템이 돌아갈 때 쓰는 모델.”

mini와 nano의 겉모습은 비슷해 보이지만, 설계 철학이 다릅니다. mini는 사용자가 화면 앞에서 결과를 기다리는 상황에서 최대한 빠르게 품질 높은 답을 내는 데 초점이 맞춰져 있습니다. 반면 nano는 시스템 백그라운드에서 수천 건을 동시 처리할 때 비용 대비 효율을 극대화하는 방향으로 설계됐습니다.

이 차이가 벤치마크에서도 선명하게 드러납니다. OSWorld-Verified(데스크톱 화면을 보며 작업하는 능력) 점수를 보면 mini는 72.1%로 사람(72.4%)과 거의 같은 수준이지만, nano는 39.0%로 뚝 떨어집니다. 화면을 보면서 판단을 내리는 작업은 nano에게 맞지 않는다는 뜻입니다. (출처: OpenAI 공식 발표문, 2026.03.18)

구분 GPT-5.4 mini GPT-5.4 nano
API 입력 가격 $0.75 / 1M 토큰 $0.20 / 1M 토큰
API 출력 가격 $4.50 / 1M 토큰 $1.25 / 1M 토큰
컨텍스트 윈도우 400K 토큰 400K 토큰
ChatGPT 접근 Free/Go 무료 불가 (API 전용)
OSWorld-Verified 72.1% (사람 수준) 39.0%
SWE-Bench Pro 54.4% 52.4%

코딩 서브에이전트나 대용량 분류 파이프라인을 돌린다면 nano가 합리적입니다. 하지만 에이전트가 화면을 보고 판단을 내려야 하거나, 사용자가 결과를 실시간으로 기다리는 구조라면 mini 쪽이 낫습니다. nano의 OSWorld 39.0%는 그냥 낮은 수치가 아니라, 이 모델에게 시각적 판단을 시키면 안 된다는 신호입니다.

▲ 목차로 돌아가기

실제로 돈이 얼마나 드는지 계산해봤습니다

건당 가격으로 봐서는 감이 잘 안 옵니다. 실제 운영 상황으로 환산해보겠습니다. OpenAI 공식 API 가격($0.20/M 입력, $1.25/M 출력, 2026.03.18 기준)을 기준으로 직접 계산한 수치입니다.

📊 GPT-5.4 nano 실전 비용 계산 (API 기준)

케이스 1. 이미지 설명 76,000건 처리
→ 약 $52 (출처: buildfastwithai.com, 2026.03.18)
→ 사진 한 장당 약 0.07센트. 대량 처리 파이프라인에서 현실적인 비용입니다.

케이스 2. 월 100만 건 분류 작업 (건당 평균 200 입력 토큰, 50 출력 토큰)
→ 입력: 200 × 100만 = 2억 토큰 = $40
→ 출력: 50 × 100만 = 5000만 토큰 = $62.50
→ 월 합계 약 $102.50 (약 14만원)

배치 API 적용 시
→ 50% 할인 적용 → 월 약 $51.25 (약 7만원)
→ 비실시간 파이프라인이라면 배치 API가 거의 필수입니다.

OpenAI는 batch와 flex 처리 방식에 대해 표준 API 요금의 50% 할인을 제공합니다. 실시간 응답이 필요 없는 야간 배치 작업이라면 이 할인이 그냥 지나치기엔 아까운 절약입니다. 반대로 priority processing(우선 처리)을 원한다면 표준 요금의 2배를 내야 합니다. 즉, 같은 nano 모델이라도 처리 방식 선택에 따라 비용이 4배까지 차이 납니다.

이전 세대 대비 4배 비싸졌다는 점은 사실이지만, 이 비용을 절대 수치로 보면 대규모 자동화 작업에서는 여전히 경쟁력 있는 구간입니다. 특히 배치 API를 적용하면 단순 분류·추출 작업의 단가가 현저히 낮아집니다.

▲ 목차로 돌아가기

경쟁 모델과 비교하면 어떤 그림인가요?

💡 가격표와 속도 실측값을 같이 보니 “가장 저렴한 AI”라는 표현이 어느 범위에서 맞는 말인지 보이기 시작했습니다.

Hacker News에 API 출시 당일 실측 속도가 올라왔습니다. (출처: news.ycombinator.com/item?id=47415441, 2026.03.18) GPT-5.4 nano는 약 200 tokens/sec, mini는 180~190 tokens/sec로 측정됐습니다. Gemini 3 Flash가 Gemini API에서 약 130 tokens/sec인 것과 비교하면 nano가 약 1.5배 빠른 출력 속도를 보인 것입니다. 속도 비교는 측정 환경과 조건에 따라 달라질 수 있으므로 참고 수준으로 보는 게 맞습니다.

모델 입력 (1M) 출력 (1M) API 속도(실측)
GPT-5.4 nano $0.20 $1.25 약 200 t/s
GPT-5.4 mini $0.75 $4.50 180~190 t/s
Gemini 3.1 Flash-Lite $0.25 $1.50
Gemini 3 Flash $0.50 $3.00 130 t/s
Claude Haiku 4.5 $1.00 $5.00

가격만 놓고 보면 Gemini 3.1 Flash-Lite($0.25/M)가 GPT-5.4 nano($0.20/M)보다 입력 가격이 소폭 비쌉니다. nano가 저렴합니다. 다만 성능 지표를 같이 봐야 합니다. 도입 전에 자신의 파이프라인에서 직접 A/B 테스트를 해보는 쪽을 권합니다. 벤치마크 수치와 실제 운영 환경의 성능이 항상 일치하는 것은 아닙니다.

막상 써보면 다른 경우도 있습니다. Hacker News 실사용자들은 GPT-5.4 nano가 단순 instruction을 따르는 에이전트 태스크에서 기대보다 저항이 있었다는 경험을 공유했습니다. “모델이 확신이 없을 때 soft refusal처럼 작동하는 경향이 있다”는 얘기가 나왔고, 음성 에이전트처럼 TTFT(첫 토큰 응답 시간)가 중요한 경우에는 nano도 아직 이상적이지 않다는 지적도 있었습니다. (출처: news.ycombinator.com, 2026.03.18)

▲ 목차로 돌아가기

Q&A

Q. GPT-5.4 nano를 ChatGPT에서 쓸 수 없나요?
+
맞습니다. GPT-5.4 nano는 API 전용 모델입니다. ChatGPT 웹·앱·Codex에서는 접근할 수 없고, OpenAI API 키를 통해서만 호출할 수 있습니다. ChatGPT에서 경량 모델을 쓰고 싶다면 GPT-5.4 mini(Free/Go 무료)를 이용해야 합니다.
Q. GPT-5.4 nano가 Gemini Flash보다 저렴한가요?
+
2026년 3월 21일 공식 API 기준으로, GPT-5.4 nano 입력은 $0.20/M, Gemini 3.1 Flash-Lite 입력은 $0.25/M입니다. 입력 가격 기준으로는 nano가 약간 더 저렴합니다. 다만 어떤 모델이 실제로 유리한지는 파이프라인 특성과 출력 토큰 비중에 따라 달라지므로 직접 테스트해보는 것이 가장 정확합니다.
Q. 가격이 이전 세대보다 4배 올랐는데 바꿀 이유가 있나요?
+
Q. 배치 API를 쓰면 얼마나 절약되나요?
+
OpenAI 공식 기준으로 배치(Batch)와 플렉스(Flex) 처리는 표준 API 요금의 50% 할인이 적용됩니다. 야간 처리나 비실시간 파이프라인이라면 배치 API를 쓰지 않을 이유가 없습니다. 반대로 우선순위 처리(priority processing)를 원하면 표준의 2배를 내야 합니다.
Q. GPT-5.4 nano의 컨텍스트 윈도우는 얼마나 되나요?
+

▲ 목차로 돌아가기

마치며

GPT-5.4 nano를 한마디로 정리하면 이렇습니다. “사람이 보는 화면이 아닌, 시스템 내부에서 대량으로 돌리는 작업의 수준을 세대 단위로 끌어올린 모델.” ChatGPT로 접근할 수 없다는 점이 아쉽지만, 이건 단점이 아니라 이 모델의 설계 의도가 그대로 드러난 부분입니다. nano는 처음부터 API 파이프라인용으로 만들어졌습니다.

가격 인상(4배)은 분명히 체감되겠지만, 성능이 이전 세대 mini 수준을 이미 넘어섰다는 공식 수치를 감안하면 “비싸졌다”는 말이 전부는 아닙니다. 지금 GPT-5 nano나 mini를 쓰는 파이프라인이 있다면, 단순히 가격 비교가 아니라 에러율·재처리율까지 포함한 실제 TCO(총소유비용)를 다시 계산해볼 시점이 됐습니다.

한 가지 더. nano는 ChatGPT가 없으니 직접 테스트해보기 불편하게 느껴질 수 있습니다. OpenAI Playground에서 API 키 하나만 있으면 바로 호출해볼 수 있으니, 결정하기 전에 직접 써보는 쪽을 권합니다. 벤치마크 수치보다 자기 업무에서 돌려본 경험이 더 정확합니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. Introducing GPT-5.4 mini and nano — OpenAI 공식 블로그 (2026.03.18)
  2. Introducing GPT-5.4 — OpenAI 공식 블로그 (2026.03.05)
  3. GPT-5 — 나무위키 (2026.03.21 접근)
  4. GPT-5.4 Mini and Nano — Hacker News (2026.03.18)
  5. GPT-5.4 Mini and Nano: Full Breakdown — Build Fast with AI (2026.03.18)

본 포스팅은 2026년 3월 21일 기준으로 작성됐습니다. OpenAI의 서비스 정책·가격·UI·기능은 업데이트로 변경될 수 있습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있으니, 최신 정보는 반드시 OpenAI 공식 사이트에서 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기