2026.03.18 기준 / GPT-5.4 mini 출시 버전
IT/AI

GPT-5.4 mini, 저렴해졌다고요?
이 수치 먼저 보세요

2026년 3월 18일, OpenAI가 GPT-5.4 mini와 nano를 공식 출시했습니다. “소형 모델은 곧 저렴하다”는 공식이 있죠. 그런데 막상 공식 가격표를 들여다보면 이야기가 달라집니다. 이전 세대 GPT-5 nano와 비교했을 때 입력 요금이 4배 올랐고, 롱컨텍스트 구간에서는 성능이 절반 이하로 주저앉습니다. 지금부터 공식 수치만 놓고 하나씩 짚어볼게요.

mini 속도

초당 180~190토큰

이전 세대 GPT-5 mini 대비 3배↑

nano 요금 인상폭

입력 4배↑

GPT-5 nano 대비 $0.05→$0.20

mini OSWorld

72.1%

인간 기준선 72.4%와 0.3%p 차

GPT-5.4 mini·nano, 뭐가 달라진 건가요?

GPT-5.4 mini와 nano는 2026년 3월 18일(KST) 공식 출시된 경량 모델입니다. 두 모델 모두 GPT-5.4 본체의 핵심 아키텍처를 이어받았고, 코딩·툴 사용·멀티모달 추론·대규모 API 호출에 최적화됐다고 OpenAI는 설명합니다. (출처: OpenAI 공식 블로그, 2026.03.17)

컨텍스트 윈도우는 두 모델 모두 400,000 토큰입니다. GPT-5.4 본체의 1,050,000 토큰과 비교하면 절반 이하죠. mini는 ChatGPT Free·Go 사용자도 ‘+’ 메뉴의 ‘잘 생각하기’로 쓸 수 있고, nano는 API 전용으로만 제공됩니다. (출처: OpenAI 모델 릴리즈 노트, 2026.03.18)

벤치마크 성능을 보면, mini는 SWE-Bench Pro(Public)에서 GPT-5.4 본체(57.7%)에 근접한 54.4%를 기록했고, GPQA Diamond에서는 88.0%로 GPT-5 mini(81.6%)를 6.4%p 앞섰습니다. 수치만 보면 한 세대 위 플래그십 수준에 도달한 게 맞습니다.

그런데 여기서 끝내면 절반만 본 겁니다. 가격과 롱컨텍스트 성능 쪽에서 말이 달라집니다.

▲ 목차로 돌아가기

“AI 요금은 계속 내려간다” — 이번엔 틀렸습니다

지난 2년간 AI API 요금은 꾸준히 떨어졌습니다. 그래서 “신형 모델 = 더 저렴하다”는 게 반쯤 상식처럼 굳어버렸는데, GPT-5.4 mini·nano 가격표는 그 흐름을 거스릅니다.

모델	입력(100만 토큰)	출력(100만 토큰)	이전 세대 대비 입력 인상률
GPT-5 mini (이전)	$0.25	$2.00	기준
GPT-5.4 mini	$0.75	$4.50	+200% (3배)
GPT-5 nano (이전)	$0.05	$0.40	기준
GPT-5.4 nano	$0.20	$1.25	+300% (4배)

(출처: 나무위키 GPT-5 항목, OpenAI 공식 가격 페이지 — 2026.03.31 기준)

💡 공식 발표문과 실제 가격표를 같이 놓고 보니 이런 차이가 보였습니다.
OpenAI는 “성능 대비 가격 효율이 개선됐다”고 표현합니다. 틀린 말은 아닙니다. 하지만 개발자가 기존 파이프라인에서 nano를 쓰고 있었다면 비용 계산을 처음부터 다시 해야 합니다. API 호출 100만 번 기준으로 입력 비용만 $50,000에서 $200,000으로 올라갑니다.

경쟁 모델과 비교해도 상황이 단순하지 않습니다. Anthropic의 Haiku 4.5는 입력 $1.00/출력 $5.00 수준이고, Google Gemini 3 Flash는 입력 $0.50/출력 $3.00입니다. GPT-5.4 mini($0.75/$4.50)는 Gemini Flash보다 비싸고, Haiku 4.5보다는 약간 저렴한 위치에 놓입니다. “가장 싼 경쟁력 있는 소형 모델”이라는 포지셔닝은 성립하기 어렵습니다.

솔직히 말하면, nano 4배 인상은 “성능 한 등급 향상”으로 설명하기엔 폭이 큽니다. OpenAI가 공식적으로 별도 이유를 밝히지 않은 부분입니다.

▲ 목차로 돌아가기

OSWorld 72.1%가 의미하는 것

GPT-5.4 mini의 가장 주목할 만한 수치는 OSWorld-Verified 72.1%입니다. 이 벤치마크는 실제 컴퓨터 화면에서 GUI를 조작하는 능력을 측정하는데, 인간 기준선이 72.4%입니다. (출처: OpenAI 공식 블로그, 2026.03.17) 0.3%p 차이는 통계적으로 의미가 없는 수준입니다.

💡 “소형 모델이 사람 수준 GUI 조작을 달성했다”는 건 1년 전 기준으로는 불가능하다고 여겼던 일입니다. 2025년 초 SOTA 모델들이 30~40% 수준에 머물던 벤치마크에서, 이제 경량 모델이 인간과 동급이 됐습니다.

흥미로운 건 GPT-5.4 본체(75.0%)와 비교해도 mini가 72.1%로 단 2.9%p 차이밖에 나지 않는다는 점입니다. 컴퓨터 사용 에이전트(CUA) 작업에서만큼은 mini가 본체 성능의 96%를 낸다는 뜻인데, 에이전트 워크플로에 mini를 쓸 이유가 생깁니다.

단, 여기서 바로 “에이전트 작업에 mini를 쓰면 된다”고 결론 내리면 섣부릅니다. 다음 섹션에서 롱컨텍스트 데이터를 보면 판단이 달라질 수 있습니다.

▲ 목차로 돌아가기

롱컨텍스트 구간에서 조용히 무너지는 이유

GPT-5.4 mini의 성능 하락이 가장 두드러지는 지점이 있습니다. OpenAI가 공개한 MRCR v2(롱컨텍스트 검색 평가) 수치를 구간별로 나열하면 패턴이 선명하게 드러납니다. (출처: OpenAI 공식 블로그, 2026.03.17)

컨텍스트 구간	GPT-5.4 (본체)	GPT-5.4 mini	GPT-5.4 nano
64K~128K	86.0%	47.7%	44.2%
128K~256K	79.3%	33.6%	33.1%

(출처: OpenAI GPT-5.4 mini·nano 공식 발표, 2026.03.17)

💡 공식 발표 수치를 구간별로 쪼개서 보면 이런 그림이 나옵니다.
64K~128K 구간에서 본체 86.0%→mini 47.7%, 약 55% 수준으로 떨어집니다. 128K~256K 구간에선 본체 79.3%→mini 33.6%, 절반 이하입니다. 긴 코드베이스 분석, 장문 리서치 요약, 대규모 프롬프트 체이닝처럼 컨텍스트가 100K를 넘는 작업에서는 mini가 사실상 다른 모델입니다.

Graphwalks(그래프 탐색 능력) 수치는 그나마 낫습니다. BFS 0K~128K 구간에서 mini가 76.3%, nano가 73.4%로 본체(93.1%)보다 낮지만 쓸 만한 수준입니다. 하지만 이 역시 128K를 넘어가는 순간 급락 패턴이 반복됩니다.

실제로 OpenAI 공식 문서에도 컨텍스트 윈도우 400K 상한이 명시돼 있습니다. “400K는 쓸 수 있지만, 롱컨텍스트 성능은 구간마다 크게 다릅니다”가 정확한 표현입니다.

▲ 목차로 돌아가기

에이전트 워크플로에서 mini가 더 느릴 수 있는 상황

속도 수치만 보면 mini는 매력적입니다. 초당 180~190 토큰은 이전 세대 GPT-5 mini(55~60 토큰)의 3배가 넘는 속도입니다. Gemini 3 Flash(약 130 토큰)와 비교해도 빠릅니다. (출처: wikidocs.net 실측, 2026.03.19) 빠를수록 좋은 게 당연할 것 같지만, 실제 에이전트 워크플로에선 다른 측면이 있습니다.

💡 벤치마크와 실무 데이터를 교차해서 보니 이런 지점이 보였습니다.
SWE-Bench 평가에서 mini(xhigh)는 54.4% 정확도를 냈지만 지연시간은 254초였습니다. 본체(xhigh)는 57.7%에 171초. 코딩 에이전트처럼 긴 추론이 한 번에 필요한 작업에선 mini가 느리고, 그렇다고 정확도가 훨씬 높지도 않습니다.

현장 개발자들이 지적한 또 다른 함정이 있습니다. 에이전트 파이프라인에서 비용 절감 목적으로 nano를 하위 서브에이전트로 쓰는 구조가 많은데, 상위 오케스트레이터가 전체 메시지 히스토리를 그대로 넘기면 nano가 3~5만 토큰의 불필요한 컨텍스트를 처리하게 됩니다. 가격 인상과 맞물리면 “저렴한 서브에이전트”라는 설계 전제가 무너집니다.

Codex에서는 GPT-5.4 mini가 기본 모델로 쓰이고, GPT-5.4 본체 대비 30% 저렴하다고 OpenAI는 밝히고 있습니다. 이 경우 장기 코딩 세션에서 비용 절감 효과가 실제로 있습니다. 하지만 이는 Codex 특화 시나리오이며, 범용 에이전트 파이프라인에 바로 적용하기는 어렵습니다.

▲ 목차로 돌아가기

ChatGPT Free 사용자에게 진짜 달라진 것

API 요금이나 에이전트 파이프라인과 무관하다면 체감이 다릅니다. GPT-5.4 mini는 ChatGPT Free 사용자도 ‘+’ 메뉴의 ‘잘 생각하기’ 옵션으로 바로 쓸 수 있습니다. (출처: OpenAI 모델 릴리즈 노트, 2026.03.18)

이전에 Free 사용자가 쓸 수 있었던 GPT-5 Thinking mini는 2026년 4월 18일(KST)부로 선택 목록에서 제거됩니다. 대신 GPT-5.4 mini로 자동 전환되는 구조입니다. 추론 성능이 실질적으로 올라간 모델을 무료로 쓸 수 있게 됐다는 건 긍정적입니다.

📌 Plus 이상 유료 사용자라면 GPT-5.4 Thinking(본체)의 한도를 다 소진했을 때 mini로 자동 폴백됩니다. 의식적으로 선택하는 게 아니라 한도 소진 시 자동 전환되는 방식이므로, 중요한 작업에서 모르는 새 mini를 쓰고 있을 수 있습니다. 모델 전환 여부는 대화창 상단 모델명에서 확인할 수 있습니다.

정리하면 이렇습니다. GPT-5.4 mini는 단기 추론 작업, 코딩 보조, 멀티모달 이해 같은 용도에서 이전 세대 대비 확실히 올라섰습니다. 단, 100K 토큰이 넘는 긴 컨텍스트 작업과 비용 민감한 대규모 API 호출에선 주의가 필요합니다.

▲ 목차로 돌아가기

자주 묻는 질문

Q. GPT-5.4 mini는 ChatGPT에서 무료로 쓸 수 있나요?

Free 및 Go 사용자는 ‘+’ 메뉴의 ‘잘 생각하기’ 탭을 통해 GPT-5.4 mini를 쓸 수 있습니다. 단, 하루 사용 횟수 제한이 있고 그 제한은 OpenAI가 공식적으로 수치를 공개하지 않은 부분입니다. Plus 이상 사용자는 GPT-5.4 Thinking 한도 소진 후 자동 폴백 모델로 제공됩니다. (출처: OpenAI 릴리즈 노트, 2026.03.18)

Q. GPT-5.4 nano는 ChatGPT 앱에서 쓸 수 없나요?

맞습니다. nano는 API에서만 제공됩니다. ChatGPT 웹·앱 인터페이스에서는 선택 자체가 불가능합니다. (출처: OpenAI 공식 블로그, 2026.03.17) 주로 대규모 API 호출, 하위 에이전트, 분류·추출 파이프라인 같은 개발자 용도를 위한 모델입니다.

Q. 기존에 GPT-5 nano로 파이프라인을 구성했다면 비용이 얼마나 늘어나나요?

입력 기준으로 $0.05 → $0.20이니 정확히 4배입니다. 월 1억 토큰 입력 기준으로 계산하면 $5,000 → $20,000, 월 $15,000 추가 비용이 발생합니다. 출력이 입력의 2~3배 비중을 차지하는 구조라면 전체 비용 인상폭은 3.1~3.5배 수준으로 좁혀집니다. (출처: OpenAI 공식 가격 페이지, 2026.03.31 기준)

Q. GPT-5.4 mini와 nano 중 어느 쪽이 롱컨텍스트에 더 유리한가요?

공식 벤치마크 기준으로는 큰 차이가 없습니다. MRCR v2 64K~128K 구간에서 mini 47.7%, nano 44.2%로 3.5%p 차이, 128K~256K 구간에서는 mini 33.6%, nano 33.1%로 거의 같습니다. (출처: OpenAI 공식 블로그, 2026.03.17) 비용을 줄이려는 목적이라면 nano, 멀티모달 작업이 포함된다면 mini가 적합합니다.

Q. GPT-5 Thinking mini는 언제까지 쓸 수 있나요?

2026년 4월 18일(KST)부터 ChatGPT 모델 선택 목록에서 제외됩니다. GPT-5.4 mini로 자동 전환되며, API에서도 지원 종료 일정은 아직 공개되지 않았습니다. (출처: 나무위키 GPT-5 항목, 2026.03.28 기준)

▲ 목차로 돌아가기

마치며

GPT-5.4 mini는 이전 세대 소형 모델이 닿지 못했던 수준의 성능에 도달한 건 분명합니다. 특히 OSWorld에서 인간 기준선을 위협하는 72.1%는 소형 모델의 세대 간 도약을 보여주는 수치입니다. 단기 추론, 코딩 보조, 멀티모달 분석 같은 단위 작업에서는 충분히 검토할 가치가 있는 선택지입니다.

다만 “소형 모델 = 저렴”이라는 전제를 그대로 들고 들어가면 곤란한 상황이 생깁니다. nano 입력 요금이 4배 올랐다는 건 기존 파이프라인을 그대로 쓸 수 없다는 뜻이고, 100K를 넘는 컨텍스트 구간에서 성능이 절반 이하로 떨어지는 패턴은 장문 작업에서 모델 선택을 다시 생각하게 만듭니다.

개인적으로 보면, GPT-5.4 mini는 “같은 이름의 후속 모델”이라기보다는 GPT-5 mini보다 한 등급 위 성능을, 이전 mini 가격보다 3배 비싸게 파는 모델로 보는 게 더 정확합니다. 이 모델이 내 워크로드에 맞는지는 컨텍스트 길이와 API 호출량 두 가지를 먼저 재고 나서 결정하는 게 순서입니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

OpenAI 공식 블로그 — GPT-5.4 mini 및 nano 출시 (https://openai.com/ko-KR/index/introducing-gpt-5-4-mini-and-nano/)
OpenAI 공식 가격 페이지 (https://openai.com/ko-KR/api/pricing/)
OpenAI 모델 릴리즈 노트 (https://help.openai.com/ko-kr/articles/9624314-model-release-notes)
OpenAI GPT-5.4 소개 공식 문서 (https://openai.com/ko-KR/index/introducing-gpt-5-4/)
WikiDocs — GPT-5.4 Mini와 Nano 실측 분석 (https://wikidocs.net/blog/@jaehong/9441/)

※ 본 포스팅 작성 이후 서비스 정책·UI·기능·가격이 변경될 수 있습니다. 모든 수치는 2026년 3월 31일 기준 공식 문서를 참고했으며, 최신 정보는 OpenAI 공식 사이트에서 확인하세요. 본 포스팅은 특정 서비스의 광고·홍보가 아닌 정보 제공 목적으로 작성됐습니다.

GPT-5.4 mini, 저렴해졌다고요?
이 수치 먼저 보세요

GPT-5.4 mini·nano, 뭐가 달라진 건가요?

“AI 요금은 계속 내려간다” — 이번엔 틀렸습니다

OSWorld 72.1%가 의미하는 것

롱컨텍스트 구간에서 조용히 무너지는 이유

에이전트 워크플로에서 mini가 더 느릴 수 있는 상황

ChatGPT Free 사용자에게 진짜 달라진 것

자주 묻는 질문

마치며

본 포스팅 참고 자료

댓글 남기기응답 취소

최신 글

카테고리

Tags

GPT-5.4 mini, 저렴해졌다고요? 이 수치 먼저 보세요

GPT-5.4 mini, 저렴해졌다고요?이 수치 먼저 보세요

GPT-5.4 mini·nano, 뭐가 달라진 건가요?

“AI 요금은 계속 내려간다” — 이번엔 틀렸습니다

OSWorld 72.1%가 의미하는 것

롱컨텍스트 구간에서 조용히 무너지는 이유

에이전트 워크플로에서 mini가 더 느릴 수 있는 상황

ChatGPT Free 사용자에게 진짜 달라진 것

자주 묻는 질문

마치며

본 포스팅 참고 자료

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기

GPT-5.4 mini, 저렴해졌다고요?
이 수치 먼저 보세요