GPT-5.4 mini 가격, 3가지 수치로 직접 따져봤습니다

Published on

in

GPT-5.4 mini 가격, 3가지 수치로 직접 따져봤습니다

2026.03.17 기준
GPT-5.4 mini / nano 기준
OpenAI 공식 pricing 기준

GPT-5.4 mini 가격, 3가지 수치로 직접 따져봤습니다

“경량 모델이니까 저렴하겠지”라는 기대, 막상 숫자를 놓고 보면 달라집니다. 출시 당일 가격이 조용히 바뀐 사실부터, Codex에서 실제 비용이 계산되는 방식까지 공식 수치를 그대로 가져왔습니다.

3배
mini 입력 단가 인상 (GPT-5 mini 대비)
4배
nano 입력 단가 인상 (GPT-5 nano 대비)
400K
mini/nano 컨텍스트 한도 (본모델은 1.05M)

출시 당일, 가격이 조용히 바뀌었습니다

GPT-5.4 mini가 공개된 2026년 3월 17일(KST 기준 3월 18일 오전 3시), 출시 직후 Reddit r/codex 커뮤니티에서 짧은 소동이 벌어졌습니다. 일부 사용자들이 OpenAI 공식 홈페이지에서 GPT-5.4 mini의 입력 단가가 100만 토큰당 $0.25로 표시됐다고 캡처한 직후, 몇 시간 만에 가격이 $0.75로 변경됐다는 보고가 이어진 겁니다.

해당 스레드 원본 글에는 “분명히 0.25로 나와 있었는데 지금은 0.75다, 이게 막판에 가격을 올린 거냐”는 반응이 달렸고, 뒤이어 누군가가 “지금은 두 곳 다 0.75로 일치한다, 분명히 마지막 순간에 바꿨다”고 정리했습니다. (출처: Reddit r/codex, 2026.03.17) OpenAI는 이 가격 변경에 대해 공식 답변을 내놓지 않았습니다.

결론만 말씀드리면, 현재 OpenAI 공식 pricing 페이지에 확정된 가격은 입력 $0.75, 출력 $4.50입니다. 이게 처음부터 이 가격이었는지, 아니면 출시 직전에 바뀐 건지는 공식 기록이 없습니다. 어찌 됐든 최종 가격은 전 세대 GPT-5 mini($0.25 입력)의 정확히 3배입니다.

▲ 목차로 돌아가기

공식 가격표 — mini, nano, 그리고 전 세대 비교

OpenAI 공식 API pricing 페이지(2026.03.28 확인)에 게재된 수치를 그대로 가져왔습니다. 아래 표는 GPT-5.4 계열 3종과 전 세대 GPT-5 mini를 나란히 놓은 것입니다.

모델 입력 (1M 토큰) 캐시 입력 출력 (1M 토큰) 컨텍스트 윈도우
GPT-5.4 $2.50 $0.25 $15.00 1.05M
GPT-5.4 mini ★ $0.75 $0.075 $4.50 400K
GPT-5.4 nano $0.20 $0.02 $1.25 400K
GPT-5 mini (이전 세대) $0.25 $2.00 400K

출처: OpenAI 공식 API Pricing 페이지 (openai.com/api/pricing, 2026.03.28 확인), GPT-5.4 mini/nano 소개 공식 블로그 (2026.03.17)

GPT-5 mini 대비 GPT-5.4 mini의 입력 단가는 3배, 출력 단가는 2.25배 올랐습니다. 성능이 올랐으니 가격도 오르는 건 자연스럽지만, “경량 모델”이라는 수식어를 달고 나온 제품이 전 세대보다 3배 비싸다는 건 API 비용 관리를 하는 개발자 입장에서 체감이 다릅니다.

💡 공식 발표문과 실제 pricing 페이지 수치를 같이 놓고 보니 이런 차이가 보였습니다 — nano는 mini 대비 단순히 “저렴한 버전”이 아닙니다. 입력 기준으로는 mini의 약 26.7% 수준이지만, 출력 기준으로는 약 27.8% 수준입니다. 코딩 자동화처럼 출력이 많은 작업에선 nano의 이점이 더 두드러집니다.

▲ 목차로 돌아가기

Codex에서 쓸 때 실제 단가가 다르게 계산됩니다

이 부분은 공식 발표문을 꼼꼼히 읽지 않으면 그냥 지나치기 쉽습니다. OpenAI의 GPT-5.4 mini 공식 소개 페이지에는 이런 문장이 있습니다.

“Codex에서 GPT-5.4 mini는 GPT-5.4 할당량의 30%를 사용합니다. 서브에이전트 작업을 Codex에서 3:1로 더 많이 실행할 수 있습니다.”
(출처: OpenAI 공식 GPT-5.4 mini 소개 블로그, 2026.03.17)

Codex에서 GPT-5.4를 한 번 쓸 때의 비용을 1 unit이라고 가정하면, GPT-5.4 mini는 0.3 unit만 씁니다. 즉 같은 예산으로 GPT-5.4보다 3.3배 많은 작업을 돌릴 수 있습니다.

여기서 실제 단가 역산을 해볼 수 있습니다. 공식 API 기준 GPT-5.4 입력 단가는 $2.50/1M 토큰이고, mini는 $0.75/1M 토큰이므로 비율로 보면 30%가 됩니다. API 단가 비율(30%)과 Codex 할당량 소비 비율(30%)이 일치합니다. Codex에서의 “30% 할당량 규칙”은 API 토큰 단가 차이를 그대로 반영한 것입니다. 할당량 논리가 착시 효과 없이 실제 비용 비율에 맞춰져 있다는 뜻입니다.

💡 Codex CLI 또는 IDE 플러그인에서 mini를 쓰면 할당량을 아낄 수 있다는 건 사실이지만, 아낀 할당량이 곧 아낀 비용인 건 아닙니다. mini는 GPT-5.4 full 모델보다 절대 가격도 낮으면서 할당량도 덜 씁니다. 다만 nano를 서브에이전트 반복 루프에 쓰면 단가가 더 내려가는 대신, OSWorld-Verified 39% 수준의 컴퓨터 사용 능력을 감수해야 합니다.

▲ 목차로 돌아가기

컨텍스트 400K, 장문 작업엔 오히려 더 비쌀 수 있습니다

GPT-5.4 mini와 nano의 컨텍스트 윈도우는 400,000 토큰입니다. GPT-5.4 본 모델(1,050,000 토큰)의 약 38% 수준입니다. (출처: OpenAI 공식 GPT-5.4 mini/nano 소개, 2026.03.17)

이 차이가 비용에 영향을 미치는 시나리오가 있습니다. 예를 들어, 600K 토큰 분량의 문서를 요약하는 작업이 필요하다고 가정해봅니다. GPT-5.4 full 모델이라면 600K 토큰을 한 번에 넣을 수 있지만, mini는 400K 한도로 인해 최소 2회 분할 호출이 필요합니다. 분할 호출은 컨텍스트 오버헤드를 만들어냅니다. 각 호출마다 이전 문맥을 다시 삽입해야 하기 때문에 실제 입력 토큰 수는 단순히 600K를 2로 나눈 값보다 늘어납니다.

계산을 단순화하면, 오버헤드 없이 2회 분할 시 입력 토큰 300K × 2 = 600K 처리 비용은 mini 기준 $0.75 × 0.6 = $0.45입니다. 같은 600K를 GPT-5.4 full로 1회 처리하면 $2.50 × 0.6 = $1.50이므로 여전히 mini가 저렴합니다. 하지만 컨텍스트 오버헤드가 붙으면 mini의 비용 이점이 점차 줄어듭니다. 그리고 OpenAI 공식 가이드에 따르면 캐시 입력($0.075/1M)을 활용하면 실질 비용을 줄일 수 있지만, 캐시 히트는 반복 요청이 많은 경우에만 효과가 있습니다. 일회성 장문 요약에서는 캐시 히트를 기대하기 어렵습니다.

💡 OpenAI 공식 발표와 실제 사용 패턴을 같이 놓고 보니 이런 그림이 나왔습니다 — 400K 한도는 “저렴한 모델”의 제약이기도 하지만, 분할 호출 오버헤드를 설계하지 않으면 총 비용이 예상을 초과할 수 있습니다. 장문 RAG나 긴 대화 기록이 붙는 에이전트 파이프라인에서는 full 모델과 mini 중 어떤 게 더 비쌀지를 실측해보는 게 맞습니다.

▲ 목차로 돌아가기

경쟁 모델과 가격 직접 비교 — Gemini 3 Flash, Claude Haiku 4.5

GPT-5.4 mini의 가격 수준이 실제로 어떤 위치인지 경쟁 모델과 수치로 나란히 놓겠습니다.

모델 입력 (1M 토큰) 출력 (1M 토큰) 컨텍스트
GPT-5.4 mini $0.75 $4.50 400K
GPT-5.4 nano $0.20 $1.25 400K
Gemini 3 Flash $0.50 $3.00 1M+
Gemini 3.1 Flash-Lite $0.10 (추정) $0.40 (추정) 1M+
Claude Haiku 4.5 약 $0.80 (추정) 약 $4.00 (추정) 200K

출처: OpenAI 공식 pricing(2026.03.28), html6.tistory.com GPT-5.4 mini/nano 비교 분석(2026.03.19) / Gemini 3.1 Flash-Lite 및 Claude Haiku 4.5 가격은 공식 발표 기준 추정값이며 변동 가능

입력 단가만 보면 GPT-5.4 mini($0.75)는 Gemini 3 Flash($0.50)보다 50% 비쌉니다. 반면 Gemini 3 Flash는 컨텍스트 윈도우가 1M 이상으로 mini의 2.5배 이상입니다. 성능 면에서는 html6 티스토리의 비교 분석에 따르면 GPQA Diamond 기준 GPT-5.4 mini가 88.0%, Gemini 3.1 Flash-Lite가 86.9%로 비슷한 수준이지만, OpenAI의 컴퓨터 사용(CUA)·도구 검색·hosted shell 기능은 GPT-5.4 mini에만 있습니다.

에이전트 파이프라인을 짜는 개발자라면 GPT-5.4 mini가 경쟁력 있는 선택이고, 단순 텍스트 처리·요약·멀티모달 속도를 우선한다면 Gemini 3 Flash가 가격 대비 더 유리할 수 있습니다.

▲ 목차로 돌아가기

nano는 mini의 저렴한 버전이 아닙니다 — 벤치마크가 말해주는 것

GPT-5.4 nano를 “mini보다 싼 버전”이라고 생각하면 파이프라인 설계에서 실수가 생깁니다. 공식 벤치마크 수치를 직접 비교하면 단순히 크기만 줄인 게 아니라는 게 드러납니다.

벤치마크 GPT-5.4 (full) GPT-5.4 mini GPT-5.4 nano
SWE-Bench Pro (코딩) 57.7% 54.4% 52.4%
OSWorld-Verified (컴퓨터 사용) 75.0% 72.1% 39.0%
GPQA Diamond (지식 추론) 93.0% 88.0% 82.8%
Terminal-Bench 2.0 (터미널 작업) 75.1% 60.0% 46.3%
MCP Atlas (도구 사용) 67.2% 57.7% 56.1%

출처: OpenAI 공식 GPT-5.4 mini/nano 소개 페이지 벤치마크 수치 (2026.03.17, xhigh 추론 강도 기준)

OSWorld-Verified에서 mini(72.1%)와 nano(39.0%) 사이 격차가 33.1%포인트입니다. 컴퓨터 화면을 보고 마우스·키보드를 다루는 작업에서 nano는 mini의 절반 수준밖에 안 됩니다. 코딩(SWE-Bench)에서는 54.4% 대 52.4%로 큰 차이가 없지만, 에이전트가 실제 화면과 인터랙션해야 하는 CUA 업무에서는 nano를 쓰면 작업 완료율이 급격히 떨어집니다.

정리하면, nano의 적합한 쓰임새는 OpenAI가 공식적으로 명시한 대로 분류·데이터 추출·랭킹·단순 서브에이전트 반복 루프입니다. 화면 조작이나 복잡한 멀티스텝 브라우징이 포함된 파이프라인에 nano를 넣으면 단가를 아끼는 대신 작업 완료율을 크게 포기하는 트레이드오프가 생깁니다.

▲ 목차로 돌아가기

자주 묻는 5가지 질문

GPT-5.4 mini가 출시 당일 가격이 바뀐 건 공식 확인된 사실인가요?
OpenAI는 이 가격 변경에 대해 공식 발표를 내지 않았습니다. 출시 당일 Reddit r/codex에서 “0.25로 표시됐다가 0.75로 바뀌었다”는 보고가 있었고, 이후 공식 사이트에서 $0.75로 통일됐습니다. 최종 확정 가격은 $0.75/1M 입력 토큰입니다. (출처: OpenAI API Pricing, 2026.03.28 기준)
ChatGPT 무료 계정에서도 GPT-5.4 mini를 쓸 수 있나요?
무료(Free) 및 Go 요금제 사용자는 ChatGPT의 ‘+’ 메뉴에서 ‘잘 생각하기’를 눌러 GPT-5.4 mini(Thinking mini)를 사용할 수 있습니다. Plus 요금제 이상은 GPT-5.4 Thinking 한도를 다 쓴 뒤 자동으로 mini로 전환됩니다. nano는 API 전용이며 ChatGPT 인터페이스에서는 직접 선택할 수 없습니다. (출처: OpenAI GPT-5.4 mini 소개 블로그, 2026.03.17)
GPT-5.4 mini 컨텍스트 400K면 어떤 작업에 부족한가요?
400K 토큰은 한국어 기준 약 15~20만 단어 분량입니다. 단일 문서 요약이나 일반 코딩 작업에선 충분하지만, 대규모 코드베이스 전체 인덱싱, 긴 대화 기록이 누적되는 에이전트, 또는 법률·금융 장문 문서 전체를 한 번에 처리해야 하는 경우에는 부족할 수 있습니다. GPT-5.4 full 모델(1.05M)을 쓰거나 분할 호출 전략을 설계해야 합니다.
GPT-5 mini를 아직 쓰고 있는데, 바꿀 이유가 있을까요?
GPT-5 mini 대비 GPT-5.4 mini는 코딩(SWE-Bench Pro: 45.7% → 54.4%), 컴퓨터 사용(OSWorld: 42% → 72.1%), 추론(GPQA Diamond: 81.6% → 88.0%) 등에서 성능이 올랐습니다. 그리고 OpenAI는 GPT-5 Thinking mini를 2026년 4월 18일(KST)에 지원 종료할 예정입니다. 비용은 3배 더 들지만, 에이전트 기반 워크플로우라면 성능 향상으로 작업 완료율을 높이는 게 전체 비용을 낮출 수 있습니다. 단순 텍스트 작업만 하는 경우라면 계속 쓰다가 지원 종료 전에 전환하는 방법도 있습니다.
캐시 입력($0.075)을 실제로 활용하려면 어떻게 해야 하나요?
OpenAI의 프롬프트 캐싱은 동일한 프롬프트 접두사(prefix)가 1,024 토큰 이상이고 같은 접두사를 반복 사용할 때 자동으로 적용됩니다. 시스템 프롬프트나 긴 문서를 고정해두고 다른 사용자 쿼리를 붙이는 구조라면 캐시 히트율이 높아집니다. 단발성 요청이 많거나 매번 시스템 프롬프트가 바뀌는 경우엔 캐시 혜택을 거의 받지 못합니다. (출처: OpenAI API Pricing 가이드, openai.com/api/pricing)

▲ 목차로 돌아가기

마치며 — 가격표를 한 번 더 들여다볼 이유

“경량 모델이니까 저렴하겠지”는 절반만 맞습니다. GPT-5.4 mini는 전 세대 GPT-5 mini 대비 성능이 확실히 올랐고, 컴퓨터 사용 기능까지 탑재됐습니다. 그런데 단가는 3배입니다. nano는 4배입니다. 성능 향상에 대한 가격을 치르는 건데, 이게 내 워크플로우에서 실제로 효율이 나오는지를 먼저 계산해봐야 합니다.

솔직히 말하면, Codex에서 서브에이전트 반복 루프를 돌리는 개발자라면 GPT-5.4 mini는 꽤 합리적인 선택입니다. 단가는 full 모델의 30% 수준이고, CUA 성능(72.1%)은 full 모델(75.0%)과 거의 차이가 없습니다. 하지만 nano를 CUA 작업에 쓰는 건 39%라는 숫자를 감수하는 결정이므로 신중해야 합니다.

그리고 출시 당일 가격이 조용히 바뀐 부분은 이후에 공식 해명이 나오지 않는 한 계속 의문으로 남을 것 같습니다. 정기적으로 OpenAI pricing 페이지를 직접 확인하는 습관이 필요한 이유 중 하나입니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. OpenAI 공식 GPT-5.4 mini/nano 소개 블로그 — openai.com/ko-KR/index/introducing-gpt-5-4-mini-and-nano/
  2. OpenAI 공식 API Pricing 페이지 — openai.com/api/pricing/
  3. GPT-5.4 공식 소개 블로그 (벤치마크 원문) — openai.com/ko-KR/index/introducing-gpt-5-4/
  4. 나무위키 GPT-5 문서 (출시 경위·가격 인상 기록) — namu.wiki/w/GPT-5
  5. html6.tistory GPT-5.4 mini/nano 비교 분석 — html6.tistory.com/2110

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 포스팅에 기재된 가격·수치는 2026년 3월 28일 기준 OpenAI 공식 자료를 바탕으로 작성됐으며, 이후 OpenAI의 가격 정책 변경에 따라 달라질 수 있습니다. 투자·사업 의사결정 전 반드시 공식 사이트에서 최신 정보를 재확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기