GPT-5.4 출시 2026.03.05
API 요금 공식 기준
GPT-5.4 API 요금, 1M 토큰 쓰면 이 조건에서 돈이 두 배 나옵니다
OpenAI가 2026년 3월 5일 공개한 GPT-5.4는 최대 1M 토큰 컨텍스트 창을 내세웠지만, 요금표 안에 조용히 숨겨진 서차지 조건이 있습니다. 표준 API 요금만 보고 예산을 짰다가 청구서에서 당황하기 전에, 숫자부터 직접 확인해봤습니다.
GPT-5.4 API 공식 요금표 — 숫자 그대로 정리
GPT-5.4 API 요금은 OpenAI 공식 발표문(openai.com/index/introducing-gpt-5-4, 2026.03.05)에 공개된 표 그대로입니다. 표준 입력 기준으로 gpt-5.4는 1M 토큰당 $2.50, 출력은 $15.00입니다. gpt-5.2와 비교하면 입력은 $0.75 더 비싸고 출력은 $1 더 비쌉니다.
| 모델 | 입력 /1M | 캐시 입력 /1M | 출력 /1M |
|---|---|---|---|
| gpt-5.2 | $1.75 | $0.175 | $14.00 |
| gpt-5.4 | $2.50 | $0.25 | $15.00 |
| gpt-5.2-pro | $21.00 | — | $168.00 |
| gpt-5.4-pro | $30.00 | — | $180.00 |
(출처: OpenAI 공식 발표문, 2026.03.05 / openai.com/index/introducing-gpt-5-4/)
캐시 입력은 표준 입력 대비 90% 할인($0.25/1M)입니다. 반복 컨텍스트가 많은 에이전트 워크플로에서 캐시를 제대로 활용하면 입력 비용만 90% 줄어드는 계산이 나옵니다.
272K 토큰 기준선 — 1M 써도 처음부터 비싼 게 아닙니다
💡 공식 요금표와 실제 청구 구조를 같이 놓고 보면 이런 차이가 보였습니다. 롱 컨텍스트 서차지는 별도 단락이 아닌 공식 프라이싱 페이지 주석에 있어서 처음엔 그냥 지나치기 쉽습니다.
GPT-5.4 API 요금표에는 조용히 달린 조건이 하나 있습니다. 입력 토큰이 272K(약 27만 2천 개)를 초과하면 그 세션 전체 입력 요금이 $2.50/1M에서 $5.00/1M으로 두 배가 됩니다. 272K 이하 구간은 정상가가 적용되고, 초과한 순간 해당 요청 전체에 2배 요금이 붙는 구조입니다.
(출처: OpenAI 공식 API 요금 페이지, openai.com/api/pricing, 2026.03.25 기준)
⚠️ 실제 계산 예시
코드베이스 분석 작업 1회 — 입력 토큰 400K 사용 시
· 표준 요금 가정 시: 400K × $2.50/1M = $1.00
· 실제 청구 (272K 초과): 400K × $5.00/1M = $2.00
→ 같은 작업인데 두 배 청구됩니다.
GPT-5.4는 최대 1.05M 토큰 컨텍스트를 지원하지만, 그 전체 범위를 균일한 단가로 쓸 수 있다고 생각하면 오산입니다. 272K까지만 표준가이고 그 이후는 서차지 구간입니다. 대용량 법률 문서, 코드베이스, 긴 연구 레포트를 통째로 넣는 작업이라면 세션 구성 전에 토큰 수부터 추산하는 게 맞습니다.
롱 컨텍스트가 진짜 필요한 상황인지 확인하는 기준은 단순합니다. 여러 번 짧게 나눠서 호출해도 결과 품질이 동일하다면, 한 번에 1M을 넣는 건 272K 서차지만 추가로 발생시키는 방식입니다.
GPT-5.4 Pro 요금이 표준의 12배인 이유
💡 OpenAI 발표문과 요금표를 나란히 놓으면 Pro가 왜 별도 SKU인지 이유가 선명하게 보입니다.
gpt-5.4-pro는 출력 기준 $180/1M입니다. gpt-5.4 표준 출력 $15/1M 대비 정확히 12배입니다. 입력도 $30/1M으로 표준($2.50)의 12배 수준입니다. OpenAI는 공식 발표문에서 이 가격 차이에 대해 “심층 추론에 필요한 특수 하드웨어 요구 사항을 반영한 것”이라고 설명했습니다.
(출처: openai.com/index/introducing-gpt-5-4/, 2026.03.05)
실제 차이는 벤치마크에서도 보입니다. BrowseComp 기준으로 gpt-5.4는 82.7%, gpt-5.4-pro는 89.3%입니다. 약 6.6%p 차이인데, 이걸 위해 12배 요금을 낼 가치가 있는지는 사용 맥락에 따라 완전히 다릅니다. 표준 모델로 충분히 커버되는 작업이라면 Pro를 API로 직접 호출하는 건 비용 대비 효과가 낮습니다.
| 벤치마크 | gpt-5.4 | gpt-5.4-pro | gpt-5.2 |
|---|---|---|---|
| GDPval (전문 업무) | 83.0% | 82.0% | 70.9% |
| BrowseComp (웹 리서치) | 82.7% | 89.3% | 65.8% |
| OSWorld-Verified (컴퓨터 조작) | 75.0% | — | 47.3% |
| ARC-AGI-2 | 73.3% | 83.3% | 52.9% |
(출처: OpenAI 공식 발표문, 2026.03.05)
GDPval에서 Pro(82.0%)가 표준(83.0%)보다 오히려 1%p 낮은 점도 눈에 띕니다. Pro가 항상 더 높지는 않습니다. OpenAI가 이유를 별도로 밝히지 않은 부분입니다.
배치·플렉스·우선처리 — 요금 절반 또는 두 배
OpenAI는 GPT-5.4 API에 세 가지 처리 속도 옵션을 제공합니다. 각각 표준 요금 대비 절반 또는 두 배가 됩니다.
응답 속도가 느리지만 비용 절반. 비실시간 대용량 작업에 적합.
$2.50(입력) / $15.00(출력) / 1M 토큰. 일반 API 호출 기본 모드.
Codex /fast 모드와 동일한 속도. 실시간 응답이 필수인 경우 사용.
💡 Codex /fast 모드의 실제 동작 방식을 발표문에서 직접 확인했습니다. OpenAI는 “같은 모델, 같은 지능 — 단지 더 빠를 뿐(same model and the same intelligence, just faster)”이라고 명시했습니다. 속도만 다를 뿐 모델 자체는 동일합니다. 비용 2배가 성능 2배를 의미하지 않습니다.
배치 처리는 우선순위가 낮고 처리 시간이 길어지는 대신 동일한 출력을 절반 요금에 받을 수 있습니다. 야간 분류 작업, 대량 문서 처리처럼 즉시 응답이 필요 없는 작업이라면 배치 모드만 써도 API 비용을 절반 이하로 유지할 수 있습니다.
GPT-5.2 vs GPT-5.4 실제 비용 계산
💡 GPT-5.4가 토큰 효율이 더 높다는 OpenAI의 주장과 실제 요금 인상 사이의 관계를 계산으로 직접 따져봤습니다.
OpenAI는 GPT-5.4가 GPT-5.2보다 토큰 효율이 좋아 동일 작업에 더 적은 토큰을 소비한다고 발표했습니다. 공식 발표문에서는 MCP 서버 도구 검색(Tool Search) 기능으로 토큰 사용량이 47% 줄었다는 사례를 제시했습니다. 단, 이 수치는 특정 MCP Atlas 250개 작업 기준이며 모든 워크플로에 동일하게 적용되지 않습니다.
직접 따라해볼 수 있는 비용 계산:
시나리오: 입력 100K + 출력 20K 토큰 작업을 1,000회 실행
gpt-5.2:
입력: 100K × 1,000 = 100M → $1.75 × 100 = $175
출력: 20K × 1,000 = 20M → $14 × 20 = $280
합계: $455
gpt-5.4 (토큰 효율 동일 가정):
입력: $2.50 × 100 = $250
출력: $15 × 20 = $300
합계: $550 (약 21% 더 비쌈)
gpt-5.4 (Tool Search로 입력 47% 절감 시):
입력: 53K × 1,000 = 53M → $2.50 × 53 = $132.5
출력: $15 × 20 = $300
합계: $432.5 (GPT-5.2보다 5% 절감)
결론은 간단합니다. Tool Search 같은 토큰 효율 기능을 실제로 활용할 수 있는 에이전트 워크플로에서는 GPT-5.4가 GPT-5.2보다 저렴해질 수 있습니다. 단순 텍스트 생성처럼 도구 검색이 없는 일반 호출이라면 GPT-5.4가 약 20% 이상 비쌉니다.
경쟁 모델 요금 비교 — Claude 4.6, Gemini 3.1
2026년 3월 기준 주요 프론티어 모델 API 요금을 나란히 비교했습니다. 공식 발표 및 각사 API 요금 페이지 기준입니다.
| 모델 | 입력 /1M | 출력 /1M | 특이 조건 |
|---|---|---|---|
| gpt-5.4 | $2.50 | $15.00 | 272K 초과 시 입력 2배 |
| gpt-5.4-pro | $30.00 | $180.00 | 캐시 입력 미지원 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | — |
| Claude Opus 4.6 | $5.00 | $25.00 | — |
| Gemini 3.1 Pro Preview | $1.00 | $6.00 | 200K 초과 시 $2/$9 |
(출처: 각사 공식 API 요금 페이지, 2026.03.25 기준)
표준 입력 기준으로 가장 저렴한 건 Gemini 3.1 Pro Preview($1.00/1M)입니다. GPT-5.4는 Claude Sonnet 4.6과 입력 기준으로 큰 차이가 없습니다. 단, Gemini도 200K 초과 시 입력 $2/출력 $9로 올라가는 구조라는 점에서 롱 컨텍스트 서차지 문제는 OpenAI만의 이야기가 아닙니다.
GPT-5.4를 선택할 실질 이유는 요금보다는 컴퓨터 사용 기능(OSWorld 75%)과 에이전트 도구 호출 정확도(Toolathlon 54.6%)에 있습니다. 이 두 가지가 필요 없는 워크플로라면 요금 관점에서 GPT-5.4가 유리하다고 보기 어렵습니다.
ChatGPT 구독 플랜에서 GPT-5.4를 쓰는 방법
API가 아닌 ChatGPT 구독 형태로 GPT-5.4를 사용하는 경우, 플랜별 접근 방식이 다릅니다. OpenAI Model Release Notes(2026.03.05, 2026.03.18)를 기준으로 정리했습니다.
- ChatGPT Free / Go: GPT-5.4 Thinking 직접 선택 불가. 2026년 3월 18일 출시된 GPT-5.4 mini를 Thinking 기능에서 이용 가능. 요금 한도 소진 시 mini로 자동 전환됩니다.
- ChatGPT Plus ($20/월): GPT-5.4 Thinking 이용 가능. 단, 3시간당 약 80개 메시지 제한이 적용됩니다. GPT-5.4 Pro는 이용 불가.
- ChatGPT Pro ($200/월): GPT-5.4 Pro 무제한 접근. 전용 GPU 슬라이스 배정으로 속도가 빠릅니다. Sora 2 포함.
- ChatGPT Business ($25/인/월): GPT-5.4 Thinking 이용 가능. Plus보다 높은 사용 한도. Pro 모델은 별도 애드온 구매 필요.
💡 GPT-5.2 Thinking은 2026년 6월 5일 ChatGPT에서 공식 종료 예정입니다. 그 전까지 Plus, Pro, Team 유료 사용자는 모델 선택기에서 레거시 모델로 GPT-5.2를 계속 쓸 수 있습니다. OpenAI Model Release Notes에 직접 명시됐습니다.
한 가지 더 — GPT-5.4 mini는 무료 사용자도 이용할 수 있지만, 선택 가능한 모델로 표시되지 않습니다. GPT-5.4 Thinking 사용 한도 소진 시 자동으로 대체 투입되는 방식입니다. OpenAI는 mini가 모델 선택기에 별도 옵션으로 뜨지 않는다고 명시했습니다.
Q&A
마치며
GPT-5.4 API 요금 구조에서 실제로 중요한 건 세 가지입니다. 첫째, 272K 롱 컨텍스트 서차지. 대용량 컨텍스트 작업을 설계할 때 이 기준선을 먼저 체크해야 합니다. 둘째, Pro 모델은 표준 대비 출력 기준 12배라는 점. 성능 향상이 6~10%p 수준이라는 걸 감안하면 사용 목적이 명확해야 합니다. 셋째, 배치·플렉스 처리로 절반 요금을 낼 수 있는 작업 유형을 먼저 분류하는 게 비용 최적화의 시작입니다.
GPT-5.4의 가장 큰 차별점은 컴퓨터 사용(OSWorld 75%)과 에이전트 도구 호출 정확도입니다. 이 두 가지가 필요한 워크플로라면 요금 인상이 납득됩니다. 그게 아니라면, 지금 당장은 GPT-5.2나 Claude Sonnet 4.6 같은 대안도 충분히 경쟁력 있습니다.
본 포스팅 참고 자료
- OpenAI 공식 GPT-5.4 발표문 — openai.com/index/introducing-gpt-5-4/ (2026.03.05)
- OpenAI 공식 API 요금 페이지 — openai.com/api/pricing/ (2026.03.25 기준)
- OpenAI Model Release Notes — help.openai.com (2026.03.25 기준)
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 요금 정보는 OpenAI 공식 페이지에서 최신 내용을 직접 확인하세요. 본 포스팅은 특정 서비스의 홍보 목적으로 작성되지 않았습니다.











댓글 남기기