GPT-5.4 API 요금, 1M 토큰 쓰면 이 조건에서 돈이 두 배 나옵니다

Published on

in

GPT-5.4 API 요금, 1M 토큰 쓰면 이 조건에서 돈이 두 배 나옵니다

2026.03.25 기준
GPT-5.4 출시 2026.03.05
API 요금 공식 기준

GPT-5.4 API 요금, 1M 토큰 쓰면 이 조건에서 돈이 두 배 나옵니다

OpenAI가 2026년 3월 5일 공개한 GPT-5.4는 최대 1M 토큰 컨텍스트 창을 내세웠지만, 요금표 안에 조용히 숨겨진 서차지 조건이 있습니다. 표준 API 요금만 보고 예산을 짰다가 청구서에서 당황하기 전에, 숫자부터 직접 확인해봤습니다.

표준 입력 요금
$2.50/1M
272K 초과 입력 요금
$5.00/1M
Pro 출력 요금
$180/1M

GPT-5.4 API 공식 요금표 — 숫자 그대로 정리

GPT-5.4 API 요금은 OpenAI 공식 발표문(openai.com/index/introducing-gpt-5-4, 2026.03.05)에 공개된 표 그대로입니다. 표준 입력 기준으로 gpt-5.4는 1M 토큰당 $2.50, 출력은 $15.00입니다. gpt-5.2와 비교하면 입력은 $0.75 더 비싸고 출력은 $1 더 비쌉니다.

모델 입력 /1M 캐시 입력 /1M 출력 /1M
gpt-5.2 $1.75 $0.175 $14.00
gpt-5.4 $2.50 $0.25 $15.00
gpt-5.2-pro $21.00 $168.00
gpt-5.4-pro $30.00 $180.00

(출처: OpenAI 공식 발표문, 2026.03.05 / openai.com/index/introducing-gpt-5-4/)

캐시 입력은 표준 입력 대비 90% 할인($0.25/1M)입니다. 반복 컨텍스트가 많은 에이전트 워크플로에서 캐시를 제대로 활용하면 입력 비용만 90% 줄어드는 계산이 나옵니다.

272K 토큰 기준선 — 1M 써도 처음부터 비싼 게 아닙니다

💡 공식 요금표와 실제 청구 구조를 같이 놓고 보면 이런 차이가 보였습니다. 롱 컨텍스트 서차지는 별도 단락이 아닌 공식 프라이싱 페이지 주석에 있어서 처음엔 그냥 지나치기 쉽습니다.

GPT-5.4 API 요금표에는 조용히 달린 조건이 하나 있습니다. 입력 토큰이 272K(약 27만 2천 개)를 초과하면 그 세션 전체 입력 요금이 $2.50/1M에서 $5.00/1M으로 두 배가 됩니다. 272K 이하 구간은 정상가가 적용되고, 초과한 순간 해당 요청 전체에 2배 요금이 붙는 구조입니다.

(출처: OpenAI 공식 API 요금 페이지, openai.com/api/pricing, 2026.03.25 기준)

⚠️ 실제 계산 예시

코드베이스 분석 작업 1회 — 입력 토큰 400K 사용 시
  · 표준 요금 가정 시: 400K × $2.50/1M = $1.00
  · 실제 청구 (272K 초과): 400K × $5.00/1M = $2.00
  → 같은 작업인데 두 배 청구됩니다.

GPT-5.4는 최대 1.05M 토큰 컨텍스트를 지원하지만, 그 전체 범위를 균일한 단가로 쓸 수 있다고 생각하면 오산입니다. 272K까지만 표준가이고 그 이후는 서차지 구간입니다. 대용량 법률 문서, 코드베이스, 긴 연구 레포트를 통째로 넣는 작업이라면 세션 구성 전에 토큰 수부터 추산하는 게 맞습니다.

롱 컨텍스트가 진짜 필요한 상황인지 확인하는 기준은 단순합니다. 여러 번 짧게 나눠서 호출해도 결과 품질이 동일하다면, 한 번에 1M을 넣는 건 272K 서차지만 추가로 발생시키는 방식입니다.

GPT-5.4 Pro 요금이 표준의 12배인 이유

💡 OpenAI 발표문과 요금표를 나란히 놓으면 Pro가 왜 별도 SKU인지 이유가 선명하게 보입니다.

gpt-5.4-pro는 출력 기준 $180/1M입니다. gpt-5.4 표준 출력 $15/1M 대비 정확히 12배입니다. 입력도 $30/1M으로 표준($2.50)의 12배 수준입니다. OpenAI는 공식 발표문에서 이 가격 차이에 대해 “심층 추론에 필요한 특수 하드웨어 요구 사항을 반영한 것”이라고 설명했습니다.

(출처: openai.com/index/introducing-gpt-5-4/, 2026.03.05)

실제 차이는 벤치마크에서도 보입니다. BrowseComp 기준으로 gpt-5.4는 82.7%, gpt-5.4-pro는 89.3%입니다. 약 6.6%p 차이인데, 이걸 위해 12배 요금을 낼 가치가 있는지는 사용 맥락에 따라 완전히 다릅니다. 표준 모델로 충분히 커버되는 작업이라면 Pro를 API로 직접 호출하는 건 비용 대비 효과가 낮습니다.

벤치마크 gpt-5.4 gpt-5.4-pro gpt-5.2
GDPval (전문 업무) 83.0% 82.0% 70.9%
BrowseComp (웹 리서치) 82.7% 89.3% 65.8%
OSWorld-Verified (컴퓨터 조작) 75.0% 47.3%
ARC-AGI-2 73.3% 83.3% 52.9%

(출처: OpenAI 공식 발표문, 2026.03.05)

GDPval에서 Pro(82.0%)가 표준(83.0%)보다 오히려 1%p 낮은 점도 눈에 띕니다. Pro가 항상 더 높지는 않습니다. OpenAI가 이유를 별도로 밝히지 않은 부분입니다.

배치·플렉스·우선처리 — 요금 절반 또는 두 배

OpenAI는 GPT-5.4 API에 세 가지 처리 속도 옵션을 제공합니다. 각각 표준 요금 대비 절반 또는 두 배가 됩니다.

🐢 배치 / 플렉스 처리
50% 할인

응답 속도가 느리지만 비용 절반. 비실시간 대용량 작업에 적합.

⚡ 표준 처리
기준가

$2.50(입력) / $15.00(출력) / 1M 토큰. 일반 API 호출 기본 모드.

🚀 우선 처리
2배 요금

Codex /fast 모드와 동일한 속도. 실시간 응답이 필수인 경우 사용.

💡 Codex /fast 모드의 실제 동작 방식을 발표문에서 직접 확인했습니다. OpenAI는 “같은 모델, 같은 지능 — 단지 더 빠를 뿐(same model and the same intelligence, just faster)”이라고 명시했습니다. 속도만 다를 뿐 모델 자체는 동일합니다. 비용 2배가 성능 2배를 의미하지 않습니다.

배치 처리는 우선순위가 낮고 처리 시간이 길어지는 대신 동일한 출력을 절반 요금에 받을 수 있습니다. 야간 분류 작업, 대량 문서 처리처럼 즉시 응답이 필요 없는 작업이라면 배치 모드만 써도 API 비용을 절반 이하로 유지할 수 있습니다.

GPT-5.2 vs GPT-5.4 실제 비용 계산

💡 GPT-5.4가 토큰 효율이 더 높다는 OpenAI의 주장과 실제 요금 인상 사이의 관계를 계산으로 직접 따져봤습니다.

OpenAI는 GPT-5.4가 GPT-5.2보다 토큰 효율이 좋아 동일 작업에 더 적은 토큰을 소비한다고 발표했습니다. 공식 발표문에서는 MCP 서버 도구 검색(Tool Search) 기능으로 토큰 사용량이 47% 줄었다는 사례를 제시했습니다. 단, 이 수치는 특정 MCP Atlas 250개 작업 기준이며 모든 워크플로에 동일하게 적용되지 않습니다.

직접 따라해볼 수 있는 비용 계산:

시나리오: 입력 100K + 출력 20K 토큰 작업을 1,000회 실행

gpt-5.2:
  입력: 100K × 1,000 = 100M → $1.75 × 100 = $175
  출력: 20K × 1,000 = 20M → $14 × 20 = $280
  합계: $455

gpt-5.4 (토큰 효율 동일 가정):
  입력: $2.50 × 100 = $250
  출력: $15 × 20 = $300
  합계: $550 (약 21% 더 비쌈)

gpt-5.4 (Tool Search로 입력 47% 절감 시):
  입력: 53K × 1,000 = 53M → $2.50 × 53 = $132.5
  출력: $15 × 20 = $300
  합계: $432.5 (GPT-5.2보다 5% 절감)

결론은 간단합니다. Tool Search 같은 토큰 효율 기능을 실제로 활용할 수 있는 에이전트 워크플로에서는 GPT-5.4가 GPT-5.2보다 저렴해질 수 있습니다. 단순 텍스트 생성처럼 도구 검색이 없는 일반 호출이라면 GPT-5.4가 약 20% 이상 비쌉니다.

경쟁 모델 요금 비교 — Claude 4.6, Gemini 3.1

2026년 3월 기준 주요 프론티어 모델 API 요금을 나란히 비교했습니다. 공식 발표 및 각사 API 요금 페이지 기준입니다.

모델 입력 /1M 출력 /1M 특이 조건
gpt-5.4 $2.50 $15.00 272K 초과 시 입력 2배
gpt-5.4-pro $30.00 $180.00 캐시 입력 미지원
Claude Sonnet 4.6 $3.00 $15.00
Claude Opus 4.6 $5.00 $25.00
Gemini 3.1 Pro Preview $1.00 $6.00 200K 초과 시 $2/$9

(출처: 각사 공식 API 요금 페이지, 2026.03.25 기준)

표준 입력 기준으로 가장 저렴한 건 Gemini 3.1 Pro Preview($1.00/1M)입니다. GPT-5.4는 Claude Sonnet 4.6과 입력 기준으로 큰 차이가 없습니다. 단, Gemini도 200K 초과 시 입력 $2/출력 $9로 올라가는 구조라는 점에서 롱 컨텍스트 서차지 문제는 OpenAI만의 이야기가 아닙니다.

GPT-5.4를 선택할 실질 이유는 요금보다는 컴퓨터 사용 기능(OSWorld 75%)과 에이전트 도구 호출 정확도(Toolathlon 54.6%)에 있습니다. 이 두 가지가 필요 없는 워크플로라면 요금 관점에서 GPT-5.4가 유리하다고 보기 어렵습니다.

ChatGPT 구독 플랜에서 GPT-5.4를 쓰는 방법

API가 아닌 ChatGPT 구독 형태로 GPT-5.4를 사용하는 경우, 플랜별 접근 방식이 다릅니다. OpenAI Model Release Notes(2026.03.05, 2026.03.18)를 기준으로 정리했습니다.

  • ChatGPT Free / Go: GPT-5.4 Thinking 직접 선택 불가. 2026년 3월 18일 출시된 GPT-5.4 mini를 Thinking 기능에서 이용 가능. 요금 한도 소진 시 mini로 자동 전환됩니다.
  • ChatGPT Plus ($20/월): GPT-5.4 Thinking 이용 가능. 단, 3시간당 약 80개 메시지 제한이 적용됩니다. GPT-5.4 Pro는 이용 불가.
  • ChatGPT Pro ($200/월): GPT-5.4 Pro 무제한 접근. 전용 GPU 슬라이스 배정으로 속도가 빠릅니다. Sora 2 포함.
  • ChatGPT Business ($25/인/월): GPT-5.4 Thinking 이용 가능. Plus보다 높은 사용 한도. Pro 모델은 별도 애드온 구매 필요.

💡 GPT-5.2 Thinking은 2026년 6월 5일 ChatGPT에서 공식 종료 예정입니다. 그 전까지 Plus, Pro, Team 유료 사용자는 모델 선택기에서 레거시 모델로 GPT-5.2를 계속 쓸 수 있습니다. OpenAI Model Release Notes에 직접 명시됐습니다.

한 가지 더 — GPT-5.4 mini는 무료 사용자도 이용할 수 있지만, 선택 가능한 모델로 표시되지 않습니다. GPT-5.4 Thinking 사용 한도 소진 시 자동으로 대체 투입되는 방식입니다. OpenAI는 mini가 모델 선택기에 별도 옵션으로 뜨지 않는다고 명시했습니다.

Q&A

Q1. GPT-5.4 API 요금은 GPT-5.2보다 무조건 비싼가요?
토큰당 단가만 보면 입력 $0.75, 출력 $1 더 비쌉니다. 하지만 Tool Search 기능을 활용하는 에이전트 워크플로에서는 입력 토큰 사용량이 줄어 결과적으로 비용이 GPT-5.2와 비슷하거나 낮아질 수 있습니다. 단순 텍스트 생성 작업이라면 GPT-5.4가 약 20% 이상 비쌉니다.
Q2. 272K 토큰 초과 서차지는 어떻게 계산되나요?
입력 토큰이 272K를 넘는 순간, 그 요청 전체 입력이 $5.00/1M으로 부과됩니다. 초과 분량에만 적용되는 게 아니라 해당 세션 전체에 2배 단가가 적용됩니다. 출력은 1.5배 적용됩니다. (출처: openai.com/api/pricing, 2026.03.25 기준)
Q3. GPT-5.4 Pro와 표준을 어떤 기준으로 선택하면 좋을까요?
BrowseComp 기준 6.6%p, ARC-AGI-2 기준 10%p 차이입니다. 검토 실패 시 인간 재작업 비용이 수십만 원 이상 나오는 고위험 작업(금융 모델링, 법률 분석, 복잡한 코드 리뷰)이라면 Pro가 ROI 면에서 유리합니다. 단순 초안 작성이나 반복 분류에는 표준 모델이 충분합니다.
Q4. 캐시 입력($0.25/1M)은 자동으로 적용되나요?
OpenAI 공식 발표문에 “반복 컨텍스트에 자동으로 적용된다”고 나와 있습니다. 별도 설정 없이 동일한 입력이 반복되면 캐시 요금이 적용됩니다. 단, 세션 간 캐시 유지 여부는 API 구현 방식에 따라 다릅니다.
Q5. GPT-5.4 mini와 GPT-5.4 nano의 요금은 어떻게 되나요?
OpenAI 공식 요금 페이지 기준으로 GPT-5.4 mini는 입력 $0.75/1M, 출력 $4.50/1M입니다. GPT-5.4 nano는 입력 $0.20/1M, 출력 $1.25/1M으로 표준 GPT-5.4 대비 약 10분의 1 수준입니다. 대용량 단순 작업에는 nano, 중간 복잡도 작업에는 mini가 비용 효율이 높습니다. (출처: openai.com/api/pricing, 2026.03.25 기준)

마치며

GPT-5.4 API 요금 구조에서 실제로 중요한 건 세 가지입니다. 첫째, 272K 롱 컨텍스트 서차지. 대용량 컨텍스트 작업을 설계할 때 이 기준선을 먼저 체크해야 합니다. 둘째, Pro 모델은 표준 대비 출력 기준 12배라는 점. 성능 향상이 6~10%p 수준이라는 걸 감안하면 사용 목적이 명확해야 합니다. 셋째, 배치·플렉스 처리로 절반 요금을 낼 수 있는 작업 유형을 먼저 분류하는 게 비용 최적화의 시작입니다.

GPT-5.4의 가장 큰 차별점은 컴퓨터 사용(OSWorld 75%)과 에이전트 도구 호출 정확도입니다. 이 두 가지가 필요한 워크플로라면 요금 인상이 납득됩니다. 그게 아니라면, 지금 당장은 GPT-5.2나 Claude Sonnet 4.6 같은 대안도 충분히 경쟁력 있습니다.

본 포스팅 참고 자료

  1. OpenAI 공식 GPT-5.4 발표문 — openai.com/index/introducing-gpt-5-4/ (2026.03.05)
  2. OpenAI 공식 API 요금 페이지 — openai.com/api/pricing/ (2026.03.25 기준)
  3. OpenAI Model Release Notes — help.openai.com (2026.03.25 기준)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 요금 정보는 OpenAI 공식 페이지에서 최신 내용을 직접 확인하세요. 본 포스팅은 특정 서비스의 홍보 목적으로 작성되지 않았습니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기