2026.03.05 기준
gpt-5.4-2026-03-05
IT / AI

GPT-5.4 API 가격, 공식 수치 4개로 직접 따져봤습니다

입력 토큰당 $2.50로 GPT-5.2보다 43% 비쌉니다. 근데 그게 전부가 아닙니다.
272K 토큰을 넘는 순간 가격 구조 자체가 바뀝니다.
공식 발표문, 가격표, 모델 문서를 직접 크롤링해서 정리했습니다.

표준 입력가

$2.50/M

272K 초과 입력가

$5.00/M

토큰 효율 개선

-47%

GPT-5.2 은퇴일

2026.06.05

GPT-5.4가 뭔지 30초 요약

GPT-5.4는 OpenAI가 2026년 3월 5일에 공식 출시한 플래그십 추론 모델입니다. (출처: OpenAI 공식 발표, 2026.03.05)
ChatGPT에서는 “GPT-5.4 Thinking”이라는 이름으로 보이고, API에서는 gpt-5.4로 호출합니다.

기존 GPT-5.2와 비교해 눈에 띄는 차이는 세 가지입니다. 첫째, AI가 마우스·키보드를 직접 조작하는 Computer Use가 처음으로 일반 모델에 탑재됐습니다. OSWorld 벤치마크에서 사람 전문가(72.4%)를 처음으로 넘은 75.0%를 기록했습니다. (출처: OpenAI 공식 발표, 2026.03.05) 둘째, 컨텍스트 창이 최대 105만 토큰으로 확장됐습니다. 셋째, GPT-5.3-Codex의 코딩 능력을 통합했습니다.

가격은 GPT-5.2보다 비쌉니다. 그런데 가격표만 보고 “비싸다”고 결론 내리면 손해입니다. 요금 구조에 꽤 중요한 레이어가 하나 더 있습니다.

▲ 목차로 돌아가기

공식 가격표 전체 — GPT-5.2와 숫자 비교

아래는 OpenAI 공식 가격 페이지(openai.com/api/pricing)와 OpenAI 공식 발표문 기준 수치입니다.

항목	GPT-5.2	GPT-5.4 (표준)	GPT-5.4 (272K 초과)
입력 (Input)	$1.75/M	$2.50/M	$5.00/M
캐시 입력	$0.175/M	$0.25/M	$0.50/M
출력 (Output)	$14.00/M	$15.00/M	$22.50/M
Pro 입력	$21.00/M	$30.00/M	$60.00/M
Pro 출력	$168.00/M	$180.00/M	$270.00/M

표준 구간(272K 이하)만 놓고 보면 입력은 43% 더 비싸고, 출력은 7% 더 비쌉니다. 하지만 272K를 넘는 순간부터는 얘기가 완전히 달라집니다. 그 내용이 다음 섹션입니다.

추가로, Batch·Flex 처리를 쓰면 표준 요금의 절반 ($1.25/M 입력, $7.50/M 출력)에 사용할 수 있습니다. 반대로 Priority 처리는 2배 ($5.00/M 입력)입니다. GPT-5.4 mini는 입력 $0.75/M, 출력 $4.50/M으로 메인 모델보다 훨씬 저렴한 점도 참고할 만합니다. (출처: OpenAI API Pricing, 2026.03.05)

▲ 목차로 돌아가기

272K 초과하면 요금이 세션 전체에 적용됩니다

⚠️ 많은 개발자가 여기서 놀랍니다

272K를 넘기면 초과분만 비싸게 과금되는 게 아닙니다. 해당 세션 전체 토큰이 높은 단가로 계산됩니다. 입력가는 $2.50→$5.00(2배), 출력가는 $15.00→$22.50(1.5배)로 적용됩니다.

OpenAI 공식 모델 문서(developers.openai.com/api/docs/models/gpt-5.4)에 딱 이렇게 나옵니다: “prompts with >272K input tokens are priced at 2x input and 1.5x output for the full session.” 272K를 1토큰이라도 넘으면 세션 전체가 높은 단가로 재산정됩니다.

이것이 실제로 어떤 의미인지 수치로 보면 명확합니다. 272K 토큰 입력일 때 입력 비용은 $0.68입니다. 같은 요청에 토큰을 딱 1개 더 붙여서 272,001 토큰이 되면 입력 비용이 $1.36으로 정확히 2배가 됩니다. 고작 1토큰 차이로 세션 전체 요금이 두 배 구간으로 이동하는 구조입니다.

성능 측면에서도 주의할 점이 있습니다. OpenAI가 공개한 장문 컨텍스트 평가 데이터를 보면, 512K~1M 구간에서 정보 검색 정확도가 약 36% 수준까지 내려갑니다. 비용이 2배 이상이고, 정확도도 떨어지는 구간입니다. 가격 구조와 성능 곡선이 같은 방향으로 경고를 보내고 있는 셈입니다. 127K~272K 구간이 정확도와 비용 모두 가장 효율적인 구간입니다.

💡 공식 발표문과 모델 문서를 같이 놓고 보니 이런 차이가 보였습니다 — 1M 컨텍스트를 지원한다고 해서 채우라는 뜻이 아닙니다. 272K가 비용·정확도 양면에서 실질적 한계선입니다.

▲ 목차로 돌아가기

토큰이 비싼데 왜 총비용은 비슷할 수 있나요

💡 가격표 숫자만 비교해도 GPT-5.4가 비싸 보이는데, OpenAI가 제시한 수치를 실제로 교차해보니 구조가 달랐습니다 — 토큰당 단가와 총 토큰 소비량은 별개 문제입니다.

OpenAI 공식 발표문에 따르면 GPT-5.4는 복잡한 작업에서 GPT-5.2 대비 추론 토큰을 약 47% 적게 사용합니다. (출처: OpenAI Introducing GPT-5.4, 2026.03.05) 이건 모델 자체가 더 효율적으로 생각해서 같은 결론에 도달하는 데 소비하는 내부 토큰이 줄었다는 뜻입니다.

계산해보면 이렇습니다. 복잡한 작업 하나에 GPT-5.2가 입력 10만 토큰, 출력 5만 토큰을 소비한다고 가정합니다.

비용 직접 계산

GPT-5.2: 입력 $0.175 + 출력 $0.70 = $0.875
(100K × $1.75/M + 50K × $14/M)

GPT-5.4 (토큰 47% 감소 가정): 입력 $0.1325 + 출력 $0.3975 = $0.53
(53K × $2.50/M + 26.5K × $15/M)

→ 단가는 비싸도 총비용이 39% 낮아질 수 있습니다

물론 GPT-5.4의 응답이 평균적으로 약 24% 더 길어진다는 점이 출력 비용을 일부 상쇄합니다. (출처: apiyi.com GPT-5.4 딥다이브 분석, 2026.03.06) 단순히 토큰 효율만 보면 과도하게 낙관적이 됩니다. 실제 절감 효과는 워크로드 유형에 따라 다르므로 핵심은 자신의 실제 프롬프트로 직접 측정해보는 것입니다.

Tool Search 기능도 비용 구조에 직접 영향을 줍니다. 도구가 많은 에이전트 시스템에서는 모든 도구 정의를 프롬프트에 미리 넣는 대신, GPT-5.4가 필요할 때 도구를 검색하는 방식으로 동작합니다. OpenAI가 MCP Atlas 벤치마크 250개 태스크로 테스트한 결과 총 토큰 사용량이 47% 감소했습니다. 정확도는 동일하게 유지됐습니다. (출처: OpenAI Introducing GPT-5.4, 2026.03.05) MCP 서버 기반 에이전트를 운영하는 팀이라면 Tool Search만으로도 비용 구조가 크게 달라집니다.

▲ 목차로 돌아가기

ChatGPT 구독자라면 이미 무료로 쓰고 있습니다

API를 직접 사용하지 않는 사람에게는 가격표가 사실상 무관한 정보입니다. 이 부분을 많은 기사가 뭉뚱그려 “GPT-5.4는 비싸다”고만 전달하는데, 구독 플랜과 API 사용은 완전히 다른 과금 체계입니다.

한편 GPT-5.2 Thinking은 ChatGPT에서 2026년 6월 5일에 공식 은퇴합니다. 그 전까지는 모델 선택기에서 “Legacy Models” 섹션에서 선택할 수 있습니다. GPT-5.2에 의존하는 자체 프로덕션 시스템이 있다면 지금부터 마이그레이션 일정을 잡아두는 게 좋습니다.

💡 API 단가표와 ChatGPT 구독 플랜을 나란히 놓고 보면 이게 보였습니다 — “비싸다”는 판단은 API 개발자 기준이고, 구독 사용자 기준으로는 그냥 무료 업그레이드입니다.

▲ 목차로 돌아가기

실제 비용 계산 — 한국어 기준으로 직접 재봤습니다

한국어 사용자에게 실질적인 수치를 내놓기 위해 직접 계산했습니다. 한국어는 영어보다 토큰 소비가 많습니다. 한국어 글자 1자에 약 2~3토큰이 소모됩니다. (GPT 토크나이저 특성 기준, tiktoken 라이브러리 측정 추정치)

한국어 콘텐츠 API 비용 예시 (gpt-5.4 표준, 272K 이하)

작업 유형	입력 (추정)	출력 (추정)	1회 비용
블로그 글 1편 요약 (3천자)	약 6K~9K	약 1K~2K	$0.04~0.06
고객 상담 챗봇 1회 응답 (500자)	약 2K~4K	약 1K	$0.02~0.03
코드베이스 리뷰 (5만자 이상)	약 100K~150K	약 5K~10K	$0.33~0.53

※ 추정치. 실제 토큰 수는 tiktoken 등 공식 라이브러리로 직접 측정 권장.

272K 토큰은 한국어 기준으로 약 9만~13만 자에 해당합니다. (한국어 글자당 2~3토큰 추정 기준) 웬만한 단일 요청에서는 이 한도를 초과하지 않습니다. 하지만 다중 턴 에이전트나 전체 코드베이스를 한 번에 넣는 작업이라면 누적 컨텍스트가 이 선을 쉽게 넘습니다.

비용을 절감하는 가장 확실한 방법은 캐시 입력 활용입니다. 동일한 시스템 프롬프트나 고정된 컨텍스트가 반복되는 경우 캐시 입력 요금($0.25/M)을 적용하면 원래 입력가의 10분의 1 수준으로 줄어듭니다. 시스템 프롬프트가 긴 서비스라면 캐싱 설계가 가장 빠른 비용 절감 수단입니다.

▲ 목차로 돌아가기

GPT-5.2에서 갈아탈 이유, 안 갈아탈 이유

갈아타야 할 경우

Computer Use가 필요한 작업이라면 선택의 여지가 없습니다. GPT-5.2에는 이 기능 자체가 없습니다. 에이전트가 웹 브라우저, 데스크톱 앱, 폼 입력을 직접 처리해야 한다면 GPT-5.4만 가능합니다. SWE-Bench Pro에서 57.7%(GPT-5.2는 55.6%), OSWorld에서 75.0%(사람 전문가는 72.4%)라는 수치가 실제 에이전트 작업 품질의 차이를 보여줍니다. (출처: OpenAI Introducing GPT-5.4, 2026.03.05)

Tool Search와 Responses API를 활용하는 복잡한 에이전트 파이프라인도 마찬가지입니다. GPT-5.4에서만 지원되며, MCP 기반 에이전트에서 토큰 47% 절감 효과를 직접 누릴 수 있습니다. 또 GPT-5.2가 2026년 6월 5일에 은퇴하는 만큼 어차피 마이그레이션은 필수입니다.

GPT-5.2에 머물러도 되는 경우

단순 분류, 추출, 요약처럼 복잡도가 낮은 고빈도 작업이라면 GPT-5.4의 토큰 효율 개선 효과가 크지 않을 수 있습니다. 입력 단가가 $1.75로 더 싼 GPT-5.2가 오히려 경제적입니다. 단, 6월 5일 이후에는 사용이 불가능해지므로 그전에 GPT-5.4 mini 또는 GPT-5.4 nano로 대체 경로를 검토해두는 것이 안전합니다.

Phase 메타데이터 처리 문제도 있습니다. Responses API로 GPT-5.4를 쓸 때 어시스턴트 메시지의 phase 필드를 대화 히스토리 재구성 시 보존해야 합니다. 이 필드를 제거하면 성능이 크게 저하됩니다. 미들웨어가 메타데이터를 임의로 제거하는 구조라면 마이그레이션 전 수정이 선행돼야 합니다. (출처: nxcode.io GPT-5.4 vs GPT-5.2 가이드, 2026.03.18)

▲ 목차로 돌아가기

Q&A

Q1. GPT-5.4와 GPT-5.4 mini의 차이가 뭔가요?

GPT-5.4는 플래그십 추론 모델로, 입력 $2.50/M, 출력 $15.00/M입니다. GPT-5.4 mini는 코딩, Computer Use, 서브에이전트용 경량 모델로 입력 $0.75/M, 출력 $4.50/M입니다. GPT-5.4 nano는 가장 저렴한 버전으로 입력 $0.20/M, 출력 $1.25/M입니다. 단순 대량 처리 작업이라면 nano, 코딩 서브에이전트라면 mini, 복잡한 추론 작업이라면 GPT-5.4가 적합합니다. (출처: OpenAI API Pricing, 2026.03.05)

Q2. 272K 토큰 초과가 ‘전체 세션 적용’이라는 게 멀티턴 대화에도 해당하나요?

네, 해당 API 요청 기준으로 입력 토큰 합산이 272K를 넘으면 그 요청 전체에 높은 단가가 적용됩니다. 멀티턴 대화에서 이전 대화를 컨텍스트로 쌓는 구조라면 회차가 늘수록 입력 토큰이 누적됩니다. 272K 근처에서는 오래된 대화 기록을 요약·압축하거나 슬라이딩 윈도우 방식으로 컨텍스트를 관리하면 추가 과금을 피할 수 있습니다.

Q3. Computer Use를 쓰려면 어떤 API 엔드포인트를 써야 하나요?

Chat Completions(v1/chat/completions)에서는 Computer Use, Tool Search를 사용할 수 없습니다. Responses API(v1/responses)로 전환해야 합니다. 기존 코드에서 모델명만 교체하는 것은 Chat Completions 기준으로 작동하지만, Computer Use가 포함된 새로운 기능은 Responses API 마이그레이션이 필요합니다. OpenAI 공식 마이그레이션 가이드는 platform.openai.com/docs/guides/migrate-to-responses 에 있습니다.

Q4. Batch API를 쓰면 실제로 얼마나 저렴해지나요?

표준 요금의 정확히 50%입니다. 입력 $1.25/M, 출력 $7.50/M이 됩니다. 즉각적인 응답이 필요 없는 분류, 데이터 처리, 콘텐츠 생성 자동화 작업에서 비용을 절반으로 줄일 수 있습니다. Batch API는 비동기로 처리되며, 결과 반환까지 수 시간이 소요될 수 있습니다. 실시간 서비스보다 오프라인 처리 파이프라인에 적합합니다. (출처: OpenAI Introducing GPT-5.4, 2026.03.05)

Q5. GPT-5.4-pro는 언제 써야 하나요?

▲ 목차로 돌아가기

마치며

솔직히 말하면, 복잡한 에이전트를 운영하는 팀에게 Tool Search와 Computer Use 조합은 비용 절감과 기능 확장을 동시에 가져다줍니다. 반면 단순 요약이나 분류 작업만 하는 팀은 GPT-5.4 nano($0.20/M)나 mini가 더 합리적일 수 있습니다. 모델 선택이 곧 요금 선택입니다.

본 포스팅 참고 자료

① OpenAI 공식 발표 — Introducing GPT-5.4 (openai.com/index/introducing-gpt-5-4/)
② OpenAI API Pricing 공식 페이지 (openai.com/api/pricing/)
③ OpenAI 개발자 문서 — GPT-5.4 모델 스펙 (developers.openai.com/api/docs/models/gpt-5.4)
④ nxcode.io — GPT-5.4 vs GPT-5.2 업그레이드 가이드 (2026.03.18)

본 포스팅 작성 이후 OpenAI 서비스 정책·UI·기능·가격이 변경될 수 있습니다. 최신 정보는 openai.com/api/pricing 공식 페이지에서 확인하세요. 본 포스팅 기준 날짜: 2026.04.01 / 모델 스냅샷: gpt-5.4-2026-03-05

GPT-5.4 API 가격, 공식 수치 4개로 직접 따져봤습니다

GPT-5.4가 뭔지 30초 요약

공식 가격표 전체 — GPT-5.2와 숫자 비교

272K 초과하면 요금이 세션 전체에 적용됩니다

토큰이 비싼데 왜 총비용은 비슷할 수 있나요

ChatGPT 구독자라면 이미 무료로 쓰고 있습니다

실제 비용 계산 — 한국어 기준으로 직접 재봤습니다