OpenAI 공식 가격표 확인
GPT-5.4 API 요금, 싸진다고요?
이 수치 먼저 보세요
“토큰 효율 47% 향상”이라는 말만 보면 GPT-5.4 API가 전작보다 저렴해 보입니다. 그런데 막상 공식 가격표를 열어보면 이야기가 달라집니다. 입력 토큰 단가가 올랐고, 272K 토큰을 넘는 순간 요금 구조가 통째로 바뀝니다. Tool Search도 설정을 잘못하면 오히려 토큰이 늘어납니다. GPT-5.4 API 요금의 실제 구조를 공식 수치로 직접 확인해봤습니다.
GPT-5.4 API 요금, 진짜 GPT-5.2보다 싼가요?
OpenAI는 GPT-5.4 발표문에서 “GPT-5.2보다 토큰 효율이 향상됐다”고 강조했습니다. 그 말 자체는 사실이지만, 토큰당 단가가 함께 올랐다는 부분은 작게 묻혀 있습니다. 공식 가격표(OpenAI API Pricing)를 직접 열면 이렇습니다.
| 모델 | 입력 /1M 토큰 | 캐시 입력 | 출력 /1M 토큰 |
|---|---|---|---|
| gpt-5.2 | $1.75 | $0.175 | $14.00 |
| gpt-5.4 | $2.50 (+43%) | $0.25 | $15.00 (+7%) |
| gpt-5.2-pro | $21.00 | — | $168.00 |
| gpt-5.4-pro | $30.00 (+43%) | — | $180.00 (+7%) |
입력 단가 기준으로 gpt-5.4는 gpt-5.2보다 43% 올랐습니다. 출력은 7% 인상입니다. OpenAI는 “47% 적은 토큰으로 같은 작업을 처리할 수 있다”고 밝혔는데, 이것이 사실이라면 총 비용이 줄어들 수도 있습니다. 하지만 이 47%는 MCP-Atlas 250개 도구 환경을 기준으로 한 수치입니다. 즉, 도구가 많은 에이전트 워크플로우에서나 현실적으로 체감 가능한 수치이고, 단순 텍스트 생성·요약·QA 작업에서는 다른 이야기입니다.
💡 공식 발표문과 가격표를 함께 놓고 보면 이런 차이가 보입니다 — 47% 효율 향상은 “도구를 250개 연결한 에이전트” 시나리오에서 측정된 수치입니다. 단순 대화 API 호출에서는 확인된 수치가 없습니다.
(출처: OpenAI GPT-5.4 공식 발표문, 2026.03.05)
272K 토큰이 왜 중요한가 — 요금이 두 배로 뛰는 지점
“입력 토큰이 272K를 초과하는 프롬프트는 해당 세션 전체에 대해 입력 2배, 출력 1.5배 요금이 적용됩니다. 이는 표준, 배치, 플렉스 처리 모두에 해당합니다.”
(출처: OpenAI API Pricing 공식 문서, 2026.03.05 기준)
이걸 숫자로 치환하면 이렇습니다. 272K 이하 세션: 입력 $2.50/1M, 출력 $15.00/1M. 272K 초과 세션: 입력 $5.00/1M, 출력 $22.50/1M입니다. “세션 전체”라는 표현이 핵심입니다. 즉, 프롬프트 길이가 272K를 조금이라도 넘는 순간 그 세션의 모든 토큰에 할증 요금이 붙습니다. “1백만 토큰 컨텍스트”라는 마케팅 문구가 매력적으로 들리는 이유가 있는데, 실제로는 긴 문서를 넣을수록 요금이 급격히 달라진다는 점을 인지하고 있어야 합니다.
| 시나리오 | 입력 단가 | 출력 단가 | 비고 |
|---|---|---|---|
| 짧은 프롬프트 (272K 이하) | $2.50/1M | $15.00/1M | 일반 QA, 요약 |
| 긴 문서 (272K 초과) | $5.00/1M (2배) | $22.50/1M (1.5배) | 전체 책·코드베이스 분석 |
| GPT-5.2 (128K 상한) | $1.75/1M | $14.00/1M | 할증 없음 |
코드베이스 전체를 한 번에 분석하거나 긴 법률 문서를 처리하는 워크플로우를 구성하고 있다면, 272K 한계선을 먼저 계산에 포함해야 합니다. 그 선을 넘으면 gpt-5.4가 gpt-5.2보다 입력 토큰당 2.86배 비싸지는 구간이 생깁니다.
Tool Search가 토큰을 줄여준다는데, 조건이 있습니다
Tool Search가 효과적인 조건 (공식 문서 기준)
- 도구가 네임스페이스 또는 MCP 서버로 묶여 있을 것 — 개별 함수에 거는 것보다 절감이 더 크다고 명시
- 각 네임스페이스는 함수 10개 이하로 구성하는 것이 토큰 효율과 모델 성능 면에서 최적
- 연결된 도구 총 수가 많을수록(실험 기준: 250개 MCP 도구) 효과가 크게 나타남
막상 써보면 이 단계에서 걸립니다. defer_loading: true를 개별 함수에 설정하면 함수의 파라미터 스키마만 지연 로딩됩니다. 함수 이름과 설명은 여전히 컨텍스트 초반에 포함됩니다. 다시 말해, 함수가 5~6개 정도인 소규모 워크플로우에서는 Tool Search를 추가해도 거의 의미 없는 절감이 나타날 수 있습니다.
더 나아가 Tool Search를 활성화하면 모델이 도구를 로드할 때 tool_search_call과 tool_search_output이라는 두 가지 응답 아이템이 추가됩니다. 이 래퍼 자체도 토큰을 소비합니다. 도구 수가 적고 단순한 경우, Tool Search 오버헤드가 절감된 스키마 토큰보다 클 수도 있습니다. 절감 효과는 대규모 MCP 서버를 운용하는 환경에서 가장 현실적으로 발생합니다.
표준 모델이 Pro보다 벤치마크 점수가 높은 이유
| 벤치마크 | gpt-5.4 (표준) | gpt-5.4-pro | gpt-5.2-pro |
|---|---|---|---|
| GDPval (지식 업무) | 83.0% | 82.0% | 74.1% |
| BrowseComp (웹 탐색) | 82.7% | 89.3% | 77.9% |
| ARC-AGI-2 | 73.3% | 83.3% | 54.2% |
| SWE-Bench Pro (코딩) | 57.7% | — | — |
💡 발표문 수치와 요금표를 같이 놓고 보니 이게 보였습니다 — GDPval 벤치마크에서 $30/1M인 gpt-5.4-pro(82.0%)가 $2.50/1M인 gpt-5.4 표준(83.0%)보다 점수가 낮습니다. 즉, “일반 업무”를 뜻하는 지식 노동 작업에서는 12배 더 비싼 Pro를 쓸 이유가 수치상 없습니다.
(출처: OpenAI GPT-5.4 공식 발표문 벤치마크 표, 2026.03.05)
이게 이상하게 느껴지는 건 당연합니다. Pro가 표준보다 왜 GDPval에서 낮냐고요. OpenAI의 설명에 따르면 Pro는 “더 깊이 사고(thinking)하도록 설계”됐기 때문에 빠른 의사결정이나 일반 지식 노동보다는 복잡한 수학·과학·심층 웹 탐색에서 차별화됩니다. 실제로 BrowseComp(+6.6%p)와 ARC-AGI-2(+10.0%p)에서 Pro가 의미 있게 앞섭니다. 즉, Pro를 써야 하는 이유는 “더 어렵고 깊은 추론”이지, “일반 업무 처리 속도나 정확도”가 아닙니다.
GPT-5.4 Pro — 누구를 위한 가격인가
Reddit의 “/r/OpenAI 토론(2026.03.06)”에서 가장 많이 업보트를 받은 의견은 “대기업과 연구 기관이 대상이고, 대부분의 개발자에게는 해당 없다”였습니다. 이 맥락을 수치로 정리해보면 이렇습니다.
한 가지 더 있습니다. gpt-5.4-pro에는 272K 초과 할증도 마찬가지로 적용됩니다. 즉, 272K를 넘으면 입력 단가가 $60/1M, 출력 $270/1M이 됩니다. (출처: OpenAI 공식 가격 문서, 2026.03.05 기준) 이 구간은 금융 모델링이나 법률 문서 분석처럼 “한 번에 긴 문서를 통째로 분석해야 하는” 작업이 자주 발생하는 영역입니다. 그 분야에서도 272K 경계를 인지하고 청킹 전략을 세우는 게 Pro API 비용 관리의 핵심 포인트입니다.
실계산: 시나리오별 GPT-5.2 vs GPT-5.4 비용 비교
직접 계산해볼 수 있는 형태로 세 가지 시나리오를 정리했습니다. 입력 토큰 1,000만 개(10M), 출력 토큰 200만 개(2M) 기준으로 GPT-5.2와 GPT-5.4를 비교합니다.
비용 = (입력 토큰 수 ÷ 1,000,000) × 입력 단가 + (출력 토큰 수 ÷ 1,000,000) × 출력 단가
시나리오 A — 단순 QA/요약 (272K 이하 세션, 10M 입력 + 2M 출력)
| 모델 | 입력 비용 | 출력 비용 | 합계 |
|---|---|---|---|
| gpt-5.2 | $17.50 | $28.00 | $45.50 |
| gpt-5.4 | $25.00 | $30.00 | $55.00 |
→ 272K 이하 단순 작업에서는 gpt-5.4가 약 21% 더 비쌉니다. 47% 효율 향상이 이 작업에 적용되지 않는 경우라면 전환 시 비용이 오릅니다.
시나리오 B — 긴 문서 분석 (272K 초과 세션, 300K 입력 + 20K 출력)
| 모델 | 입력 단가 | 입력 비용 | 출력 비용 | 합계 |
|---|---|---|---|---|
| gpt-5.2 (128K 상한) | 불가 | — | — | 처리 불가 |
| gpt-5.4 (할증 적용) | $5.00/1M | $1.50 | $0.45 | $1.95 |
→ gpt-5.2로는 처리 자체가 불가능한 300K 토큰 문서라면 gpt-5.4만 선택지가 됩니다. 이 구간에서는 할증이 붙어도 gpt-5.4 외에 대안이 없습니다.
시나리오 C — 대규모 에이전트 (MCP 도구 100개 이상, Tool Search 활용)
이 경우 Tool Search의 47% 절감 효과가 현실적으로 반영될 수 있습니다. 100개 이상의 도구 스키마를 매 요청마다 컨텍스트에 올리던 기존 방식 대비, 필요한 도구만 동적으로 로딩하면 입력 토큰이 크게 줄어듭니다. OpenAI는 250개 MCP 도구 기준 실험에서 47%를 확인했으므로, 도구 수가 많을수록 절감 폭이 커지고 gpt-5.4로의 전환이 비용 측면에서 유리해지는 교차점이 존재합니다. 단, 이 시나리오에서는 Tool Search 코드 수정 작업이 선행돼야 한다는 점이 전환 비용입니다.
자주 묻는 질문
GPT-5.4 API와 ChatGPT Plus 요금은 같은 건가요?
다릅니다. ChatGPT Plus($20/월)나 Pro($200/월)는 채팅 인터페이스 구독 요금으로, 사용량 제한 내에서 GPT-5.4 또는 GPT-5.4 Thinking을 쓸 수 있습니다. API 요금은 토큰 사용량에 따라 과금되는 별도 채널입니다. 앱이나 서비스에 GPT-5.4를 연결하려면 API 키와 별도 결제가 필요합니다.
272K 토큰 초과 할증은 어떻게 계산되나요?
입력 프롬프트가 272K 토큰을 넘는 순간, 그 세션 전체의 입력 단가가 $2.50 → $5.00으로, 출력이 $15.00 → $22.50으로 올라갑니다. 예를 들어 300K 토큰 입력, 20K 출력 세션은 입력 $1.50 + 출력 $0.45 = 총 $1.95가 됩니다. (출처: OpenAI 공식 가격 문서, 2026.03.05)
Tool Search를 쓰면 무조건 비용이 줄어드나요?
아닙니다. Tool Search는 도구 수가 많을수록 효과가 큽니다. 공식 문서는 MCP 서버나 네임스페이스 방식이 더 효율적이고, 함수가 10개 미만인 소규모 환경에서는 절감 효과가 미미하거나 Tool Search 자체의 오버헤드로 오히려 토큰이 늘 수도 있다고 명시합니다.
gpt-5.4-pro는 gpt-5.4보다 모든 면에서 더 좋은가요?
그렇지 않습니다. OpenAI 공식 벤치마크에서 GDPval(일반 지식 노동) 기준으로 gpt-5.4 표준이 83.0%, gpt-5.4-pro가 82.0%입니다. Pro는 웹 탐색(BrowseComp 89.3% vs 82.7%), 수학·추론(ARC-AGI-2 83.3% vs 73.3%)에서 우위를 보입니다. 즉, 심층 추론이 필요한 영역에서만 Pro가 가격 차이를 정당화할 수 있습니다.
캐시 입력 기능으로 비용을 줄일 수 있나요?
네. gpt-5.4의 캐시 입력 단가는 $0.25/1M으로 일반 입력의 10분의 1입니다. 시스템 프롬프트나 고정된 컨텍스트가 길다면 캐싱을 적극 활용하는 게 비용 절감에 효과적입니다. 단, gpt-5.4-pro는 캐시 입력이 현재 지원되지 않습니다. (출처: OpenAI 공식 가격 문서, 2026.03.05)
마치며
반면, 단순 QA·요약·번역처럼 짧고 반복적인 작업이 대부분이라면 GPT-5.4로의 전환이 현재 구조에서는 비용 인상을 의미합니다. 특히 272K 토큰 할증 구간은 미리 알지 못하면 청구서를 보고 나서야 인식하게 되는 함정이라, API를 프로덕션에 연결하기 전에 요금 구조를 한 번 직접 확인하는 게 필요합니다. 이 글에서 정리한 수치는 모두 OpenAI 공식 문서에서 직접 확인한 것들이니, 아래 참고 자료 링크로 직접 검증해보실 수 있습니다.
본 포스팅 참고 자료
- OpenAI GPT-5.4 공식 발표문 — https://openai.com/ko-KR/index/introducing-gpt-5-4/ (2026.03.05)
- OpenAI API 공식 가격표 — https://developers.openai.com/api/docs/pricing/ (2026.03.05 기준)
- OpenAI Tool Search 공식 가이드 — https://developers.openai.com/api/docs/guides/tools-tool-search
- TechCrunch: OpenAI launches GPT-5.4 with Pro and Thinking versions — techcrunch.com (2026.03.05)
⚠️ 본 포스팅 작성 이후 OpenAI의 서비스 정책·가격·UI·기능이 변경될 수 있습니다. 모든 수치는 2026년 3월 5일 공식 발표 및 가격 문서 기준이며, 최신 정보는 OpenAI 공식 페이지에서 직접 확인하시기 바랍니다.


댓글 남기기