GPT-5.2 / GPT-5.4 기준
OpenAI 공식 문서 검증
GPT-5.2 API 가격, 싸다고 골랐다가 비쌌습니다
결론부터 말씀드리면, 가격표만 보고 GPT-5.2를 고르면 특정 조건에서 실제 청구 금액이 GPT-5.4보다 커집니다. 추론 모드 설정 한 줄이 비용을 25배 이상 바꿉니다. 직접 계산한 수치와 OpenAI 공식 문서를 같이 놓고 확인해봤습니다.
GPT-5.2 API 가격 — 공식 수치 그대로
GPT-5.2의 API 가격은 OpenAI 공식 문서 기준(2026.03.23 검증)으로 입력 $1.75/1M 토큰, 출력 $14.00/1M 토큰입니다. 캐시된 입력은 $0.175/1M으로 정가 대비 90% 할인이 적용됩니다. (출처: OpenAI 공식 가격 문서)
| 모델 | 입력 /1M | 캐시 입력 /1M | 출력 /1M | 컨텍스트 윈도우 |
|---|---|---|---|---|
| GPT-5.2 | $1.75 | $0.175 | $14.00 | 400K |
| GPT-5.4 | $2.50 | $0.25 | $15.00 | 272K~1M |
| GPT-5.4-mini | $0.75 | $0.075 | $4.50 | — |
| GPT-5.4-nano | $0.20 | $0.02 | $1.25 | — |
출처: OpenAI 공식 API 가격 문서(developers.openai.com/api/docs/pricing), 2026.03.23 기준
가격표만 보면 GPT-5.2가 GPT-5.4보다 입력은 30% 저렴하고 출력은 약 7% 저렴합니다. 토큰 단가만 놓고 보면 명백히 GPT-5.2가 이깁니다. 근데 여기서부터가 문제입니다.
💡 공식 가격표와 실제 청구서를 나란히 놓고 보니, 가격 차이를 결정하는 건 모델이 아니라 추론 모드(reasoning effort)였습니다.
추론 모드가 가격을 바꾸는 구조
GPT-5.2 API는 추론 깊이를 none → low → medium → high → xhigh 다섯 단계로 조절할 수 있습니다. 기본값은 none입니다.
OpenAI 커뮤니티에서 실측한 결과(lineage-64 기준, 2026.01.29), GPT-5.2가 한 번의 요청으로 생성한 출력 토큰 수는 추론 모드에 따라 이렇게 달라집니다. (출처: OpenAI 커뮤니티 실측 데이터)
| 추론 모드 | 평균 출력 토큰 (lineage-64) | 출력 비용(1회 요청 기준) | none 대비 배수 |
|---|---|---|---|
none (기본) |
약 200~400 | 약 $0.004~$0.006 | ×1 |
low |
938 | $0.013 | ×2~4 |
medium |
2,181 | $0.031 | ×5~10 |
high |
2,070 | $0.029 | ×5~10 |
xhigh |
4,609 | $0.065 | ×15~25+ |
출처: OpenAI 커뮤니티 sszymczy 실측(lineage-bench, 2026.01.29) / 비용 계산: 출력 토큰 × $14/1M
xhigh를 켜면 none 대비 출력 토큰이 10~25배 이상 늘어납니다. 출력 단가가 $14/1M이므로, 토큰이 늘어난 만큼 비용이 직선으로 올라갑니다. 복잡한 추론 작업에서 xhigh를 무심코 설정하면 none 대비 청구액이 20배가 넘는 경우가 생깁니다.
OpenAI 공식 가이드 역시 “기본값인 none에서 시작해, 평가 결과가 나빠질 때만 단계를 올릴 것”이라고 명시하고 있습니다. (출처: OpenAI 최신 모델 가이드)
💡 추론 단가를 높이지 않아도, 추론 모드를 올리는 것만으로 GPT-5.2가 GPT-5.4보다 훨씬 비싼 작업이 됩니다.
GPT-5.4가 실제로 더 저렴해지는 조건
GPT-5.4는 복잡한 작업에서 출력 토큰을 GPT-5.2 대비 47% 줄이는 효율 개선이 적용됐습니다. (출처: nxcode.io GPT-5.4 vs GPT-5.2 비교, 2026.03)
이 수치를 실제 비용 계산에 집어넣으면 결과가 달라집니다. 직접 역산해봤습니다.
▸ GPT-5.2
입력: 10,000 × $1.75/1M = $0.0175
출력: 2,000 × $14.00/1M = $0.028
합계: $0.0455
▸ GPT-5.4 (출력 47% 감소 적용 시: 2,000 → 1,060 토큰)
입력: 10,000 × $2.50/1M = $0.025
출력: 1,060 × $15.00/1M = $0.0159
합계: $0.0409
→ 출력이 많은 복잡한 작업에서는 GPT-5.4가 오히려 10% 저렴.
출력 토큰이 많아질수록 이 격차는 벌어집니다. 출력이 입력의 40~50% 이상을 차지하는 복잡한 코딩·문서 생성·에이전트 워크플로우에서는 GPT-5.4가 GPT-5.2보다 실제 청구 금액이 낮아집니다.
반대로, 출력이 짧은 분류·추출·요약 작업처럼 입력 대비 출력 비중이 낮은 경우에는 GPT-5.2의 낮은 입력 단가 이점이 살아납니다.
Batch API를 쓰면 교차점이 달라집니다
OpenAI의 Batch API를 사용하면 입력·출력 모두 50% 할인이 적용됩니다. 24시간 이내 처리 보장이 조건이지만, 실시간 응답이 필요 없는 배치 작업에서는 매우 유효한 선택지입니다. (출처: OpenAI 공식 가격 문서)
Batch API를 적용하면 두 모델의 유효 단가가 이렇게 바뀝니다.
| 조건 | GPT-5.2 입력 /1M | GPT-5.2 출력 /1M | GPT-5.4 입력 /1M | GPT-5.4 출력 /1M |
|---|---|---|---|---|
| 일반(Standard) | $1.75 | $14.00 | $2.50 | $15.00 |
| Batch API (50% 할인) | $0.875 | $7.00 | $1.25 | $7.50 |
출처: OpenAI 공식 가격 문서(2026.03.26 기준)
Batch API 조건에서 GPT-5.4의 입력 단가는 $1.25/1M이 됩니다. GPT-5.2 일반 단가($1.75)보다도 저렴합니다. 즉, Batch API를 쓰는 프로젝트라면 GPT-5.4를 골라야 비용이 낮아질 가능성이 높습니다.
💡 공식 Batch API 할인율(50%)과 GPT-5.4의 토큰 효율 개선(47%)을 같이 놓고 보니, GPT-5.2를 고르는 것이 유리한 구간이 생각보다 좁습니다.
medium/high 모드의 성능이 오히려 더 낮은 이유
GPT-5.2의 medium·high 추론 모드는 비용이 더 많이 나오는데, 성능은 오히려 GPT-5.1의 low 모드보다도 낮게 나오는 경우가 있습니다. 써보니까 이게 제일 당황스러운 부분이었습니다.
실측 벤치마크(lineage-bench, 2026.01.29)에서 GPT-5.2 high 모드가 GPT-5.1 medium보다 낮은 점수를 받은 사례가 확인됐습니다. OpenAI 커뮤니티에서 이 결과를 공개하자, OpenAI 고객지원이 공식적으로 이유를 설명했습니다.
OpenAI 고객지원 공식 답변 (2026.02):
“GPT-5.1은 고정된 추론 깊이를 유지해 장거리 논리 체인에 강합니다. GPT-5.2는 작업 난이도에 따라 추론 예산을 동적으로 배분하는 구조로 바뀌었습니다. 이 때문에 long-horizon 추론 작업에서 xhigh가 아닌 모드는 안정성이 떨어질 수 있습니다.”
(출처: OpenAI 커뮤니티 공식 답변, community.openai.com, 2026.02)
실제 수치를 보면 GPT-5.2의 high 모드는 lineage-128 테스트에서 0.150점으로, GPT-5.1의 low 모드(0.325점)의 절반에도 미치지 못했습니다. 비용은 더 내는데 성능은 떨어지는 구간이 실재합니다.
이 문제를 피하는 방법은 간단합니다. GPT-5.2를 쓴다면 none 또는 xhigh, 둘 중 하나만 선택하는 것입니다. medium·high는 비용과 성능 양쪽 모두 어중간한 구간에 해당합니다.
GPT-5.2를 써도 되는 딱 세 가지 상황
그럼 GPT-5.2는 쓸 가치가 없는 걸까요? 아닙니다. 세 가지 조건에서는 GPT-5.2가 여전히 합리적인 선택입니다.
컨텍스트가 400K 이하이고 출력이 짧은 작업
분류·추출·단문 요약처럼 출력이 500~1,000 토큰 수준인 경우, 입력 단가 이점($1.75 vs $2.50)이 유효합니다.
Computer Use·Tool Search가 필요 없는 경우
화면 자동화, 대규모 도구 검색이 필요 없다면 GPT-5.4 전용 기능에 돈을 낼 이유가 없습니다.
기존 GPT-5.2 코드베이스를 당장 바꿀 수 없는 경우
2026년 6월 5일 전까지는 GPT-5.2 Thinking이 유지되므로, 마이그레이션 일정을 잡을 시간은 있습니다.
단, 위 세 가지 중 하나도 해당하지 않는다면, 지금 당장 GPT-5.4로 전환하는 쪽이 장기 비용 면에서 유리합니다. GPT-5.2 Thinking은 2026년 6월 5일부로 서비스가 종료됩니다. (출처: nxcode.io, 2026.03)
⚠️ GPT-5.2 → GPT-5.4 마이그레이션 시 주의 사항: Responses API로 이전할 경우, 어시스턴트 메시지의 phase 필드를 보존하지 않으면 성능이 크게 저하됩니다. Chat Completions API는 그냥 모델명만 바꿔도 작동하지만, Computer Use·Tool Search는 Responses API로만 사용 가능합니다.
Q&A
마치며
GPT-5.2 API 가격만 보면 분명히 싸 보입니다. 근데 막상 추론 모드를 올리거나 출력이 많은 작업에 쓰면, 청구서가 기대와 다르게 나옵니다. 직접 계산해보니 GPT-5.4가 총비용 기준으로 더 저렴해지는 구간이 생각보다 흔했습니다.
정리하면, 모델 선택의 기준을 ‘입력 단가’에서 ‘작업당 실제 출력 토큰 수’로 옮기는 것이 핵심입니다. medium·high 추론 모드는 GPT-5.2에서 비용 대비 성능이 가장 나쁜 구간이었고, 그 사실이 공식 커뮤니티 실측으로 확인됐습니다. xhigh가 필요한 작업이라면 차라리 GPT-5.4를 쓰는 편이 낫고, none으로 충분한 작업이라면 GPT-5.2로도 문제없습니다.
GPT-5.2 Thinking 종료(2026년 6월 5일)까지 시간이 많지 않습니다. 지금 당장 모델명 하나 바꿔서 같은 작업에 GPT-5.4를 테스트해보는 게 가장 빠른 확인 방법입니다.
본 포스팅 참고 자료
- OpenAI 공식 API 가격 문서 — developers.openai.com/api/docs/pricing/
- OpenAI 최신 모델 가이드 (추론 모드 공식 권장 사항) — developers.openai.com/api/docs/guides/latest-model
- GPT-5.4 vs GPT-5.2 비교 가이드 (nxcode.io, 2026.03) — nxcode.io
- GPT-5.2 API 가이드 및 비용 계산 예시 (evolink.ai, 2026.03.23) — evolink.ai
- GPT-5.2 medium/high 추론 성능 실측 — OpenAI 커뮤니티, 2026.01.29
- GPT-5.2 모델 단가 추적 (pricepertoken.com, 2026.03.22) — pricepertoken.com
※ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. OpenAI API 가격 및 모델 스펙은 공식 문서(developers.openai.com)에서 최신 정보를 확인하시기 바랍니다. 본 포스팅에 포함된 비용 계산은 공식 단가를 기반으로 한 추정값이며, 실제 청구 금액은 사용 패턴에 따라 달라집니다.











댓글 남기기