GPT-5.4 기준
IT/AI
GPT-5.4 API, 싸다는 말이 맞는 조건이 있습니다
GPT-5.4 API는 모델이 세 개입니다
GPT-5.4라는 이름 뒤에 모델 ID가 세 가지로 나뉩니다. gpt-5.4(표준), gpt-5.4-thinking(추론 강화), gpt-5.4-pro(최고 성능)입니다. 가격도 전부 다르고, ChatGPT 앱에서 접근 가능한 요금제도 각기 다릅니다.
표준판은 API 어디서나 호출 가능하지만, Pro는 ChatGPT Pro($200/월)·Business·Enterprise·Edu 플랜에서만 쓸 수 있습니다. 즉, API에서 gpt-5.4-pro를 직접 호출하는 건 누구나 되지만, ChatGPT 앱 안에서 Pro 모드는 요금제가 잠겨 있습니다. (출처: OpenAI Help Center, 2026.03.31 기준)
GPT-5.4 mini·nano도 2026년 3월 18일 별도 출시됐습니다. nano는 API 전용이고, mini는 ChatGPT 앱에서 ‘GPT-5.4 Thinking mini’로 제공됩니다. 컨텍스트 윈도우는 mini·nano 모두 400K 토큰으로, 본 모델(1,050K)보다 작습니다. (출처: 나무위키 GPT-5 문서, 2026.03.28)
공식 가격표 — 표준·캐시·초장 구간 전부 정리
OpenAI 공식 가격 페이지(openai.com/ko-KR/api/pricing/)에 올라온 수치를 기준으로 정리하면 아래와 같습니다.
| 모델 | 표준 입력 | 캐시 입력 | 표준 출력 | 초장 입력(>272K) |
|---|---|---|---|---|
| GPT-5.4 표준 | $2.50/M | $0.25/M | $15.00/M | $5.00/M |
| GPT-5.4 mini | $0.750/M | $0.075/M | $4.500/M | — |
| GPT-5.4 nano | $0.20/M | $0.02/M | $1.25/M | — |
| GPT-5.4 Pro | $30/M | — | $180/M | — |
출처: OpenAI 공식 가격 페이지 (openai.com/ko-KR/api/pricing/), 2026.03.31 기준
💡 캐시 입력을 쓰면 단가가 10분의 1로 내려갑니다. 시스템 프롬프트처럼 매 요청마다 반복되는 내용은 OpenAI가 자동으로 캐시 처리해 $0.25/M을 적용합니다. 표준 입력($2.50)과 비교하면 90% 절감입니다. 긴 시스템 프롬프트나 공통 컨텍스트를 자주 쓰는 서비스라면 실질 비용이 표면 가격의 절반 이하로 떨어질 수 있습니다.
GPT-5.4 표준 기준으로, GPT-5.4는 이전 버전인 GPT-5.2와 비교해 입력 단가가 약 42.86%, 출력 단가가 약 7.14% 인상됐습니다. (출처: 나무위키 GPT-5 문서, 2026.03.28) 인상폭이 입력 쪽이 훨씬 크다는 점을 감안하면, 입력 토큰이 많은 워크플로에서 캐시 활용 여부가 총 비용을 크게 갈라놓습니다.
272K 넘으면 요금이 두 배가 되는 이유
💡 공식 발표문과 실제 청구 구조를 같이 놓고 보니 이런 차이가 보였습니다. “100만 토큰 컨텍스트 지원”을 강조하지만, 272K를 초과하는 입력분에는 $5.00/M이 적용됩니다. 표준 단가($2.50)의 정확히 두 배입니다.
계산해보면 이렇습니다. 300K 토큰을 입력한다고 할 때, 앞 272K는 $2.50/M으로 $0.68, 나머지 28K는 $5.00/M으로 $0.14, 합계 $0.82입니다. 단순히 300K × $2.50/M = $0.75로 계산했다면 실제 청구액보다 낮게 잡은 겁니다. 차이 자체는 크지 않지만, 대형 문서를 반복적으로 넣는 파이프라인에서는 누적 오차가 늘어납니다.
1M 토큰 전체를 입력할 경우를 계산해보면 더 명확합니다. 앞 272K는 $0.68, 나머지 728K는 $5.00/M으로 $3.64, 합계 $4.32입니다. 반면 272K 이하로 요청을 나눠서 처리하면 1M 토큰 기준 $2.50이 됩니다. 같은 토큰 수를 처리하면서도 요청 방식에 따라 약 1.7배 차이가 납니다. (출처: OpenAI 공식 가격 페이지, 2026.03.31 기준)
초장 입력($5.00/M)에서 출력도 단가가 올라갑니다. 공식 문서에는 272K 초과 시 출력 단가 $22.50/M이 적용된다고 나옵니다. 표준 출력($15.00)보다 50% 비싸집니다. 100만 토큰 컨텍스트를 “왕창 넣자”고 생각했다면, 이 구간 진입 여부를 먼저 따져봐야 합니다.
Thinking 한도 3,000개, 다 쓰면 정말 막힐까요?
ChatGPT Plus·Business 사용자가 GPT-5.4 Thinking을 수동으로 선택하면 주당 최대 3,000개 메시지 한도가 붙습니다. 한도에 도달하면 모델 선택기에서 Thinking 선택이 막힙니다. (출처: OpenAI Help Center, 2026.03.31 기준)
💡 Instant 모드에서 자동으로 Thinking으로 넘어가는 경우는 이 한도에 포함되지 않습니다. GPT-5.3 Instant를 쓰다가 ChatGPT가 판단해 Thinking으로 전환한 응답은 3,000개 카운트에서 빠집니다. 한도를 다 쓴 뒤에도 자동 전환은 계속 작동합니다. 다시 말해, Thinking 모드로 복잡한 질문을 처리하면서도 카운트를 아끼고 싶다면 Instant를 기본값으로 두고 자동 전환에 맡기면 됩니다.
Go 플랜 사용자는 Thinking 기능이 5시간마다 최대 10개 메시지로 제한됩니다. Plus(주 3,000개)와 비교하면 훨씬 빠듯합니다. 코딩이나 복잡한 분석을 Thinking으로 자주 쓰는 편이라면 요금제 차이가 체감으로 납니다.
GPT-5.4 Thinking에는 생각 시간 레벨도 4단계로 나뉩니다. Standard(기본), Extended(이전 Plus 기본), Light(빠름), Heavy(깊은 추론)입니다. Light·Heavy는 Pro 플랜 전용입니다. 한 번 레벨을 바꾸면 다음에 바꾸기 전까지 해당 설정이 유지됩니다. 이 설정은 ChatGPT 웹 전용이며 모바일과 동기화되지 않습니다.
GPT-5.4 Pro는 앱에서 쓰면 기능이 빠집니다
⚠️ ChatGPT 앱에서 GPT-5.4 Pro를 선택하면 Apps·메모리·캔버스·이미지 생성이 전부 꺼집니다. 가장 비싼 모드인데 오히려 쓸 수 있는 도구가 가장 적습니다. (출처: OpenAI Help Center, 2026.03.31 기준)
GPT-5.4 Pro를 ChatGPT 안에서 쓰는 건 “고난도 추론 전용 채널”로 설계된 겁니다. 이미지를 만들거나 메모리를 활용해야 하는 작업이라면 Pro가 아닌 Thinking 또는 Instant로 돌아와야 합니다. 반면 API로 gpt-5.4-pro를 직접 호출하면 이런 제약이 없습니다. API와 앱 사이의 경험 차이가 꽤 큽니다.
개인적으로 이 부분이 좀 아쉬웠습니다. Pro 플랜 $200을 내고도 이미지 생성이나 메모리를 동시에 못 쓴다는 건, Pro 모드를 선택하는 시점을 사용자가 명확히 판단해야 한다는 의미입니다. “Pro를 켜 두고 다 되는 것처럼 쓰다가 이미지가 안 만들어진다”는 혼선이 생기기 딱 좋은 구조입니다.
경쟁 모델 가격과 직접 비교해봤습니다
GPT-5.4 표준, Claude Opus 4.6, Gemini 3.1 Pro Preview 세 모델의 API 가격을 같은 기준으로 놓고 보면 차이가 바로 보입니다.
| 모델 | 입력 /1M | 출력 /1M | 비고 |
|---|---|---|---|
| GPT-5.4 표준 | $2.50 | $15.00 | 272K 초과 시 $5.00/$22.50 |
| GPT-5.4 Pro | $30.00 | $180.00 | 장시간 워크플로 전용 |
| Claude Opus 4.6 | $5.00 | $25.00 | 출력 상한 128K 강점 |
| Gemini 3.1 Pro Preview | $2.00 | $12.00 | 200K 초과 시 $4.00/$18.00 |
출처: OpenAI 공식 가격 페이지, Data Studios 비교 리포트 (2026.03.22), Anthropic API 문서
GPT-5.4 Pro는 입력 기준으로 Gemini보다 15배, Claude Opus 4.6보다 6배 비쌉니다. 출력 기준은 Gemini 대비 15배, Claude 대비 7.2배 높습니다. 이 숫자만 보면 납득이 안 가는 게 당연합니다. 그러나 Reddit에서 실제 사용자들이 지적한 것처럼, Pro 모델은 복잡한 추론 작업에서 재시도 횟수를 줄여주는 효과가 있어 “토큰당 단가”보다 “작업당 총비용”으로 봐야 맞습니다. (출처: r/OpenAI, 2026.03.06)
GPT-5.4 표준은 Gemini 3.1 Pro Preview보다 입력 단가가 25% 비싸고 출력이 25% 비쌉니다. 절대 금액 차이는 크지 않으니 벤치마크 성능 차이(GDPval 83.0% vs 미공개)나 컴퓨터 제어 기능(OSWorld 75.0%)을 활용할 수 있다면 GPT-5.4 표준이 오히려 합리적일 수 있습니다. 이 판단은 사용 목적에 따라 완전히 달라집니다.
자주 나오는 질문 5가지
마치며 — 비싸다고 말하기 전에 조건을 먼저 봐야 합니다
GPT-5.4 API를 처음 봤을 때 “$15 출력”이라는 숫자가 걸린다면 당연한 반응입니다. 그런데 직접 정리해보니 상황이 다릅니다. 캐시 입력을 적극적으로 쓰면 단가가 10분의 1까지 내려가고, Batch API를 활용하면 추가로 50% 절감됩니다. 반면 272K 토큰을 넘기는 순간 단가가 두 배로 오르는 구간이 숨어 있습니다. 이 구간을 모르고 설계하면 예상 비용과 실제 청구액이 크게 달라집니다.
ChatGPT 앱에서 Pro 모드를 켜면 메모리와 이미지 생성이 꺼지는 것도 직접 확인해보기 전엔 몰랐던 부분입니다. 가장 비싼 모드가 앱 기능 면에서 가장 제한적이라는 건, Pro를 쓸 때 작업 성격을 미리 분리해둬야 한다는 의미입니다. 이 점은 기존에 퍼진 GPT-5.4 소개 글 어디에도 제대로 다뤄지지 않았습니다.
결국 GPT-5.4 API가 싸냐 비싸냐는 질문보다, 어떤 구간에서 어떤 모드로 쓰느냐가 훨씬 중요합니다. 캐시·Batch·구간 분할을 전략적으로 조합하면 표면 단가보다 실제 비용을 크게 낮출 수 있습니다. 그 조건이 맞는다면, GPT-5.4 표준은 경쟁 모델 대비 나쁜 선택지가 아닙니다.
본 포스팅 참고 자료
- OpenAI 공식 API 가격 페이지 — openai.com/ko-KR/api/pricing/
- OpenAI Help Center — GPT-5.3 and GPT-5.4 in ChatGPT
- 나무위키 GPT-5 문서 (2026.03.28 기준)
- Data Studios — GPT-5.4 Pro vs Claude Opus 4.6 vs Gemini 3 Pro 비교 리포트 (2026.03.22)
- Reddit r/OpenAI — GPT-5.4 Pro API 가격 실사용 토론 (2026.03.06)
본 포스팅 작성 이후 서비스 정책·UI·가격·기능이 변경될 수 있습니다. 최신 정보는 반드시 OpenAI 공식 사이트에서 직접 확인하시기 바랍니다. 본문 내 수치는 2026년 3월 31일 기준 공식 문서 기준이며, IT/AI 서비스 특성상 업데이트로 달라질 수 있습니다.











댓글 남기기