ChatGPT GPT-5.4 기준
OpenAI 공식 문서 확인
GPT-5.4 Thinking, 수동 선택만 한도 줄어듭니다
ChatGPT Plus 기준 주당 3,000개라는 숫자만 봤을 때는 “넉넉하겠지”라고 느끼기 쉽습니다. 그런데 정작 어떤 사용이 카운트되고 어떤 사용은 빠지는지, 한도에 걸리면 실제로 무슨 일이 생기는지를 정리한 글은 거의 없었습니다. OpenAI 공식 도움말을 직접 뜯어봤습니다.
GPT-5.4 Thinking 한도, 숫자부터 짚고 가겠습니다
GPT-5.4는 2026년 3월 5일 공식 출시된 OpenAI의 최신 메인라인 모델입니다. ChatGPT 모델 선택기에서 Instant, Thinking, Pro 세 가지로 나뉘는데, 이 중 GPT-5.4 Thinking이 Plus·Business 플랜에서 쓸 수 있는 추론 특화 옵션입니다. (출처: OpenAI 공식 Help Center, 2026.03.25 기준)
플랜별 한도를 표로 정리하면 아래와 같습니다.
| 요금제 | Thinking 사용 가능? | 주간 한도 | 한도 초과 시 |
|---|---|---|---|
| Free | △ mini만 | — | — |
| Go | O (+메뉴) | 5시간당 10개 | mini 대체 |
| Plus | O (수동 선택) | 주 3,000개 | mini로 폴백 |
| Business | O (수동 선택) | 주 3,000개 | mini로 폴백 |
| Pro ($200/월) | O (Pro 5.4) | 무제한* | 가드레일 조건 |
* 오남용 방지 가드레일 적용 | 출처: OpenAI Help Center, 2026.03.25 기준
Plus 기준 주당 3,000개라는 숫자는 하루 약 428개입니다. 일반적인 사용 패턴에서는 소진하기 어려운 수준이지만, 어떤 상황에서 이 카운트가 소비되지 않는지를 알면 훨씬 효율적으로 쓸 수 있습니다.
Auto 전환은 한도에 안 잡힙니다 — 공식 문서 확인
GPT-5.4 Thinking을 모델 선택기에서 수동으로 고른 경우만 주간 3,000개 한도에 포함됩니다. 즉, 모델 선택을 Instant(5.3)로 놔둔 채 ChatGPT가 복잡한 질문을 판단해서 알아서 Thinking으로 전환한 요청은 카운트에 잡히지 않습니다.
💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다
“GPT-5.3 Instant에서 GPT-5.4 Thinking으로의 자동 전환은 이 주간 한도에 포함되지 않으며, 한도에 도달한 뒤에도 ChatGPT가 GPT-5.4 Thinking으로 전환할 수 있습니다.”
(출처: OpenAI Help Center — ChatGPT의 GPT-5.3 및 GPT-5.4, 2026.03.25)
실제로 이 구조를 그림으로 풀면 이렇습니다.
🔀 사용 시나리오별 한도 포함 여부
- 카운트 O: 모델 선택기에서 직접 “Thinking” 클릭 → 질문 전송
- 카운트 X: “Instant” 선택 상태에서 ChatGPT가 자동으로 Thinking 사용
- 카운트 X: 주간 한도 도달 후에도 Auto 라우팅으로 Thinking이 쓰인 경우
매번 수동으로 Thinking을 고르는 분들은 주간 한도를 직접 소진하고 있는 것이고, 그냥 Instant 두고 쓰는 분들은 Thinking을 써도 한도가 안 줄어듭니다. 어떤 방식이 유리한지는 사용 목적에 따라 다르지만, 이 차이를 모르면 전략적으로 쓰기 어렵습니다.
한도 초과 후 실제로 일어나는 일
GPT-5.4 Thinking 주간 한도에 도달하면 팝업 알림이 뜨고, Thinking이 모델 선택기에서 선택 불가능 상태로 바뀝니다. 여기까지는 많이 알려진 내용입니다. 그런데 2026년 3월 18일 추가된 GPT-5.4 mini 출시로 상황이 달라졌습니다.
💡 한도 초과 = 완전 차단이 아닙니다
OpenAI 모델 릴리스 노트(2026.03.18)에는 이렇게 나옵니다: “Plus, Pro 및 기타 유료 사용자의 경우, 요청 한도에 도달하면 GPT-5.4 Thinking의 대체로 GPT-5.4 mini가 사용되어 사용량이 많은 상황에서도 추론 기능에 계속 접근할 수 있도록 돕습니다.”
(출처: OpenAI 모델 출시 노트, 2026.03.18)
추론(Thinking) 기능이 완전히 잠기는 게 아니라, mini 버전으로 강등되는 구조입니다. 한도를 다 쓰더라도 추론 없이 Instant만 쓰게 되는 건 아니라는 점이 핵심입니다.
⚠️ 체크 포인트
- 주간 한도는 매주 초기화됩니다 (정확한 초기화 기준 시각은 공식 문서에서 별도 이유를 밝히지 않았습니다).
- Business·Enterprise 고객은 Auto 라우팅 기본값을 GPT-5.4 mini로 직접 설정하는 옵션을 유지합니다.
- GPT-5.4 mini는 모델 선택기에서 직접 선택할 수 있는 옵션으로 표시되지 않습니다.
결국 한도는 “Thinking의 최고 품질 사용”에 대한 제한이지, 추론 기능 자체에 대한 완전 차단이 아닙니다.
플랜별 컨텍스트 차이, 이 부분이 의외로 큽니다
GPT-5.4 Thinking을 수동으로 선택했을 때 적용되는 컨텍스트 윈도우(한 번에 처리할 수 있는 정보량)는 요금제마다 다릅니다. “Thinking 하나인데 다 같겠지”라고 생각했다면, 실제 수치를 보면 조금 다르게 느껴질 겁니다.
| Thinking 선택 시 | 컨텍스트 윈도우 | 입력 최대 | 출력 최대 |
|---|---|---|---|
| Pro 요금제 | 400K | 272K | 128K |
| Plus / Business (모든 유료) | 256K | 128K | 128K |
출처: OpenAI Help Center, 2026.03.25 기준 / Thinking 수동 선택 시에만 적용
Pro와 Plus 사이에 컨텍스트 144K 차이가 납니다. 긴 PDF 문서나 대형 코드베이스를 한 번에 넣고 분석하는 작업을 자주 한다면, 이 수치가 체감으로 나타나는 지점입니다.
참고로 이 컨텍스트 수치는 Thinking을 수동으로 선택한 경우에만 적용됩니다. Instant를 통해 자동 전환된 경우에는 적용 기준이 다를 수 있다고 공식 문서는 별도 이유를 밝히지 않았습니다.
Pro가 Thinking보다 못한 벤치마크가 있습니다
월 200달러(약 28만 원)짜리 Pro가 월 20달러(약 2만 8천 원)짜리 Plus의 Thinking보다 모든 면에서 앞설 것 같지만, 실제 벤치마크에서 그렇지 않은 구간이 있습니다. OpenAI 공식 발표 수치를 보면 됩니다.
💡 벤치마크를 나란히 놓고 보니 이런 결과가 나왔습니다
| 벤치마크 | Thinking 5.4 | Pro 5.4 | 결과 |
|---|---|---|---|
| GDPval (44개 직종 실무) | 83.0% | 82.0% | Thinking 승 |
| OSWorld-Verified (PC 조작) | 75.0% | — | 미발표 |
| ARC-AGI-2 (추상 추론) | 73.3% | 83.3% | Pro 승 |
| BrowseComp (웹 멀티소스 조사) | 82.7% | 89.3% | Pro 승 |
출처: OpenAI 공식 GPT-5.4 발표, 2026.03.05 / — = 미발표
GDPval은 코딩, 법률, 재무, 마케팅 등 44개 실제 직종의 업무를 AI에게 시켰을 때 얼마나 잘 해결하는지를 보는 지표입니다. 여기서 Thinking(83.0%)이 Pro(82.0%)보다 1%포인트 앞섭니다. 일반 실무에서는 10배 더 비싼 Pro가 Thinking보다 열세라는 뜻입니다.
Pro가 앞서는 구간은 추상 추론이나 수십 개 출처를 종합하는 심층 리서치입니다. 매일 하는 문서 정리, 코드 리뷰, 보고서 작성 위주라면 Plus Thinking으로도 충분한 근거가 됩니다.
생각 시간 설정, 기본값이 바뀌었습니다
GPT-5.4 Thinking을 선택하면 메시지 입력창에 생각 시간 토글이 생깁니다. 이전에는 Extended가 기본값이었는데, GPT-5.4부터는 Standard가 새 기본값으로 바뀌었습니다. (출처: OpenAI Help Center, 2026.03.25 기준)
| 설정 | 속도 | 대상 플랜 | 적합한 상황 |
|---|---|---|---|
| Light | 가장 빠름 | Pro 전용 | 빠른 확인, 간단한 추론 |
| Standard ★기본값 | 균형 | Plus 이상 전체 | 일상 추론, 코딩 기본 |
| Extended | 느림 | Plus 이상 전체 | 복잡한 수학, 고난도 분석 |
| Heavy | 가장 느림 | Pro 전용 | 프런티어 추론, 연구급 작업 |
출처: OpenAI Help Center, 2026.03.25 기준
생각 시간 설정을 변경하면 그 값이 저장돼서 이후 대화에도 적용됩니다. “이번 한 번만 Extended로 해야지”라고 바꿔놓고 나중에 의도치 않게 무거운 모드로 쭉 사용하는 상황이 생길 수 있습니다. 바꿨다면 다음에 다시 확인하는 게 좋습니다.
참고로 이 설정은 ChatGPT 웹에서만 제공됩니다. 웹에서 선택한 값이 모바일 앱과 자동으로 동기화되지는 않습니다.
Q&A
Q1
Plus 플랜에서 GPT-5.4 Thinking 주간 3,000개 한도를 실제로 다 쓸 수 있나요?
하루로 환산하면 약 428개입니다. 복잡한 추론 요청을 하루 428개씩 매일 하는 사람은 거의 없습니다. 단, 수동 선택으로만 쓸 때의 한도이기 때문에, Instant 모드를 기본으로 두고 AI가 알아서 Thinking으로 전환하도록 두면 한도를 신경 쓸 일이 거의 없습니다.
Q2
한도에 걸리면 Thinking 기능을 아예 못 쓰나요?
아닙니다. 한도 도달 시 GPT-5.4 mini로 대체됩니다(2026.03.18 적용). 추론 기능 자체가 완전히 차단되는 게 아니라, mini 버전 추론으로 계속 쓸 수 있습니다. 또한 Auto 전환 방식으로는 한도에 도달한 뒤에도 Thinking 5.4 본 모델이 사용될 수 있습니다.
Q3
월 $200 Pro가 $20 Plus보다 항상 더 좋은 건가요?
그렇지 않습니다. GDPval(44개 직종 실무 벤치마크)에서 Plus Thinking(83.0%)이 Pro(82.0%)를 앞섭니다. Pro가 유리한 구간은 ARC-AGI-2 같은 추상 추론, BrowseComp 같은 심층 멀티소스 리서치입니다. 일반 업무 중심이라면 Plus Thinking으로 충분할 수 있습니다.
Q4
생각 시간 Standard와 Extended 중 뭘 쓰는 게 낫나요?
기본값인 Standard는 속도와 품질의 균형을 맞춘 설정입니다. 일상적인 코딩, 문서 작성, 번역이라면 Standard로 충분합니다. 고난도 수학 문제나 복잡한 법률·재무 분석처럼 정확도가 최우선인 상황에서 Extended를 선택하면 됩니다. 설정값은 저장되니까 작업 성격에 따라 바꾸는 습관을 들이는 게 좋습니다.
Q5
공식 발표에 따르면 GPT-5.4 Thinking 출시 후 90일 동안 Plus 및 Pro 사용자를 대상으로 레거시 모델에서 계속 제공됩니다. GPT-5.4 출시일이 2026.03.05이므로 2026년 6월 5일이 종료 예정일입니다. (출처: OpenAI Help Center, 2026.03.25 기준)
마치며
GPT-5.4 Thinking 한도를 요약하면 이렇습니다. Plus 기준 주 3,000개인데, 이건 수동 선택 시에만 차감됩니다. Auto 전환으로 쓴 건 한도와 무관합니다. 한도를 다 써도 mini 추론으로 계속 이어집니다. 그리고 월 $200 Pro라도 일반 실무 벤치마크에서는 Plus Thinking에 뒤집니다.
개인적으로 Plus를 쓴다면 Instant 기본 상태로 두고 AI가 알아서 Thinking으로 올려주는 방식이 제일 편하고 한도 걱정도 없습니다. 반드시 Thinking 깊이를 직접 제어해야 하는 작업이 있을 때만 수동으로 선택하는 방식이 현실적입니다.
OpenAI 공식 정책과 기능은 업데이트로 수시로 바뀝니다. 가장 정확한 최신 수치는 OpenAI 공식 Help Center에서 직접 확인하는 게 안전합니다.
본 포스팅 참고 자료
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. OpenAI의 ChatGPT 요금제 및 사용량 한도는 사전 고지 없이 조정될 수 있으며, 최신 내용은 OpenAI 공식 Help Center에서 직접 확인하시기 바랍니다. 본 포스팅에 인용된 수치는 2026년 3월 25일 기준 공식 문서를 바탕으로 작성되었습니다.











댓글 남기기