GPT-5.4 Thinking 한도, 이렇게 쓰면 안 줄어듭니다

Published on

in

GPT-5.4 Thinking 한도, 이렇게 쓰면 안 줄어듭니다

2026.03.29 기준
ChatGPT GPT-5.4 기준
TECH

GPT-5.4 Thinking 한도, 이렇게 쓰면 안 줄어듭니다

“Plus 쓰면 Thinking 주간 3,000개”라고 알고 계신 분들, 막상 매일 쓰다 보면 한도가 예상보다 빨리 닳는다는 걸 느끼셨을 겁니다. 아니면 반대로, 생각보다 오래 버티는 이유가 궁금하셨을 수도 있고요. 공식 Help Center 문서를 뜯어보니 대부분의 설명글에서 빠진 핵심이 있었습니다. 자동 전환으로 Thinking이 켜진 건 주간 한도에 포함되지 않습니다.

Plus 수동 선택 한도
주 3,000개
Pro 한도
사실상 무제한
Free Thinking
5시간당 10개

Thinking 한도, 숫자만 보면 절반밖에 모릅니다

GPT-5.4 Thinking 한도를 검색하면 “Plus 기준 주 3,000개”라는 숫자가 반복됩니다. 그런데 이 숫자에는 조건이 하나 붙어 있습니다. 수동으로 Thinking을 선택했을 때만 해당한다는 점입니다. OpenAI 공식 Help Center에 이렇게 나와 있습니다. “Plus 또는 Business를 사용 중이라면, 모델 선택기에서 GPT-5.4 Thinking을 수동으로 선택할 수 있으며 주당 최대 3,000개의 메시지 사용 한도가 적용됩니다.” (출처: OpenAI Help Center, GPT-5.3 및 GPT-5.4 in ChatGPT, 2026.03.05)

ChatGPT는 현재 Instant 모드에서 요청 성격을 판단해 복잡한 작업이면 Thinking으로 자동 전환하는 구조입니다. 이 자동 전환 경로를 통해 Thinking이 켜진 요청은 3,000개 카운터에 들어가지 않습니다. 하루에 수십 개씩 쓴다고 느껴도 한도가 예상보다 오래 버티는 이유가 여기 있습니다.

문제는 한도를 다 쓴 뒤에도 있습니다. Plus 기준으로 Thinking 한도가 소진되면 GPT-5.4 mini로 폴백됩니다. 2026년 3월 18일 릴리스 노트에 나온 내용입니다. “GPT-5.4 mini는 + 메뉴의 ‘Thinking’ 기능을 통해 Free 및 Go 사용자가 이용할 수 있으며, 그 외 모든 사용자에게는 GPT-5.4 Thinking의 요청 한도 도달 시 대체로 GPT-5.4 mini가 제공됩니다.” (출처: OpenAI 모델 출시 노트, 2026.03.18) 이는 한도 이후에도 추론 기능 자체가 꺼지는 게 아니라 소형 모델이 받아준다는 뜻입니다.

요금제별 Thinking 한도 요약

요금제 수동 Thinking 한도 한도 초과 시
Free 5시간당 10개 (GPT-5.4 mini) 한도 초기화 대기
Go 5시간당 10개 한도 초기화 대기
Plus / Business 주당 3,000개 GPT-5.4 mini 폴백
Pro / Enterprise 사실상 무제한 (남용 방지 기준 적용) 일시적 제한 가능

출처: OpenAI Help Center, ChatGPT의 GPT-5.3 및 GPT-5.4 (2026.03.05); OpenAI 모델 출시 노트 (2026.03.18)

▲ 목차로 돌아가기

자동 전환이 한도를 삼키지 않는 이유

이 부분이 실제로 쓸 때 가장 중요합니다. Instant 모드를 켜두면 ChatGPT가 요청의 복잡도를 판단해서 Thinking으로 올려 보내기도 합니다. 이 경우 실제로는 Thinking이 돌아가고 있지만, 주간 3,000개 카운터에는 포함이 안 됩니다. 공식 문서에 딱 이렇게 나옵니다. “GPT-5.3 Instant에서 GPT-5.4 Thinking으로의 자동 전환은 이 주간 한도에 포함되지 않으며, 한도에 도달한 이후에도 ChatGPT가 GPT-5.4 Thinking으로 전환할 수 있습니다.” (출처: OpenAI Help Center, 2026.03.05)

💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다

Plus 사용자라면 Thinking을 직접 고르지 않고 Instant에서 자동으로 올려 보내게 두면, 복잡한 요청도 Thinking 품질로 받으면서 주간 3,000개 한도는 건드리지 않을 수 있습니다. 단, 응답이 Instant 라우팅인지 실제 Thinking인지는 화면에 ‘Thinking 트레이스’가 보이는지로 확인할 수 있고, 짧은 추론이면 트레이스가 표시 안 될 수도 있습니다.

반대로 Thinking을 수동으로 켜두면 어떤 질문을 던져도 카운터에 쌓입니다. 간단한 번역이나 요약을 Thinking 수동 모드에서 날리면 그게 전부 주간 한도를 소진합니다. 그러니까 복잡하지 않은 작업엔 수동 Thinking을 끄고 Instant에 맡기는 게 한도 관리에서 유리합니다.

한도가 다 차도 완전히 막히는 건 아닙니다. Instant 라우팅을 통한 자동 전환은 한도 소진 이후에도 가능하기 때문에, 어떤 식으로든 Thinking 품질이 필요한 작업에는 계속 접근할 수 있습니다. 다만 수동으로 직접 선택하는 창은 닫힙니다.

▲ 목차로 돌아가기

요금제별 컨텍스트 윈도우, 세 배 차이 납니다

한도 숫자만큼 중요한데 잘 알려지지 않은 게 컨텍스트 윈도우 차이입니다. GPT-5.4 Thinking 기준으로 Plus와 Pro 사이에는 같은 모델임에도 불구하고 처리할 수 있는 입력 크기가 다릅니다. OpenAI 공식 Help Center에 티어별로 명시되어 있습니다. (출처: OpenAI Help Center, 2026.03.05)

GPT-5.4 Thinking 컨텍스트 윈도우 비교

요금제 컨텍스트 윈도우 입력 최대
Plus / Business 256K 토큰 128K 토큰 (입력)
Pro 티어 400K 토큰 272K 토큰 (입력)

출처: OpenAI Help Center, GPT-5.3 및 GPT-5.4 in ChatGPT (2026.03.05) ※ 수동 Thinking 선택 시에만 적용

입력 가능한 텍스트 크기가 Plus는 128K, Pro는 272K로 약 두 배 이상 차이 납니다. 100페이지짜리 PDF를 통째로 넣고 분석하거나, 수만 줄의 코드베이스를 한 번에 검토해야 한다면 Plus에서는 잘려나갑니다. API 기준으로는 GPT-5.4가 최대 100만 토큰 컨텍스트를 지원하는데 (출처: OpenAI GPT-5.4 소개 페이지, 2026.03.05), ChatGPT 앱에서의 Thinking 모드 입력 한도는 이보다 훨씬 작습니다. API와 앱의 경험이 다른 이유입니다.

💡 같은 모델이지만 요금제에 따라 처리할 수 있는 문서 분량이 다릅니다

128K 토큰은 약 10만 단어(한글 기준 약 7~8만 자) 분량입니다. 긴 보고서나 소설 한 편 정도 처리 가능한 수준인데, Pro는 이 두 배를 넣을 수 있습니다. 업무에서 대용량 문서 분석이 빈번하다면 이 차이가 요금제 선택을 가릅니다.

참고로 GPT-5.3 Instant의 컨텍스트도 요금제마다 다릅니다. Free는 16K, Plus·Business는 32K, Pro·Enterprise는 128K입니다. (출처: OpenAI Help Center, 2026.03.05) Free에서 긴 글을 넣으면 중간이 잘리는 이유가 이 때문입니다.

▲ 목차로 돌아가기

Thinking Effort — Standard·Extended·Heavy 중 뭘 써야 할까

GPT-5.4 Thinking을 수동으로 켰을 때 메시지 입력창 아래에 생각 시간 옵션이 나옵니다. 이게 단순한 UI가 아니라 모델이 얼마나 깊이 추론하는지를 조절하는 기능입니다. 그리고 이 옵션 자체가 요금제마다 다릅니다. (출처: OpenAI Help Center, 2026.03.05)

Thinking Effort 옵션 요금제별 접근 가능 여부

옵션 특징 사용 가능 요금제
Standard 속도와 추론 균형 (기본값) Plus, Business, Pro
Extended 더 깊고 포괄적인 추론 Plus, Business, Pro
Light 가장 빠른 추론 Pro 전용
Heavy 가장 깊은 추론 (느림) Pro 전용

출처: OpenAI Help Center, GPT-5.3 및 GPT-5.4 in ChatGPT (2026.03.05) ※ ChatGPT 웹 전용 기능, 모바일과 설정 동기화 안 됨

Plus 기준으로는 Standard와 Extended만 선택 가능합니다. Light(빠름)와 Heavy(깊은 추론)는 Pro 요금제에서만 열립니다. 그러니 “Thinking을 꽉 짜내고 싶다”면 Extended까지가 Plus의 한계이고, Pro는 Heavy라는 한 단계 더 들어가는 옵션이 있습니다.

주의할 점은 이 설정이 한 번 바꾸면 다시 전환하기 전까지 유지된다는 겁니다. Extended로 설정해두고 간단한 질문을 날리면 그 질문에도 Extended가 적용됩니다. Standard가 기본값이고, 필요할 때만 올리는 방식이 한도 소진을 줄이는 데 유리합니다. 그리고 이 설정은 웹에서만 유효하고, 모바일 앱에는 동기화가 안 됩니다. (출처: OpenAI Help Center, 2026.03.05)

▲ 목차로 돌아가기

GPT-5.4 Pro가 Thinking보다 무조건 강하다는 건 반만 맞습니다

GPT-5.4 Pro는 월 $200(한화 약 29만 원)짜리 Pro 요금제에서 쓸 수 있습니다. 직관적으로 “Pro가 Thinking보다 당연히 강하겠지”라고 생각하기 쉬운데, OpenAI 공식 발표 벤치마크를 보면 그렇지 않은 항목이 있습니다.

GPT-5.4 vs GPT-5.4 Pro 주요 벤치마크 비교

벤치마크 GPT-5.4 GPT-5.4 Pro
GDPval (실무 작업) 83.0% 82.0%
BrowseComp (웹 리서치) 82.7% 89.3%
ARC-AGI-2 (패턴 추론) 73.3% 83.3%
FrontierMath Tier 4 (수학) 27.1% 38.0%
일반 업무 코딩 (수동) 87.3% 83.6%

출처: OpenAI GPT-5.4 소개 페이지 (openai.com/ko-KR/index/introducing-gpt-5-4/, 2026.03.05)

실무 작업(GDPval)과 일반 코딩에서는 GPT-5.4 Thinking이 GPT-5.4 Pro를 앞섭니다. Pro가 훨씬 비싸지만 모든 작업에서 더 낫지 않습니다. Pro는 딥 리서치, 고난도 수학, 복잡한 패턴 추론에서 Thinking을 크게 앞서는 반면, 일반 업무 코딩과 실무 작업에서는 Thinking이 오히려 높습니다.

💡 벤치마크를 작업 유형별로 쪼개보니 이런 구분이 나왔습니다

코딩·일반 업무 중심이면 Plus의 Thinking이 충분하고, 딥 리서치·고난도 수학이 주된 용도라면 Pro의 Heavy 모드가 실질적인 차이를 만들어냅니다. 요금 10배 차이를 감수할 만한 용도인지는 이 기준으로 판단하는 게 현실적입니다.

API 요금도 마찬가지입니다. GPT-5.4의 출력 토큰 가격은 100만 개당 $15인데, GPT-5.4 Pro는 $180입니다. 12배 차이입니다. (출처: OpenAI GPT-5.4 소개 페이지, 2026.03.05) 그 가격 차이가 모든 작업에서 성능 차이로 돌아오지 않는다는 걸 수치가 보여주고 있습니다.

▲ 목차로 돌아가기

한도를 덜 쓰면서 Thinking 품질은 지키는 방법

지금까지 살펴본 구조를 바탕으로 실제로 어떻게 쓰면 효율이 좋은지 정리해 보겠습니다. 이 내용은 공식 발표 수치와 구조를 교차해서 나온 실용적인 판단입니다.

1

Instant 모드를 기본으로 두고, 복잡한 작업에만 수동으로 전환하세요

일상적인 질문·요약·번역은 Instant에서 처리해도 충분합니다. ChatGPT가 필요하다고 판단하면 Thinking으로 자동 전환하고, 이 경우 주간 한도가 줄어들지 않습니다.

2

Thinking Effort는 Standard를 기본으로 유지하세요

Extended는 중요하고 복잡한 작업에서만 씁니다. 한 번 Extended로 바꾸면 다음 요청까지 유지되니 끝나고 바로 Standard로 되돌리는 습관을 들이면 좋습니다.

3

대용량 문서 분석은 Plus 컨텍스트 한도(128K 입력)를 먼저 파악하세요

128K를 넘는 입력이 필요한 작업이라면 Plus에서는 어떻게든 분할해서 넣어야 합니다. 통째로 넣으면 뒷부분이 잘립니다.

4

주간 3,000개 한도는 월요일(현지 기준)에 초기화됩니다

한도 소진 후 폴백된 mini를 쓰다가 주 초에 다시 Thinking을 쓰려면 초기화 타이밍을 알아두면 좋습니다. OpenAI는 별도로 초기화 날짜를 명시하지 않았으나, 주간(weekly) 기준 리셋입니다.

▲ 목차로 돌아가기

Q&A

Q1. GPT-5.4 Thinking 한도 3,000개가 소진되면 아예 Thinking을 못 쓰나요?
수동으로 직접 Thinking을 선택하는 창이 닫힙니다. 하지만 Instant 모드에서 ChatGPT가 자동으로 Thinking으로 올려 보내는 경우는 한도 소진 이후에도 계속 가능합니다. 한도 초과 시 수동 선택 요청은 GPT-5.4 mini(추론 기능 있는 소형 모델)로 처리됩니다. (출처: OpenAI Help Center, 2026.03.05)
Q2. Thinking을 켰을 때 Thinking 트레이스가 보이지 않으면 실제로 Thinking이 돌아간 게 아닌가요?
공식 문서 기준으로, Instant 모드에서 자동 전환된 경우 추론이 짧으면 트레이스가 표시되지 않을 수 있습니다. 수동으로 Thinking을 선택한 경우에는 짧은 추론이라도 트레이스가 표시됩니다. 트레이스가 보이는지가 수동 선택인지 자동 전환인지를 구분하는 실용적인 기준입니다. (출처: OpenAI Help Center, 2026.03.05)
Q3. GPT-5.4 Thinking이 GPT-5.4 Pro보다 비용 대비 좋은 경우는 어떤 작업인가요?
OpenAI 공식 벤치마크 기준으로 일반 업무 코딩(87.3% vs 83.6%)과 실무 전반 작업(GDPval 83.0% vs 82.0%)에서 Thinking이 Pro보다 앞섭니다. 딥 리서치, 고난도 수학, 패턴 추론은 Pro가 강합니다. 코딩과 일상 업무 중심이라면 Plus에서 Thinking을 쓰는 게 비용 면에서 훨씬 효율적입니다. (출처: OpenAI GPT-5.4 소개 페이지, 2026.03.05)
Q4. GPT-5.4 Thinking의 Apps·캔버스·이미지 생성 기능은 다 쓸 수 있나요?
Q5. GPT-5.2 Thinking 레거시 모델은 언제까지 쓸 수 있나요?

▲ 목차로 돌아가기

마치며 — 한도 숫자보다 구조를 이해하는 게 먼저입니다

GPT-5.4 Thinking 한도 관련 정보를 찾다 보면 “주간 3,000개”라는 숫자만 반복됩니다. 그런데 실제로 쓰다 보면 그 숫자만으로는 설명이 안 되는 경험을 하게 됩니다. 이 글에서 살펴본 것처럼, 자동 전환은 카운터에 안 들어가고, 컨텍스트 크기는 요금제마다 다르고, Thinking Effort 옵션도 Plus와 Pro가 다릅니다.

특히 GPT-5.4 Pro가 모든 면에서 Thinking보다 낫다는 통념을 벤치마크 수치가 정면으로 반박합니다. 실무 코딩과 일반 업무에서는 Thinking이 앞서고, Pro는 딥 리서치와 고난도 수학에서 빛을 발합니다. 요금 차이만큼의 가치를 뽑으려면 자신의 주된 작업이 어디에 해당하는지를 먼저 따져봐야 합니다.

솔직히 이 구조가 익숙해지기까지 시간이 좀 걸립니다. 하지만 한 번 파악해두면 Plus 요금제에서도 Thinking을 꽤 넉넉하게 쓸 수 있습니다. Instant를 기본으로 두고, 필요한 순간에만 수동 Thinking을 켜는 방식이 현재로선 가장 실용적입니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. OpenAI GPT-5.4 공식 소개 페이지 — openai.com/ko-KR/index/introducing-gpt-5-4/
  2. OpenAI Help Center, ChatGPT의 GPT-5.3 및 GPT-5.4 — help.openai.com/ko-kr/articles/11909943
  3. OpenAI 모델 출시 노트 (2026.03.18 기준) — help.openai.com/ko-kr/articles/9624314

※ 본 포스팅은 2026년 3월 29일 기준 공식 OpenAI 문서를 참고해 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. ChatGPT 요금제 및 한도는 OpenAI의 정책에 따라 예고 없이 바뀔 수 있으므로, 최신 정보는 OpenAI 공식 Help Center에서 직접 확인하세요.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기