2026.03.17 기준 / ChatGPT GPT-5.3·5.4 기준
ChatGPT 모델 선택기, Plus 이하엔 이 제약이 있습니다
3월 17일 ChatGPT가 모델 선택기를 Instant·Thinking·Pro 3단계로 바꿨습니다. 단순해졌다고 생각하기 쉽지만, 요금제마다 실제로 켜지는 기능이 다릅니다. 공식 문서를 직접 확인하니 기존 블로그들이 쓰지 않은 제약이 4가지 나왔습니다.
Thinking 주간 한도 3,000개
웹↔모바일 설정 비동기화
모델 선택기가 3단계로 바뀐 것, 정확히 어떤 변화인가
2026년 3월 17일, OpenAI가 ChatGPT의 모델 선택기를 전면 개편했습니다. 이전까지는 GPT-5.2 Instant, GPT-5.2 Thinking, GPT-5.2 Pro, GPT-5.3 Instant, GPT-5.4 Thinking 같은 버전명이 나열된 긴 드롭다운 메뉴였습니다. 그 메뉴를 Instant / Thinking / Pro 세 항목으로 압축한 것이 이번 변경의 핵심입니다. (출처: OpenAI ChatGPT 릴리스 노트, 2026.03.17)
언뜻 보면 단순화처럼 보입니다. 실제로 OpenAI는 “더 복잡한 작업에 적합한 추론 수준을 쉽게 고를 수 있도록 모델 선택기를 단순화했다”고 밝혔습니다. 하지만 단순화된 외관 안에 요금제별로 완전히 다른 동작이 숨어 있습니다. 같은 “Instant”를 눌러도 Free 계정과 Pro 계정이 실제로 받는 컨텍스트 윈도우는 8배 차이가 납니다.
현재 기준으로 세 항목의 역할은 다음과 같습니다. Instant는 일상 업무용 GPT-5.3 Instant를 기본값으로 쓰되, 복잡한 질문이 오면 GPT-5.4 Thinking으로 자동 전환됩니다. Thinking은 GPT-5.4 Thinking을 수동으로 고정 선택하는 모드이고, Pro는 GPT-5.4 Pro로 고정됩니다. 겉으로는 세 버튼이지만 그 안에서 돌아가는 모델과 성능은 요금제마다 다릅니다.
Instant를 골랐는데 Thinking이 작동한다 — 근데 표시가 안 된다
💡 공식 발표문과 실제 작동 흐름을 같이 놓고 보니 이런 차이가 보였습니다.
“Instant를 선택했으니 빠른 응답만 받는 것”이라고 생각하기 쉽습니다. 막상 공식 문서를 보면 다릅니다. OpenAI 공식 헬프 문서에 이렇게 나옵니다. “ChatGPT에서 Instant를 선택하면, ChatGPT가 요청에 따라 GPT-5.3 Instant 또는 GPT-5.4 Thinking을 사용할지 자동으로 결정할 수 있습니다.” (출처: OpenAI 헬프센터, GPT-5.3 and GPT-5.4 in ChatGPT, 2026.03)
즉, Instant를 고른다고 해서 항상 GPT-5.3만 쓰는 게 아닙니다. 질문이 복잡하면 자동으로 GPT-5.4 Thinking으로 넘어갑니다. 그런데 여기서 더 중요한 것이 있습니다. 같은 문서에는 이렇게도 나옵니다. “Instant가 요청을 Thinking으로 라우팅하는 경우, 추론이 짧으면 ChatGPT가 항상 Thinking 트레이스를 표시하지 않을 수 있습니다.”
다시 말해, 내가 모르는 사이 Thinking 모드가 켜지고, 심지어 켜진 사실도 화면에 표시 안 될 수 있습니다. Thinking 모드가 작동했는지 아닌지를 사용자가 파악하려면 Thinking 모드를 수동으로 직접 선택해야 합니다. Thinking을 직접 선택하면 짧은 추론에서도 트레이스가 표시됩니다.
요금제별 컨텍스트 윈도우, 같은 “Instant”가 아닙니다
같은 Instant 버튼을 눌러도, 실제 처리할 수 있는 문서의 길이는 요금제마다 크게 다릅니다. 아래는 공식 ChatGPT 요금제 페이지와 헬프센터 문서에 나온 수치입니다. (출처: chatgpt.com/pricing, 2026.03)
| 요금제 | Instant 컨텍스트 | Thinking 컨텍스트 | 월 요금(달러) |
|---|---|---|---|
| Free | 16K | 미제공 | $0 |
| Plus | 32K | 256K (입력 128K + 출력 128K) | $20 |
| Pro | 128K | 400K (입력 272K + 출력 128K) | $200 |
Free 계정의 Instant 컨텍스트 16K는 한국어 기준으로 약 8,000~10,000자 분량입니다. A4 7~8페이지 정도입니다. Pro의 Instant 컨텍스트 128K는 같은 기준으로 약 64,000~80,000자, A4 약 60페이지 이상입니다. 같은 “Instant”라는 이름 아래 처리 가능한 문서 길이가 8배 차이가 납니다.
긴 PDF나 계약서, 코드 파일을 붙여넣었다가 “응답이 이상하다”는 느낌을 받았다면 컨텍스트 한도를 먼저 의심해볼 필요가 있습니다. 모델이 나빠서가 아니라 요금제 한도 때문에 맥락 일부가 잘렸을 가능성이 있습니다.
Thinking 주간 한도 소진해도 자동 전환은 계속 됩니다
💡 사용량 안내 팝업에 나온 문구를 공식 문서와 같이 읽어보니 이렇게 다르게 작동했습니다.
Plus·Business 요금제에서 Thinking을 수동으로 선택하면 주당 최대 3,000개 메시지 한도가 적용됩니다. 한도에 도달하면 팝업 알림이 뜨고, Thinking 항목이 모델 선택기에서 회색으로 비활성화됩니다. 여기까지는 많이 알려진 내용입니다.
그런데 공식 문서에는 이어서 이런 내용이 나옵니다. “GPT-5.3 Instant에서 GPT-5.4 Thinking으로의 자동 전환은 이 주간 한도에 포함되지 않으며, 한도에 도달한 뒤에도 ChatGPT가 GPT-5.4 Thinking으로 전환할 수 있습니다.” (출처: OpenAI 헬프센터, 2026.03) 한도 소진 알림을 받았더라도, Instant 모드를 쓰는 한 ChatGPT는 내부적으로 Thinking을 계속 끌어다 쓸 수 있다는 뜻입니다.
주간 3,000개 한도는 수동 선택에만 적용됩니다. 한도를 채웠다고 Thinking 기능이 완전히 꺼지는 게 아닙니다. Instant 모드를 쓰는 동안 ChatGPT가 자율적으로 Thinking을 투입하는 건 한도 바깥에서 움직입니다. 즉, 한도를 채운 다음에도 Instant로 계속 사용하면 Thinking 수준의 추론이 필요한 경우 자동으로 적용될 수 있습니다.
웹에서 설정한 Thinking effort, 모바일에선 반영 안 됩니다
3월 17일 업데이트에서 Thinking 모드에는 생각 시간 강도를 조절하는 옵션이 추가됐습니다. Plus·Business는 Standard(속도와 지능의 균형)와 Extended(더 깊은 추론) 두 가지를 선택할 수 있고, Pro는 여기에 Light(가장 빠름)와 Heavy(더 깊은 추론) 옵션이 추가됩니다.
Extended나 Heavy를 한 번 선택하면 다음 대화까지 그 설정이 저장됩니다. 여기서 놓치기 쉬운 부분이 있습니다. 공식 문서에는 이렇게 나옵니다. “이 기능은 ChatGPT Web에서만 제공됩니다. 웹에서 선택한 설정은 모바일과 동기화되지 않습니다.” (출처: OpenAI 헬프센터, 2026.03)
PC에서 Extended로 설정해뒀더라도 모바일 앱에서는 기본값인 Standard로 돌아갑니다. 모바일에서 쓸 때 답변이 웹보다 얕게 느껴진다면 이 설정 비동기화를 확인해볼 만합니다. 현재로서는 기기마다 별도로 설정을 잡아줘야 합니다. 이 부분은 OpenAI 공식 문서에서도 별도 이유를 밝히지 않았습니다.
Pro 요금제에서만 쓸 수 있는 것과 없는 것
Pro 항목은 GPT-5.4 Pro 모델을 씁니다. GDPval 벤치마크에서 GPT-5.4가 83.0%를 기록한 것과 달리 Pro는 별도 측정치가 있으며, BrowseComp 기준으로는 GPT-5.4 Pro가 89.3%, 기본 GPT-5.4가 82.7%로 약 6.6%p 차이가 납니다. (출처: OpenAI 공식 GPT-5.4 소개 페이지, 2026.03.05) 이 수치 차이는 특히 복잡한 웹 정보 검색과 다단계 추론 작업에서 나타납니다.
그런데 Pro 모드에는 쓸 수 없는 기능도 있습니다. 공식 문서에는 “Pro에서는 앱, 메모리, 캔버스, 이미지 생성을 사용할 수 없습니다”라고 나옵니다. (출처: OpenAI 헬프센터, 2026.03) 가장 강력한 모드를 선택했는데, ChatGPT의 대표 기능인 DALL-E 이미지 생성과 메모리(사용자 정보 기억)가 비활성화됩니다.
솔직히 말하면, 이미지 생성이나 메모리를 자주 쓰는 사람에게는 Pro 모드를 상시로 켜두는 게 오히려 불편할 수 있습니다. 코딩·수학·심층 리서치처럼 연산이 무거운 작업을 집중적으로 할 때만 Pro로 전환하고, 평소에는 Thinking 모드로 사용하는 것이 실용적입니다.
참고로 GPT-5.4 Thinking과 Pro의 컨텍스트 윈도우 차이도 큽니다. Plus·Business의 Thinking은 256K(입력 128K + 출력 128K)인 반면, Pro 요금제의 Thinking은 400K(입력 272K + 출력 128K)로 넓습니다. 단순히 모드의 차이가 아니라 요금제 자체가 컨텍스트 상한을 결정합니다.
Q&A
Q. Instant 모드를 쓰면 항상 GPT-5.3만 사용하는 건가요?
아닙니다. Instant 모드는 기본으로 GPT-5.3을 사용하지만, 복잡한 질문이라고 ChatGPT가 판단하면 자동으로 GPT-5.4 Thinking으로 전환합니다. 이때 추론 트레이스(사고 과정)가 화면에 표시되지 않을 수도 있습니다. (출처: OpenAI 헬프센터, 2026.03)
Q. Thinking 주간 한도 3,000개를 다 쓰면 Thinking을 전혀 못 쓰나요?
수동으로 Thinking을 선택하는 것은 차단되지만, Instant 모드에서 ChatGPT가 자동으로 Thinking을 끌어다 쓰는 건 이 한도에서 제외됩니다. 즉, 한도 소진 후에도 Instant 상태로 사용하면 자동 Thinking 전환은 계속 작동합니다. (출처: OpenAI 헬프센터, 2026.03)
Q. Free 계정에서 Thinking 모드를 선택할 수 있나요?
모델 선택기에서 수동으로 Thinking을 고를 수 있는 건 Plus·Business 이상입니다. Free 계정은 모델 선택기 자체에 접근할 수 없고, Instant에서 자동 전환은 가능하지만 사용자가 제어할 수 없습니다. GPT-5.4 Thinking의 수동 선택은 유료 플랜 전용입니다.
Q. 웹에서 Thinking effort를 Extended로 바꿔도 모바일에서 적용 안 되나요?
맞습니다. 공식 문서에 “이 기능은 ChatGPT Web에서만 제공됩니다. 웹에서 선택한 설정은 모바일과 동기화되지 않습니다”라고 명시돼 있습니다. 모바일에서도 깊은 추론을 원하면 앱에서 별도로 설정을 바꿔야 합니다.
Q. Pro 모드를 켜면 이미지 생성도 되나요?
안 됩니다. 공식 문서에 따르면 Pro 모드에서는 앱, 메모리, 캔버스, 이미지 생성을 사용할 수 없습니다. 이미지 생성이 필요하다면 Pro 모드를 해제하고 Thinking이나 Instant 모드로 전환해야 합니다.
마치며
이번 모델 선택기 개편을 처음 봤을 때 “드디어 복잡한 드롭다운이 정리됐다”는 생각이 먼저 들었습니다. 그런데 공식 문서를 한 줄 한 줄 읽어보니 단순화된 UI 뒤에 요금제별로 다른 동작이 정교하게 깔려 있었습니다.
결론을 정리하면 이렇습니다. Free 계정이라면 Instant 컨텍스트가 16K로 제한되므로, 긴 문서 작업에는 한계가 있습니다. Plus라면 Thinking을 수동으로 선택할 수 있고 주간 3,000개 한도가 있지만, Instant 자동 전환은 한도 밖에서 작동합니다. Pro라면 컨텍스트와 성능은 올라가지만 이미지 생성과 메모리가 꺼집니다. 모바일 사용자라면 웹 설정과 별개로 모바일에서 Thinking effort를 따로 잡아야 합니다.
내가 어떤 방식으로 ChatGPT를 쓰는지를 먼저 파악하고, 그다음에 맞는 모드와 요금제를 고르는 순서가 맞습니다. 모드 이름이 세 개로 줄었다고 모든 것이 같아진 건 아닙니다.
본 포스팅 참고 자료
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 이 글은 2026년 3월 17~18일 기준 OpenAI 공식 문서 및 헬프센터를 바탕으로 작성했습니다. ChatGPT의 모델명·요금·한도는 OpenAI 정책에 따라 사전 통지 없이 달라질 수 있으므로, 중요한 결정 전에 공식 페이지를 직접 확인하시기 바랍니다.

댓글 남기기