GPT-5.4 mini 기준 (2026.03.18 출시)
GPT-5.4 mini Thinking, 무료라는 말이 전부일까요?
2026년 3월 18일, OpenAI가 GPT-5.4 mini Thinking을 무료(Free)·Go 사용자에게 열었습니다. 하지만 막상 써보면 “이게 진짜 Thinking 맞아?”라는 의문이 생깁니다. 공식 문서를 직접 뜯어보니 플랜마다 작동하는 모델 자체가 달랐습니다.
“무료로 Thinking 된다”는 말의 실체
2026년 3월 18일 OpenAI 공식 출시 발표문에는 이렇게 나와 있습니다. “In ChatGPT, GPT-5.4 mini is available to Free and Go users via the Thinking feature in the + menu.” (출처: OpenAI 공식 블로그, 2026.03.17) 번역하면 무료 사용자도 ‘+’ 메뉴의 Thinking 기능으로 GPT-5.4 mini를 쓸 수 있다는 뜻입니다.
그런데 같은 날 OpenAI 공식 요금제 페이지를 보면 GPT-5.4 Thinking 항목에 Free 플랜은 ‘No’로 표시되어 있습니다. (출처: chatgpt.com/pricing, 2026.03.31 확인) 두 문서가 상충하는 것처럼 보이지만, 실제로는 모델 이름이 다릅니다. GPT-5.4 Thinking(정식 추론 모델)은 Free에서 안 되고, GPT-5.4 mini(경량 추론 모델)가 Free에서 되는 겁니다.
Free 플랜에서 ‘+’ 메뉴를 눌러 Thinking을 켜면 GPT-5.4 mini가 작동합니다. GPT-5.4 Thinking이 아닙니다. 이 차이를 모르면 “나도 Thinking 쓰고 있어”라고 생각하지만, 정작 Plus 사용자와는 전혀 다른 모델을 쓰고 있는 상황이 됩니다.
“Thinking 기능으로 GPT-5.4 mini 이용 가능” = 경량 mini 모델
“GPT-5.4 Thinking 제공 여부: Free → No” = 정식 추론 모델
이름이 비슷해서 같은 것처럼 보이지만, 실제 모델이 다릅니다.
플랜별로 작동하는 모델이 다릅니다
‘+’ 메뉴에서 ‘Thinking’이라는 버튼은 똑같이 보이는데, 눌렀을 때 뒤에서 돌아가는 모델이 플랜마다 다릅니다. OpenAI 공식 Help Center 문서(gpt-53-and-gpt-54-in-chatgpt, 2026.03 기준)를 기준으로 정리하면 아래와 같습니다.
| 플랜 | Thinking 버튼 누르면 작동하는 모델 | 한도 |
|---|---|---|
| Free | GPT-5.4 mini | 별도 공식 횟수 미공개 |
| Go (월 $8) | GPT-5.4 mini | 5시간마다 최대 10개 |
| Plus (월 $20) | GPT-5.4 Thinking (정식) | 주당 최대 3,000개 |
| Pro (월 $200) | GPT-5.4 Pro (최고 등급) | 사실상 무제한(가드레일 내) |
Go 플랜 사용자 사이에서 혼란이 생기는 이유가 여기 있습니다. Reddit에서 한 Go 플랜 사용자가 “GPT-5.4 Thinking이 아니라 GPT-5 Thinking mini로 라우팅된다”고 올린 글(r/ChatGPT, 2026.03.08)에는 다른 사용자가 “Go 플랜에서 5.4 Thinking은 아마도 Pro만 가능한 것 같다”고 답했습니다. 공식 문서를 확인하지 않으면 Go 플랜에서 뭘 받고 있는지 스스로 알기 어렵습니다.
Plus Thinking 주간 한도, 실제로 얼마나 널널할까
Plus 플랜의 GPT-5.4 Thinking은 주당 3,000개 한도입니다. (출처: OpenAI Help Center, GPT-5.3·5.4 안내 문서, 2026.03) 한 주를 7일로 계산하면 하루 평균 428회입니다. 하루 8시간 기준으로 나누면 시간당 약 53회 수준입니다. 일반적인 업무용 사용 패턴에서는 쉽게 소진되지 않습니다.
그런데 여기서 중요한 공식 조건이 하나 있습니다. GPT-5.3 Instant가 자동으로 GPT-5.4 Thinking으로 전환되는 경우, 이 자동 전환은 주간 3,000회 한도에 카운트되지 않습니다. (출처: OpenAI Help Center, 2026.03) 즉 Instant 모드에서 복잡한 질문을 던지면 ChatGPT가 알아서 Thinking으로 넘기는데, 이 과정에서 소비된 Thinking 사용량은 내 3,000회 한도를 깎지 않습니다. 한도를 다 써도 자동 전환은 계속 일어날 수 있다는 뜻이기도 합니다.
Instant 모드에서 ChatGPT가 자동으로 Thinking으로 전환할 때는 3,000회 카운트에 포함되지 않습니다. 수동으로 Thinking을 선택할 때만 한도가 깎입니다. 한도에 신경 쓰이면 Instant 모드를 기본으로 두는 것도 방법입니다.
GPT-5.4 mini와 GPT-5.4 Thinking, 수치로 본 실제 차이
Free·Go 플랜에서 받는 GPT-5.4 mini와 Plus에서 받는 GPT-5.4 Thinking의 실력 차이는 얼마나 날까요. 2026년 3월 17일 OpenAI 공식 출시 발표문 벤치마크 수치를 직접 확인했습니다. (출처: openai.com/index/introducing-gpt-5-4-mini-and-nano/, 2026.03.17)
| 벤치마크 | GPT-5.4 mini (Free·Go) |
GPT-5.4 Thinking (Plus) |
차이 |
|---|---|---|---|
| SWE-Bench Pro (코딩) | 54.4% | 57.7% | -3.3%p |
| Terminal-Bench 2.0 | 60.0% | 75.1% | -15.1%p |
| GPQA Diamond (추론) | 88.0% | 93.0% | -5.0%p |
| OSWorld-Verified (컴퓨터 사용) | 72.1% | 75.0% | -2.9%p |
코딩이나 일반 추론 작업에서는 mini와 Thinking의 격차가 3~5%p 수준으로 크지 않습니다. 그런데 Terminal-Bench, 즉 터미널 기반 도구 실행에서는 15%p 차이가 납니다. 단순 대화나 글쓰기 용도라면 mini로도 충분하지만, 코딩 에이전트나 복잡한 파일 작업에서는 체감 차이가 나올 수 있습니다.
반대로 OSWorld(컴퓨터 화면 조작)에서는 mini가 72.1%로 정식 Thinking의 75.0%에 꽤 근접합니다. 화면 캡처·UI 해석 작업에서는 Free·Go 플랜도 생각보다 나쁘지 않다는 의미입니다.
Codex에서 mini를 쓰면 비용 계산이 달라집니다
ChatGPT 구독 포함 서비스인 Codex에서 GPT-5.4 mini를 쓸 때는 쿼터 소비 방식이 다릅니다. OpenAI 공식 발표문에는 이렇게 나와 있습니다. “In Codex, GPT-5.4 mini uses only 30% of the GPT-5.4 quota.” (출처: openai.com/index/introducing-gpt-5-4-mini-and-nano/, 2026.03.17) GPT-5.4를 1회 쓸 때 소비되는 쿼터의 30%만 소비한다는 뜻입니다. 같은 구독료에서 Codex를 3배 이상 많이 쓸 수 있습니다.
예를 들어 Codex에서 GPT-5.4를 10번 쓰면 쿼터가 10 소비됩니다. 같은 10번을 GPT-5.4 mini로 돌리면 3만 소비됩니다. 나머지 7은 다른 작업에 쓸 수 있습니다. 단순 반복 코딩 작업(파일 검색, 서브에이전트 처리)에 mini를 배치하고 복잡한 판단만 GPT-5.4에 맡기면, 같은 구독에서 더 많은 작업을 처리할 수 있습니다.
GPT-5.4 쿼터 100 기준:
— GPT-5.4 전용: 100회 작업
— GPT-5.4 mini 전용: 약 333회 작업
— 복잡한 판단만 GPT-5.4(30회) + 나머지 mini(약 233회): 총 263회 작업
OpenAI가 Codex에서 mini를 서브에이전트로 쓰는 패턴을 공식 문서에서 직접 권장하고 있습니다. 대형 모델이 계획·판단을 맡고, mini가 실행을 분담하는 구조입니다. 이 패턴을 쓰면 비용 대비 처리량을 늘릴 수 있습니다. (출처: OpenAI 공식 블로그, 2026.03.17)
플랜별 정리 — 지금 내 요금제에서 뭘 받고 있는가
지금까지 공식 문서에서 확인한 내용을 요금제별로 묶으면 아래와 같습니다. 선택 기준을 잡는 데 도움이 됩니다.
Free 플랜 — 쓸 수는 있지만 조건이 있습니다
‘+’ 메뉴에서 Thinking을 켜면 GPT-5.4 mini가 작동합니다. 정식 GPT-5.4 Thinking은 아닙니다. 컨텍스트 창은 16K로 가장 좁습니다. 일반 대화나 간단한 추론에는 충분하지만, 긴 문서 분석이나 복잡한 코딩 작업에서는 컨텍스트 제한이 먼저 걸립니다.
Go 플랜 (월 $8) — 5시간에 10회, 생각보다 빠듯합니다
Thinking을 켜면 GPT-5.4 mini가 작동합니다. 단, 5시간마다 10회라는 한도가 있습니다. 하루 3번 5시간 구간이 리셋된다고 가정하면 최대 30회 수준인데, 작업 집중 시간대에 몰아 쓰면 생각보다 금방 찹니다. (출처: OpenAI Help Center, 2026.03)
Plus 플랜 (월 $20) — 처음으로 정식 GPT-5.4 Thinking을 받습니다
주당 3,000회 한도로 GPT-5.4 Thinking을 수동으로 선택할 수 있습니다. 컨텍스트 창도 256K로 넓어집니다. 그리고 자동 전환으로 소비된 Thinking 사용량은 이 3,000회에 포함되지 않으니, 실제 체감 한도는 수치보다 여유롭습니다. Standard·Extended 사고 시간 토글도 사용할 수 있습니다.
Pro 플랜 (월 $200) — GPT-5.4 Pro에 컨텍스트 400K
GPT-5.4 Pro를 사용할 수 있고 컨텍스트 창이 400K(입력 272K + 출력 128K)로 가장 넓습니다. Light·Heavy 사고 시간 옵션도 추가로 제공됩니다. 사실상 무제한이지만, OpenAI 이용약관 내 정상 사용 범위 가드레일은 적용됩니다. (출처: OpenAI Help Center, 2026.03)
Q&A
GPT-5.4 mini Thinking과 GPT-5.4 Thinking은 뭐가 다른가요?
GPT-5.4 mini는 경량 버전이고, GPT-5.4 Thinking은 정식 추론 모델입니다. SWE-Bench Pro 기준으로 mini는 54.4%, 정식 Thinking은 57.7%를 기록했습니다. 일반 대화·추론에서는 체감 차이가 크지 않지만, 터미널 기반 도구 실행(Terminal-Bench 2.0)에서는 60.0% vs 75.1%로 차이가 납니다. (출처: OpenAI 공식 블로그, 2026.03.17)
Go 플랜에서는 Thinking을 얼마나 쓸 수 있나요?
5시간마다 최대 10개입니다. 이 한도에 도달하면 한도가 초기화될 때까지 모델의 미니 버전으로 자동 전환됩니다. Go 플랜에서는 GPT-5.4 Thinking이 아닌 GPT-5.4 mini가 작동한다는 점도 함께 기억하세요. (출처: OpenAI Help Center, 2026.03)
Plus 플랜 Thinking 주간 3,000회 한도, 실제로 다 쓰는 사람이 있나요?
일반적인 업무 사용 패턴에서는 소진하기 어렵습니다. 하루 428회 수준이고, 자동 전환(Instant → Thinking)은 여기서 제외됩니다. 단, 에이전트 작업이나 연속 추론 작업을 집중적으로 돌리는 개발자라면 달라질 수 있습니다. (출처: OpenAI Help Center, 2026.03)
Codex에서 GPT-5.4 mini를 쓰면 비용이 어떻게 달라지나요?
GPT-5.4 쿼터의 30%만 소비합니다. GPT-5.4를 100번 쓸 수 있는 쿼터라면, mini로는 약 333번 쓸 수 있습니다. 단순 반복 작업·서브에이전트 처리를 mini에 맡기면 같은 구독 내에서 더 많은 작업을 처리할 수 있습니다. (출처: OpenAI 공식 블로그, 2026.03.17)
GPT-5.4 nano는 ChatGPT에서 쓸 수 있나요?
아닙니다. GPT-5.4 nano는 현재 API에서만 제공됩니다. API 기준으로 입력 $0.20 / 출력 $1.25 (1M 토큰 기준)로 GPT-5.4 mini(입력 $0.75 / 출력 $4.50)보다 훨씬 저렴합니다. 단순 분류·데이터 추출·텍스트 랭킹 작업에 추천되는 용도입니다. (출처: OpenAI 공식 블로그, 2026.03.17)
마치며
“무료로 Thinking이 된다”는 말은 맞습니다. 하지만 그 Thinking은 GPT-5.4 Thinking이 아니라 GPT-5.4 mini입니다. 이름 하나 차이인데 작동하는 모델, 한도, 컨텍스트 창이 전부 다릅니다.
솔직히 말하면, Free나 Go 플랜에서 mini Thinking을 써보니 일상적인 질문·요약·간단한 코드 수정에서는 큰 불편 없이 쓸 수 있었습니다. 다만 복잡한 멀티스텝 코딩이나 긴 문서 분석에서는 컨텍스트 제한과 한도가 먼저 걸리는 게 사실입니다.
Plus로 올라가면 처음으로 정식 GPT-5.4 Thinking을 받고, 주간 3,000회라는 넉넉한 한도와 256K 컨텍스트 창을 씁니다. 자동 전환이 한도에 포함되지 않는다는 조건까지 감안하면, 실제 체감 한도는 수치보다 여유롭습니다. 현재 요금제에서 내가 정확히 어떤 모델을 받고 있는지 알고 쓰는 것, 그게 출발점입니다.
본 포스팅 참고 자료
본 포스팅은 2026년 03월 31일 기준 OpenAI 공식 문서와 발표 자료를 바탕으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. IT/AI 서비스는 업데이트로 내용이 달라질 수 있으며, 최신 정보는 OpenAI 공식 채널에서 직접 확인하시기 바랍니다.

댓글 남기기