GPT-5.4 mini, 무료도 된다고요? 조건이 따로 있습니다
2026년 3월 18일, OpenAI가 GPT-5.4 mini와 nano를 동시에 출시했습니다. “무료 사용자도 플래그십 성능”이라는 문구가 화제가 됐는데, 공식 문서를 직접 들여다보면 이야기가 조금 달라집니다. 쓸 수는 있습니다. 단, 어떤 메뉴를 어떻게 눌러야 하는지, 한도가 초과되면 자동으로 어떻게 바뀌는지를 먼저 알아야 원하는 모델을 제대로 쓸 수 있습니다.
GPT-5.4 mini란 무엇인지 — 결론부터
중요한 점은 이 모델이 세 채널에서 각각 다르게 제공된다는 것입니다. ChatGPT, Codex, API — 각 채널마다 접근 방식이 다르고, 한도 소비 방식도 완전히 다릅니다. “무료도 된다”는 말은 ChatGPT 앱 기준 사실이지만, 어떤 방식으로 쓸 수 있는지는 요금제마다 다릅니다.
nano는 별개입니다. GPT-5.4 nano는 API에서만 사용 가능하고 ChatGPT 앱에서는 아예 선택할 수 없습니다. 이 부분을 섞어서 이해하면 혼란이 생깁니다.
요금제별 접근 방식이 완전히 다릅니다
공식 발표문에 나온 내용을 그대로 정리하면 이렇습니다. Free와 Go 사용자는 ChatGPT 앱에서 메시지 입력창의 + 메뉴 → ‘잘 생각하기(Thinking)’를 눌러 GPT-5.4 mini를 직접 선택해 쓸 수 있습니다. 자동으로 활성화되는 것이 아니라, 반드시 직접 메뉴를 눌러야 합니다. (출처: OpenAI 공식 블로그, 2026.03.17)
Plus 사용자는 다릅니다. Plus는 GPT-5.4 Thinking을 직접 쓸 수 있고, mini는 GPT-5.4 Thinking의 주간 한도(3,000개)를 소진했을 때 자동으로 강등되어 쓰이게 됩니다. 즉, Plus 입장에서 mini는 ‘선택 모델’이 아니라 ‘한도 초과 시 자동 대체 모델’입니다. (출처: OpenAI 헬프 센터, GPT-5.3 and GPT-5.4 in ChatGPT)
| 요금제 | ChatGPT에서 mini 사용 방식 | 직접 선택 가능? |
|---|---|---|
| Free | + 메뉴 → 잘 생각하기 선택 시 | ✅ 직접 선택 |
| Go | + 메뉴 → 잘 생각하기 선택 시 | ✅ 직접 선택 |
| Plus | GPT-5.4 Thinking 주간 한도 초과 시 자동 전환 | ❌ 자동 강등만 |
| Pro | 사실상 사용 불필요 (무제한 GPT-5.4 Thinking) | — |
출처: OpenAI 공식 발표 (2026.03.17), OpenAI 헬프 센터
Free 사용자에게 중요한 함정이 하나 있습니다. Free는 GPT-5.3으로 5시간마다 10개 메시지를 쓸 수 있는데, 이 한도를 초과하면 mini 버전으로 자동 전환됩니다. 즉, Free 사용자는 두 가지 경로로 mini를 쓸 수 있는 셈입니다 — 직접 Thinking을 눌러 쓰거나, GPT-5.3 한도 소진 후 자동 대체로 쓰거나.
Codex에서 쓰면 훨씬 유리한 이유
💡 공식 발표문의 Codex 관련 수치를 ChatGPT 한도 구조와 같이 놓고 보니 이런 차이가 보였습니다.
Codex에서 GPT-5.4 mini는 GPT-5.4 할당량의 30%만 소비합니다. (출처: OpenAI 공식 블로그, 2026.03.17) 이 수치가 의미하는 바를 계산해 보면 이렇습니다. Plus 사용자의 GPT-5.4 Thinking 주간 한도는 3,000개인데, Codex에서 mini로 처리할 경우 같은 할당량으로 약 10,000개 작업을 처리할 수 있는 셈입니다. 단순 구조상 3.3배 더 쓸 수 있습니다.
OpenAI가 권장하는 사용 패턴은 “큰 모델이 계획·조율·최종 판단을 맡고, mini 서브에이전트가 코드베이스 검색·대용량 파일 검토·보조 문서 처리를 병렬로 담당하는 구조”입니다. 코딩 작업에서 간단한 하위 태스크를 mini에 맡기면 GPT-5.4 할당을 아끼면서도 전체 작업 속도를 높일 수 있습니다. 공식 문서에 서브에이전트 설정 방법이 별도로 나와 있습니다. (출처: developers.openai.com/codex/subagents/)
단, Codex에서 mini를 기본값으로 설정하지 않으면 자동으로 GPT-5.4가 사용됩니다. 할당량을 효율적으로 쓰려면 서브에이전트 설정을 직접 해줘야 한다는 점을 공식 문서는 별도로 강조하고 있습니다.
성능 벤치마크 — GPT-5.4와 어디서 벌어지나
공식 발표 벤치마크 수치를 그대로 옮겨봤습니다. 코딩과 컴퓨터 사용(CUA) 영역에서 mini는 본 모델에 상당히 가깝습니다. 반면 툴 호출 복잡도가 올라갈수록, 그리고 롱컨텍스트 구간에서 격차가 크게 벌어집니다.
| 벤치마크 | GPT-5.4 | GPT-5.4 mini | GPT-5 mini |
|---|---|---|---|
| SWE-Bench Pro (코딩) | 57.7% | 54.4% | 45.7% |
| OSWorld-Verified (CUA) | 75.0% | 72.1% | 42.0% |
| GPQA Diamond (추론) | 93.0% | 88.0% | 81.6% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 38.2% |
| HLE (도구 없이) | 39.8% | 28.2% | 18.3% |
코딩(SWE-Bench Pro)과 컴퓨터 사용(OSWorld-Verified)에서는 본 모델과 차이가 3~5%p 수준입니다. 체감상 코딩 보조 도구로 쓰기엔 충분히 가깝습니다. 반면 Terminal-Bench 2.0에서는 15%p 이상 벌어지고, 도구 없이 순수 추론(HLE w/o tools)에서는 28.2% vs 39.8%로 본 모델 대비 70% 수준입니다. 터미널 명령 자동화나 복잡한 멀티스텝 추론이 필요한 작업에서는 mini로 대체하기 어렵다는 뜻입니다.
롱컨텍스트에서 실제로 어떻게 달라지는가
💡 mini를 선택할 때 ‘컨텍스트 창이 400K나 되니까 긴 문서도 문제없겠다’고 생각하기 쉬운데, 수치를 보면 다른 그림이 나옵니다.
| 구간 | GPT-5.4 | GPT-5.4 mini | GPT-5 mini |
|---|---|---|---|
| 64K~128K 토큰 | 86.0% | 47.7% | 35.1% |
| 128K~256K 토큰 | 79.3% | 33.6% | 19.4% |
64K~128K 구간에서 GPT-5.4는 86.0%를 유지하는데, mini는 47.7%로 떨어집니다. 128K~256K 구간에서는 mini가 33.6%까지 내려갑니다. 본 모델 대비 42% 수준입니다. 400K 창을 지원한다고 해서 긴 문서 전체를 정확하게 처리하는 것과는 다릅니다. 대용량 코드베이스 분석이나 수십 페이지 계약서 리뷰처럼 긴 맥락이 핵심인 작업에는 mini가 적합하지 않습니다.
Graphwalks 벤치마크(그래프 순회 계산)에서는 76.3%로 본 모델(93.1%) 대비 상대적으로 낮지만 GPT-5 mini(73.4%)보다는 높습니다. 연속 참조가 많은 작업보다는 단발성 쿼리 집약 작업에 mini가 적합합니다.
GPT-5.4 nano는 왜 ChatGPT에서 못 쓰나
💡 nano와 mini를 같은 선상에서 보면 안 됩니다. 두 모델의 설계 목적이 다릅니다.
API 가격은 입력 $0.20 / 출력 $1.25 (100만 토큰 기준)으로, mini(입력 $0.75 / 출력 $4.50)보다 훨씬 저렴합니다. 단, OSWorld-Verified에서 nano는 39.0%로, mini(72.1%)보다 성능이 큰 폭으로 낮고, 전 세대 GPT-5 mini(42.0%)보다도 낮습니다. 컴퓨터 사용(CUA) 작업에 nano는 적합하지 않습니다.
API 가격이 전 세대 대비 크게 올랐다는 점도 확인했습니다. nano는 GPT-5 nano 대비 입력 4배, 출력 3.125배 올랐고, mini는 입력 3배, 출력 2.25배 인상됐습니다. (출처: 나무위키 GPT-5 문서, 2026.03.18) OpenAI가 공식 블로그에서 별도 이유를 밝히지 않은 부분입니다.
자주 묻는 질문 5가지
마치며 — 총평
그런데 “무료도 된다”는 문구 뒤에 따라오는 조건들을 모르고 쓰면 원하는 모델을 쓰고 있지 않을 수 있습니다. Free는 직접 눌러야 하고, Plus는 한도 초과 후 자동 강등으로만 만납니다. Codex에서 할당을 아끼려면 서브에이전트 설정을 따로 해야 합니다.
롱컨텍스트 성능 급락 구간은 솔직히 아쉬운 부분입니다. 128K를 넘어가는 작업에서는 mini가 본 모델의 절반도 안 되는 성능을 냅니다. 이 부분이 다음 버전에서 개선될지가 mini의 실용성을 판가름하는 핵심이 될 것 같습니다.
본 포스팅 참고 자료
- ① OpenAI 공식 발표 — Introducing GPT-5.4 mini and nano (openai.com/index/introducing-gpt-5-4-mini-and-nano/)
- ② OpenAI 헬프 센터 — GPT-5.3 and GPT-5.4 in ChatGPT (help.openai.com/ko-kr/articles/11909943)
- ③ OpenAI Codex 서브에이전트 공식 문서 (developers.openai.com/codex/subagents/)
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 본 포스팅은 2026년 3월 21일 기준으로 작성되었으며, 모든 수치는 OpenAI 공식 발표 자료를 기준으로 합니다.











댓글 남기기