GPT-5.4 mini-2026-03-17
GPT-5.4 mini, 무료로 쓴다고요?
조건이 다릅니다
OpenAI가 2026년 3월 17일 GPT-5.4 mini와 GPT-5.4 nano를 공개했습니다. “가장 성능 좋은 소형 모델”이라는 타이틀이 붙었고, 무료 사용자도 쓸 수 있다는 소식이 퍼졌죠. 근데 막상 조건을 들여다보면 생각과 좀 다릅니다. GPT-5.4 mini를 Plus 구독자가 써보려고 하면 기본값이 아닙니다. nano는 ChatGPT에서 아예 접근이 안 됩니다. 공식 발표문과 API 문서를 직접 확인한 내용을 정리했습니다.
GPT-5.4 mini는 어디서, 어떻게 쓸 수 있나
GPT-5.4 mini는 2026년 3월 17일 OpenAI 공식 블로그를 통해 발표된 모델입니다. 공식 발표문에는 접근 방법이 세 가지로 나와 있습니다. API, Codex, 그리고 ChatGPT입니다.
API에서는 모든 Tier 1 이상 사용자가 사용할 수 있고, 텍스트와 이미지 입력, 툴 사용, 함수 호출, 웹 검색, 컴퓨터 사용, 스킬 기능을 모두 지원합니다. Codex에서는 앱, CLI, IDE 확장, 웹 전반에서 쓸 수 있습니다. ChatGPT에서는 조건이 붙습니다. Free와 Go 플랜 사용자에게는 Thinking 기능의 기본 모델로 제공됩니다. 이 부분이 핵심입니다.
OpenAI가 공식 발표문에서 직접 밝힌 문장은 이렇습니다. “In ChatGPT, GPT‑5.4 mini is available to Free and Go users via the Thinking feature in the + menu. For all other users, GPT‑5.4 mini is available as a rate limit fallback for GPT‑5.4 Thinking.” (출처: OpenAI 공식 발표, 2026.03.17) 다시 말해 Plus·Team·Pro 사용자는 GPT-5.4 mini를 기본값으로 선택할 수 없습니다.
💡 공식 발표문과 API 문서를 같이 놓고 보면, “누구나 mini를 쓸 수 있다”는 말과 “실제로 어떤 조건에서 mini가 작동하느냐”는 완전히 다른 이야기임을 알 수 있습니다.
Plus 구독자에게 mini가 기본이 아닌 이유
ChatGPT Plus 구독자는 월 29,000원을 내고 GPT-5.4 Thinking을 쓸 수 있습니다. 이 상태에서 Thinking 한도를 다 소진하면, 그때 자동으로 GPT-5.4 mini로 전환됩니다. 스스로 “이번엔 mini로 할게요”라고 선택하는 구조가 아닙니다.
공식 문서의 표현은 “rate limit fallback”입니다. 한도 초과 시 대체 모델이라는 뜻입니다. 이 구조는 평소 GPT-5.4의 품질을 경험하다가 한도가 소진되면 mini로 내려가는 방식입니다. Plus 사용자 입장에서 mini는 선택지가 아니라 한도 소진 후 자동 대응책입니다.
반면 Free와 Go 플랜 사용자에게는 mini가 Thinking 기능의 메인 모델입니다. 이 설계를 반대로 읽으면 이런 의미입니다. OpenAI는 mini를 “무료 사용자가 처음 접하는 추론 모델”로 포지셔닝하면서, 유료 구독자에게는 full GPT-5.4를 기본으로 제공하는 구조를 유지했습니다. 쉽게 말해 mini를 쓰려면 오히려 돈을 덜 내야 기본값으로 접근됩니다.
nano는 ChatGPT에서 접근 자체가 안 됩니다
GPT-5.4 nano에 대한 오해가 더 큽니다. 발표 초반에 “OpenAI 최신 소형 모델 출시”라는 제목의 글들이 많이 퍼졌는데, nano를 ChatGPT에서 직접 쓸 수 있는 것처럼 소개한 경우가 꽤 있었습니다.
공식 발표문의 내용은 명확합니다. “GPT‑5.4 nano is only available in the API.” (출처: OpenAI 공식 발표, 2026.03.17) ChatGPT 인터페이스, Codex 앱, IDE 확장 등 어디서도 nano를 직접 선택해서 쓸 수 없습니다. API 요청으로만 접근 가능합니다. API에서의 가격은 입력 100만 토큰당 $0.20, 출력 100만 토큰당 $1.25입니다. (출처: Times of India, 2026.03.18 / OpenAI 공식 발표)
⚠️ 정리: nano를 쓰려면 OpenAI API 키와 개발 환경이 필요합니다. 일반 ChatGPT 사용자에게는 해당 없는 모델입니다.
nano는 분류, 데이터 추출, 랭킹, 간단한 코딩 서브에이전트에 특화돼 있습니다. OpenAI가 공식 문서에서 명시한 권장 용도입니다. 빠르고 싸지만, 그 용도가 매우 좁습니다. 컴퓨터 사용(Computer Use)은 공식적으로 지원하지 않습니다.
컨텍스트 창 400K, 어디서 막히나
“맥락을 많이 넣을수록 성능도 좋겠지”라는 기대가 있습니다. GPT-5.4 mini의 컨텍스트 창은 400K 토큰입니다. GPT-5.4(1.05M 토큰)의 절반도 안 됩니다. (출처: OpenAI API 문서, 2026.03.17) 이 자체보다 중요한 건, 컨텍스트가 길어질수록 추론 성능이 급격히 떨어진다는 공식 수치입니다.
GPT-5.4 mini의 장문 컨텍스트 벤치마크를 보면 이렇습니다. MRCR v2 8-needle 테스트(여러 유사한 정보 중 원하는 것을 정확히 찾는 테스트)에서, 64K~128K 구간에서 47.7%, 128K~256K 구간에서는 33.6%로 뚝 떨어집니다. (출처: OpenAI 공식 발표, 2026.03.17) 반면 full GPT-5.4의 같은 구간 점수는 86.0%, 79.3%입니다. 숫자로 보면 약 2~2.4배 차이입니다.
| 벤치마크 구간 | GPT-5.4 | GPT-5.4 mini | GPT-5.4 nano |
|---|---|---|---|
| MRCR v2 8-needle (64K~128K) | 86.0% | 47.7% | 44.2% |
| MRCR v2 8-needle (128K~256K) | 79.3% | 33.6% | 33.1% |
| Graphwalks BFS (128K 초과) | — | 76.3% | 73.4% |
이 수치가 말하는 건 이겁니다. mini로 대용량 코드베이스를 통째로 넣어 분석하거나, 긴 법률 문서를 처음부터 끝까지 교차 검토하는 용도로 쓰면, 성능이 full 모델의 절반 수준으로 내려갑니다. 짧고 빠른 작업에서의 장점이 장문 작업에서는 사라집니다.
Codex에서 mini 쓰면 비용이 줄어드는 구조
Codex 사용자에게 GPT-5.4 mini가 진짜 유용한 이유가 있습니다. Codex에서 GPT-5.4를 쓰면 사용 쿼터가 1단위씩 소비되는데, GPT-5.4 mini는 GPT-5.4 쿼터의 30%만 소비합니다. (출처: OpenAI 공식 발표, 2026.03.17) 같은 쿼터로 mini를 쓰면 약 3.3배 많은 작업을 처리할 수 있다는 뜻입니다.
OpenAI가 권장하는 구조는 이렇습니다. GPT-5.4가 큰 계획을 세우고 최종 판단을 내리는 동안, GPT-5.4 mini 서브에이전트들이 코드베이스 검색, 대용량 파일 검토, 보조 문서 처리 같은 병렬 작업을 빠르게 처리하는 방식입니다. Codex 내 서브에이전트 구조에 대한 설명은 OpenAI Developers 문서에 별도로 있습니다.
💡 공식 발표문에 담긴 서브에이전트 패턴을 실제 Codex 워크플로우에 대입해 보면, mini를 “저렴한 대체재”가 아니라 “병렬 위임 전용 역할”로 쓰는 게 원래 의도였음을 알 수 있습니다.
이 구조는 GPT-5.4 mini가 단독으로 모든 걸 다 잘해야 한다는 전제가 없다는 뜻이기도 합니다. 빠른 서브태스크 처리가 핵심 역할이고, 판단과 조율은 상위 모델이 맡습니다. mini를 독립 모델로 쓸 때와 에이전트 체계 안에서 쓸 때 기대값이 달라야 합니다.
벤치마크 수치를 그대로 믿으면 안 되는 이유
GPT-5.4 mini의 SWE-Bench Pro 점수는 54.4%, full GPT-5.4는 57.7%입니다. 3.3% 차이. 이걸 보고 “거의 같다”고 해석하는 글이 많은데, 숫자 자체보다 맥락을 봐야 합니다.
DataCamp의 분석에서 지적한 게 바로 이 부분입니다. OpenAI가 공개한 성능 대 지연시간 그래프에서 Y축이 35%에서 시작합니다. 0%에서 시작하면 모델 간 격차가 지금 그래프보다 훨씬 작아 보입니다. 그리고 OpenAI는 이 그래프에 오차범위를 포함하지 않았습니다. (출처: DataCamp, 2026.03.17) 오차범위가 있었다면 구간이 많이 겹쳤을 가능성이 있습니다.
지연시간 수치도 실측이 아닙니다. OpenAI 공식 발표문에는 “We estimate latency by looking at the production behavior of our models, and simulating this offline. Real-world latency may vary substantially”라고 명시돼 있습니다. (출처: OpenAI 공식 발표, 2026.03.17) 실제 네트워크 환경, 쿼리 복잡도, 서버 부하에 따라 체감이 달라집니다. 벤치마크상 “2배 빠름”이 실제 사용에서 항상 그렇게 느껴진다는 보장은 없습니다.
Terminal-Bench 2.0 수치 해석: mini 60.0% vs GPT-5.4 75.1%. 이전 세대 플래그십 GPT-5.2(62.2%)와 비슷한 수준입니다. “지난해 최고 모델이 올해 mini”라는 패턴은 실제로 벤치마크로 뒷받침됩니다. 이 속도가 AI 모델 시장의 평가 주기를 얼마나 짧게 만드는지를 보여주는 수치입니다.
플랜별·목적별 선택 정리
지금까지 확인한 내용을 바탕으로 플랜과 목적에 따라 어떻게 접근해야 하는지를 정리했습니다.
| 상황 | GPT-5.4 mini 접근 방식 | 주의점 |
|---|---|---|
| ChatGPT Free·Go 플랜 | Thinking 기능의 기본 모델 | 한도 있음, 초과 시 기본 모드로 전환 |
| ChatGPT Plus·Team·Pro | GPT-5.4 Thinking 한도 소진 후 fallback | 직접 선택 불가, 자동 전환만 가능 |
| API 개발자 | gpt-5.4-mini 모델명으로 직접 호출 | 장문 컨텍스트(128K 이상) 시 성능 급락 |
| Codex 사용자 | GPT-5.4 쿼터의 30% 소비로 병렬 서브태스크 처리 | 단독 메인 모델보다 서브에이전트 역할이 본래 용도 |
| GPT-5.4 nano 사용 | API 전용 (gpt-5.4-nano) | ChatGPT·Codex에서 접근 불가, Computer Use 미지원 |
솔직히 말하면, 지금 GPT-5.4 mini가 가장 가성비 좋게 느껴지는 사람은 API를 직접 다루면서 고볼륨·저지연 작업을 하는 개발자입니다. ChatGPT 일반 사용자에게는 mini가 “선택하는 모델”이 아니라 “어느새 쓰게 되는 모델”에 가깝습니다.
Q&A
마치며
GPT-5.4 mini는 분명히 좋은 모델입니다. GPT-5 mini 대비 2배 빠르고, 코딩·멀티모달·툴 사용 성능이 전부 올라갔습니다. SWE-Bench Pro 기준 54.4%는 지난해 플래그십들과 비교해 충분히 인상적인 숫자입니다.
하지만 “누구나 mini를 쓸 수 있다”와 “누구나 mini를 선택해서 쓸 수 있다”는 다른 말입니다. Plus 사용자에게 mini는 기본값이 아니고, nano는 API 밖에서는 아예 없는 모델입니다. 컨텍스트가 길어지면 추론 성능이 절반 가까이 빠진다는 것도 공식 벤치마크가 이미 말해주고 있습니다.
제 판단으로는, GPT-5.4 mini가 진짜 빛을 발하는 건 Codex의 서브에이전트 구조나 API 고볼륨 파이프라인입니다. ChatGPT 일상 사용자라면 mini를 의식해서 쓰게 되는 경우가 오히려 드물 겁니다. 모델 선택의 기준은 스펙이 아니라, 내 플랜과 실제 사용 패턴에서 어디에 붙는지를 먼저 확인하는 쪽입니다.
본 포스팅 참고 자료
- OpenAI 공식 발표 — Introducing GPT-5.4 mini and nano (2026.03.17)
https://openai.com/index/introducing-gpt-5-4-mini-and-nano/ - OpenAI Developers — GPT-5.4 mini 모델 공식 문서
https://developers.openai.com/api/docs/models/gpt-5.4-mini - OpenAI 공식 발표 — Introducing GPT-5.4 (2026.03.05)
https://openai.com/index/introducing-gpt-5-4/ - DataCamp — GPT-5.4 mini and nano: Benchmarks, Access, and Reactions (2026.03.17)
https://www.datacamp.com/blog/gpt-5-4-mini-nano
본 포스팅은 2026년 3월 27일 기준 공개된 공식 자료를 바탕으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. OpenAI의 모델 배포 조건·가격·접근 방식은 별도 공지 없이 변경되는 경우가 있습니다.











댓글 남기기