GPT-5.4 mini · nano
IT / AI
GPT-5.4 mini, 무료로 썼더니 조건이 있었습니다
OpenAI가 2026년 3월 18일 공개한 GPT-5.4 mini와 nano — 플래그십 성능을 더 빠르고 저렴하게 쓴다는 건 맞는데, 막상 써보면 맥락이 다릅니다. 무료 접근은 가능하지만 ‘폴백 구조’라는 전제가 붙고, nano는 분류·추출 전용인데도 빠르다는 이유만 믿고 복잡한 작업을 맡겼다가 전 세대보다 못한 점수를 받는 경우가 실제로 벤치마크에서 확인됩니다.
무료로 쓸 수 있다는 말의 진짜 의미
OpenAI는 2026년 3월 17일(현지 기준) 공식 블로그를 통해 “GPT-5.4 mini와 nano는 지금까지 선보인 소형 모델 중 가장 높은 성능을 갖췄다”고 밝혔습니다. 무료 ChatGPT 사용자와 Go 플랜 사용자도 ‘+’ 메뉴에서 ‘잘 생각하기(Thinking)’ 기능을 선택하면 GPT-5.4 mini에 접근할 수 있다는 설명도 함께 나왔습니다. (출처: OpenAI 공식 블로그, 2026.03.17)
그런데 여기에 전제가 붙습니다. 무료 사용자가 Thinking 모드를 눌렀을 때 처음부터 mini를 쓰는 것이 아니라, 유료 사용자가 GPT-5.4 Thinking 한도를 다 채운 경우에 자동으로 mini로 전환되는 ‘폴백(fallback)’ 구조가 기본 설계입니다. 나무위키에 정리된 출시 내용을 보면 “Plus 요금제 이상의 사용자는 GPT-5.4 Thinking 한도를 다 쓰면 자동으로 전환된다”고 명시되어 있습니다. (출처: 나무위키 GPT-5 항목, 2026.03 갱신본) 무료 사용자도 접근은 가능하지만, 대화를 시작할 때마다 mini가 활성화된다는 보장은 없습니다.
결론부터 말씀드리면, “무료로 GPT-5.4 mini를 쓸 수 있다”는 표현은 기술적으로 사실이지만 상시 접근이 아닌 조건부 접근입니다. 이 구분이 실제 사용 경험에서 꽤 중요합니다.
mini vs nano, 이름만 비슷하고 설계가 다릅니다
GPT-5.4 mini와 nano를 그냥 ‘작은 버전’으로 묶어 생각하면 실망하기 쉽습니다. 설계 의도가 처음부터 다릅니다. mini는 코딩, 추론, 멀티모달(이미지·오디오 해석), 컴퓨터 조작 등 복합 작업을 빠르게 처리하는 범용 경량 모델입니다. GPT-5 mini 대비 응답 속도가 2배 이상 빠르고, SWE-Bench Pro(실제 소프트웨어 버그 수정 능력 측정)에서 54.4%를 기록하며 플래그십 GPT-5.4(57.7%)에 근접한 수준을 보였습니다. (출처: OpenAI 공식 발표, 2026.03.17)
반면 nano는 처음부터 분류(Classification), 데이터 추출(Extraction), 랭킹(Ranking), 단순 코딩 서브에이전트 같은 반복성·단순성 작업에 최적화됐습니다. 이미지를 읽거나 복잡한 화면을 분석하는 Computer Use 능력은 애초에 주력 기능이 아닙니다. 역할을 구분하자면, mini는 ‘실행 담당 직원’이고 nano는 ‘단순 처리 담당 직원’에 가깝습니다. OpenAI의 공식 발표문도 nano 권장 용도로 “속도와 비용이 중요한 작업”만 명시하고 있습니다.
| 항목 | GPT-5.4 mini | GPT-5.4 nano |
|---|---|---|
| 주력 용도 | 코딩·추론·멀티모달·UI 조작 | 분류·추출·랭킹·단순 반복 |
| 컨텍스트 윈도우 | 400,000 토큰 | 400,000 토큰 |
| ChatGPT 접근 | 무료·Go·Plus 모두 가능(조건부) | API 전용(웹 UI 불가) |
| API 입력 요금 | $0.75 / 1M 토큰 | $0.20 / 1M 토큰 |
| 전 세대 대비 가격 인상 | 입력 3배 ↑ | 입력 4배 ↑ |
(출처: 나무위키 GPT-5 항목·OpenAI 공식 발표 2026.03.17 기준)
nano가 전 세대보다 낮은 점수를 받는 이유
💡 OpenAI 공식 벤치마크를 mini와 nano 나란히 놓고 보면, 단순히 크기 차이가 아니라 설계 목적이 다르다는 게 수치로 드러납니다.
GPT-5.4 nano가 ‘가장 저렴한 모델’로 주목받지만, 특정 벤치마크에서는 한 세대 전인 GPT-5 mini보다 낮은 점수를 받습니다. OpenAI가 공개한 벤치마크 결과를 보면, 데스크톱 UI를 AI가 직접 조작하는 능력을 측정하는 OSWorld-Verified에서 nano는 39.0%, GPT-5 mini는 42.0%를 기록했습니다. (출처: OpenAI 공식 벤치마크, 2026.03.17) nano가 전 세대보다 낮습니다. 이 수치가 의미하는 건 단순합니다 — nano를 Computer Use 에이전트에 투입하면 더 오래된 모델보다 못 할 수 있습니다.
IT동아 기사에서도 이 점을 명확히 짚었습니다. “나노의 경우 OSWorld-Verified 항목에서 39.0%를 기록, GPT-5 미니(42.0%)에도 미치지 못한 수준으로 나타났다. 이는 추론 깊이가 필요 없는 작업에서는 비용 우위가 뚜렷하지만, 복잡한 화면 조작이나 고급 추론에는 적합하지 않다는 것으로 해석할 수 있다.” (출처: IT동아, 2026.03.24) 빠르고 저렴하다고 해서 모든 작업에 nano를 넣으면 오히려 성능이 떨어지는 구조입니다.
반면 nano가 강한 SWE-Bench Pro(실제 버그 수정)에서는 52.4%로 GPT-5 mini(45.7%)를 오히려 앞섭니다. 텍스트 기반 코딩 작업과 UI 조작 작업에서 결과가 뒤집히는 이 패턴을 이해해야 nano를 제대로 쓸 수 있습니다.
가격이 올랐는데 가성비라고 부를 수 있는 근거
💡 GPT-5.4 nano의 API 가격은 전 세대 GPT-5 nano 대비 입력 기준 4배 올랐습니다. 그런데 동시에 성능도 올랐습니다 — 어느 쪽 성능인지를 확인하면 판단이 달라집니다.
나무위키 GPT-5 항목에 정리된 API 가격 비교를 보면, GPT-5.4 mini는 입력이 백만 토큰당 $0.75로 GPT-5 mini($0.25) 대비 3배 인상됐고, GPT-5.4 nano는 $0.20으로 GPT-5 nano($0.05 추정) 대비 4배가량 올랐습니다. (출처: 나무위키 GPT-5, 2026.03 갱신본) 이것만 보면 가격이 치솟은 것처럼 보입니다.
그런데 같은 벤치마크 결과를 가격과 함께 놓으면 이야기가 달라집니다. GPT-5.4 mini는 SWE-Bench Pro에서 플래그십 GPT-5.4(57.7%)의 94.3% 성능을 냅니다. 그러면서 가격은 플래그십 입력 비용 $2.50의 30% 수준입니다. IT동아는 이를 두고 “GPT-5.4 미니는 플래그십 대비 94%의 코딩 성능을 30% 비용으로 제공한다”고 표현했습니다. (출처: IT동아, 2026.03.24) 플래그십 성능을 거의 그대로 유지하면서 비용을 70% 줄일 수 있다면 단순히 ‘비싸진 버전’이 아닙니다.
nano도 마찬가지입니다. 텍스트 분류·추출·랭킹 작업 기준으로는 SWE-Bench Pro 52.4%를 기록하며 GPT-5 mini(45.7%)를 앞섭니다. 텍스트 작업 한정으로는 전 세대 중급 모델의 성능을 전 세대 소형 모델 가격의 80% 수준에서 쓸 수 있습니다. 어느 작업에 쓰느냐가 가성비를 결정하는 구조입니다.
컨텍스트 윈도우, 플래그십과의 차이가 실무에서 보이는 순간
mini와 nano의 컨텍스트 윈도우는 공통적으로 400,000 토큰입니다. 넉넉해 보이지만 플래그십 GPT-5.4의 1,050,000 토큰과 비교하면 절반에도 못 미칩니다. (출처: 나무위키 GPT-5, 2026.03 갱신본) 400K는 대략 일반 소설 한 권 분량을 통째로 맥락에 넣을 수 있는 크기이지만, 대규모 코드베이스 분석이나 장문 계약서 전체를 한 번에 처리하는 엔터프라이즈 작업에서는 한계가 드러납니다.
실무에서 이 차이가 눈에 띄는 건 주로 두 가지 경우입니다. 첫째, 수만 줄짜리 코드베이스를 탐색하면서 특정 함수의 의존 관계를 추적할 때 컨텍스트 한계에 부딪혀 초반 파일 내용을 잊어버리는 경우, 둘째, 긴 대화 흐름을 유지하면서 초반 지시 사항을 끝까지 기억해야 하는 에이전트 작업에서 한도를 넘는 경우입니다. 이런 작업에서는 mini 대신 플래그십 GPT-5.4를 플래너로 두고 mini를 실행자로 쓰는 계층 구조가 공식적으로 권장됩니다.
OpenAI가 Codex에서 제안한 아키텍처가 정확히 이 구조입니다. 플래그십이 계획하고 mini·nano가 병렬로 하위 작업을 처리하는 방식으로, Codex에서 mini 서브에이전트를 쓰면 플래그십 쿼터의 30%만 소모됩니다. (출처: OpenAI 공식 발표, 2026.03.17) 컨텍스트 한계는 단점이 맞지만, 이 구조로 설계하면 오히려 비용을 낮추는 방향으로 활용할 수 있습니다.
실제로 어떤 작업에 쓰면 좋은가 — 용도 구분표
💡 OpenAI 공식 발표문과 실제 벤치마크 수치를 함께 놓고 보면, mini와 nano가 겹치지 않게 설계됐다는 패턴이 보입니다. 같은 ‘경량 모델’이지만 서로 다른 작업에서 우열이 뒤집힙니다.
지금까지 살펴본 벤치마크와 설계 목적을 정리하면 용도 구분이 꽤 명확해집니다. τ2-bench(통신 분야 멀티턴 에이전트 테스트)에서 mini는 93.4%를 기록하며 GPT-5 mini(74.1%)를 20%포인트 가까이 앞섰습니다. (출처: fornewchallenge 티스토리·글로벌GPT 비교 분석, 2026.03.19) 툴 호출이 많고 복잡도가 높은 에이전트 작업에서는 mini가 압도적입니다.
반면 수만 건의 텍스트를 JSON으로 분류하거나 PDF에서 날짜·숫자를 뽑는 파이프라인에서는 nano가 mini보다 훨씬 저렴하면서 비슷한 정확도를 냅니다. nano의 SWE-Bench Pro 52.4%는 텍스트 기반 코딩 작업에서 GPT-5 mini를 앞선다는 점도 참고가 됩니다. 가격은 mini 대비 약 4분의 1 수준(입력 $0.20 vs $0.75)이므로 대량 처리 파이프라인에서는 비용 차이가 큽니다.
| 작업 유형 | 추천 모델 | 근거 |
|---|---|---|
| UI 스크린샷 해석·클릭 자동화 | mini | OSWorld 72.1%(nano 39.0% 대비) |
| 실시간 코딩·디버깅·프론트엔드 생성 | mini | Terminal-Bench 60.0%(nano 46.3%) |
| 텍스트 대량 분류·추출·랭킹 | nano | 입력 $0.20, SWE 52.4% |
| 이미지 설명·메타데이터 추출(대량) | nano | 이미지 1장 약 $0.00069 |
| 멀티턴 에이전트·복잡한 플래닝 | GPT-5.4(플래그십) | 컨텍스트 105만 토큰 필요 시 |
(출처: OpenAI 공식 발표·IT동아·나무위키 GPT-5, 2026.03.17~24 기준)
Q&A
Q1. GPT-5.4 mini를 무료 ChatGPT에서 항상 쓸 수 있나요?
Q2. GPT-5.4 nano는 일반 ChatGPT에서 쓸 수 있나요?
Q3. GPT-5.4 nano가 GPT-5 mini보다 느린 경우가 있다고요?
Q4. API 가격이 전 세대보다 올랐는데 쓸 이유가 있나요?
Q5. GPT-5.4 mini 출시로 기존 GPT-5 Thinking mini는 어떻게 되나요?
마치며
GPT-5.4 mini와 nano는 잘 만든 경량 모델입니다. 그런데 출시 직후 쏟아진 소개 글 대부분이 “무료로 쓸 수 있다”, “Gemini Flash보다 저렴하다”에서 멈춥니다. 실제로 쓸 때 중요한 건 조건부 무료 접근 구조, nano가 Computer Use 작업에서 전 세대에도 뒤진다는 벤치마크, 그리고 플래그십의 절반도 안 되는 컨텍스트 윈도우 제한입니다.
정리하면 이렇습니다. UI 조작이나 복잡한 에이전트 작업이라면 mini, 텍스트 분류·추출 파이프라인이라면 nano, 코드베이스 전체를 한 번에 다뤄야 한다면 플래그십 GPT-5.4. 두 모델을 섞어 쓰는 구조가 OpenAI의 의도이고, 그 구조를 이해하고 설계하면 비용을 크게 줄일 수 있습니다.
GPT-5 Thinking mini는 2026년 4월 18일에 지원이 끊깁니다. 지금이 전환 시점을 잡기 좋은 때입니다.
본 포스팅 참고 자료
- 나무위키 GPT-5 항목 (2026.03 갱신본) — https://namu.wiki/w/GPT-5
- IT동아 「오픈AI·업스테이지, 전략적인 새 모델 출시로 주목」 2026.03.24 — https://it.donga.com/108608/
- OpenAI 공식 모델 문서 — https://platform.openai.com/docs/models
- fornewchallenge 티스토리 「GPT-5.4 mini와 nano: 무료 체험 + 2배 빠른 속도」 2026.03.19 — https://fornewchallenge.tistory.com
본 포스팅은 2026년 3월 26일 기준으로 작성되었습니다. OpenAI GPT-5.4 mini·nano 기준(2026.03.18 출시). 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 벤치마크 수치는 OpenAI 공식 발표 기준이며, 실제 사용 환경에 따라 결과가 다를 수 있습니다.











댓글 남기기