GPT-5.4 mini, 무료도 된다고요? 조건이 따로 있습니다

Published on

in

GPT-5.4 mini, 무료도 된다고요? 조건이 따로 있습니다

2026.03.18 공식 출시 기준 / GPT-5.4 mini

GPT-5.4 mini, 무료도 된다고요? 조건이 따로 있습니다

2026년 3월 18일, OpenAI가 GPT-5.4 mini와 nano를 동시에 출시했습니다. “무료 사용자도 플래그십 성능”이라는 문구가 화제가 됐는데, 공식 문서를 직접 들여다보면 이야기가 조금 달라집니다. 쓸 수는 있습니다. 단, 어떤 메뉴를 어떻게 눌러야 하는지, 한도가 초과되면 자동으로 어떻게 바뀌는지를 먼저 알아야 원하는 모델을 제대로 쓸 수 있습니다.

2× 빠름 GPT-5 mini 대비
Codex 30% 할당 소비
400K 토큰 컨텍스트 창
$0.75 / $4.50 API 토큰 가격

GPT-5.4 mini란 무엇인지 — 결론부터

중요한 점은 이 모델이 세 채널에서 각각 다르게 제공된다는 것입니다. ChatGPT, Codex, API — 각 채널마다 접근 방식이 다르고, 한도 소비 방식도 완전히 다릅니다. “무료도 된다”는 말은 ChatGPT 앱 기준 사실이지만, 어떤 방식으로 쓸 수 있는지는 요금제마다 다릅니다.

nano는 별개입니다. GPT-5.4 nano는 API에서만 사용 가능하고 ChatGPT 앱에서는 아예 선택할 수 없습니다. 이 부분을 섞어서 이해하면 혼란이 생깁니다.

▲ 목차로 돌아가기

요금제별 접근 방식이 완전히 다릅니다

공식 발표문에 나온 내용을 그대로 정리하면 이렇습니다. Free와 Go 사용자는 ChatGPT 앱에서 메시지 입력창의 + 메뉴 → ‘잘 생각하기(Thinking)’를 눌러 GPT-5.4 mini를 직접 선택해 쓸 수 있습니다. 자동으로 활성화되는 것이 아니라, 반드시 직접 메뉴를 눌러야 합니다. (출처: OpenAI 공식 블로그, 2026.03.17)

Plus 사용자는 다릅니다. Plus는 GPT-5.4 Thinking을 직접 쓸 수 있고, mini는 GPT-5.4 Thinking의 주간 한도(3,000개)를 소진했을 때 자동으로 강등되어 쓰이게 됩니다. 즉, Plus 입장에서 mini는 ‘선택 모델’이 아니라 ‘한도 초과 시 자동 대체 모델’입니다. (출처: OpenAI 헬프 센터, GPT-5.3 and GPT-5.4 in ChatGPT)

요금제 ChatGPT에서 mini 사용 방식 직접 선택 가능?
Free + 메뉴 → 잘 생각하기 선택 시 ✅ 직접 선택
Go + 메뉴 → 잘 생각하기 선택 시 ✅ 직접 선택
Plus GPT-5.4 Thinking 주간 한도 초과 시 자동 전환 ❌ 자동 강등만
Pro 사실상 사용 불필요 (무제한 GPT-5.4 Thinking)

출처: OpenAI 공식 발표 (2026.03.17), OpenAI 헬프 센터

Free 사용자에게 중요한 함정이 하나 있습니다. Free는 GPT-5.3으로 5시간마다 10개 메시지를 쓸 수 있는데, 이 한도를 초과하면 mini 버전으로 자동 전환됩니다. 즉, Free 사용자는 두 가지 경로로 mini를 쓸 수 있는 셈입니다 — 직접 Thinking을 눌러 쓰거나, GPT-5.3 한도 소진 후 자동 대체로 쓰거나.

▲ 목차로 돌아가기

Codex에서 쓰면 훨씬 유리한 이유

💡 공식 발표문의 Codex 관련 수치를 ChatGPT 한도 구조와 같이 놓고 보니 이런 차이가 보였습니다.

Codex에서 GPT-5.4 mini는 GPT-5.4 할당량의 30%만 소비합니다. (출처: OpenAI 공식 블로그, 2026.03.17) 이 수치가 의미하는 바를 계산해 보면 이렇습니다. Plus 사용자의 GPT-5.4 Thinking 주간 한도는 3,000개인데, Codex에서 mini로 처리할 경우 같은 할당량으로 약 10,000개 작업을 처리할 수 있는 셈입니다. 단순 구조상 3.3배 더 쓸 수 있습니다.

OpenAI가 권장하는 사용 패턴은 “큰 모델이 계획·조율·최종 판단을 맡고, mini 서브에이전트가 코드베이스 검색·대용량 파일 검토·보조 문서 처리를 병렬로 담당하는 구조”입니다. 코딩 작업에서 간단한 하위 태스크를 mini에 맡기면 GPT-5.4 할당을 아끼면서도 전체 작업 속도를 높일 수 있습니다. 공식 문서에 서브에이전트 설정 방법이 별도로 나와 있습니다. (출처: developers.openai.com/codex/subagents/)

단, Codex에서 mini를 기본값으로 설정하지 않으면 자동으로 GPT-5.4가 사용됩니다. 할당량을 효율적으로 쓰려면 서브에이전트 설정을 직접 해줘야 한다는 점을 공식 문서는 별도로 강조하고 있습니다.

▲ 목차로 돌아가기

성능 벤치마크 — GPT-5.4와 어디서 벌어지나

공식 발표 벤치마크 수치를 그대로 옮겨봤습니다. 코딩과 컴퓨터 사용(CUA) 영역에서 mini는 본 모델에 상당히 가깝습니다. 반면 툴 호출 복잡도가 올라갈수록, 그리고 롱컨텍스트 구간에서 격차가 크게 벌어집니다.

표: GPT-5.4 vs GPT-5.4 mini 벤치마크 비교 (reasoning_effort: xhigh 기준) — 출처: OpenAI 공식 발표, 2026.03.17
벤치마크 GPT-5.4 GPT-5.4 mini GPT-5 mini
SWE-Bench Pro (코딩) 57.7% 54.4% 45.7%
OSWorld-Verified (CUA) 75.0% 72.1% 42.0%
GPQA Diamond (추론) 93.0% 88.0% 81.6%
Terminal-Bench 2.0 75.1% 60.0% 38.2%
HLE (도구 없이) 39.8% 28.2% 18.3%

코딩(SWE-Bench Pro)과 컴퓨터 사용(OSWorld-Verified)에서는 본 모델과 차이가 3~5%p 수준입니다. 체감상 코딩 보조 도구로 쓰기엔 충분히 가깝습니다. 반면 Terminal-Bench 2.0에서는 15%p 이상 벌어지고, 도구 없이 순수 추론(HLE w/o tools)에서는 28.2% vs 39.8%로 본 모델 대비 70% 수준입니다. 터미널 명령 자동화나 복잡한 멀티스텝 추론이 필요한 작업에서는 mini로 대체하기 어렵다는 뜻입니다.

▲ 목차로 돌아가기

롱컨텍스트에서 실제로 어떻게 달라지는가

💡 mini를 선택할 때 ‘컨텍스트 창이 400K나 되니까 긴 문서도 문제없겠다’고 생각하기 쉬운데, 수치를 보면 다른 그림이 나옵니다.

표: 롱컨텍스트 벤치마크 — OpenAI MRCR v2 8-needle 기준 — 출처: OpenAI 공식 발표, 2026.03.17
구간 GPT-5.4 GPT-5.4 mini GPT-5 mini
64K~128K 토큰 86.0% 47.7% 35.1%
128K~256K 토큰 79.3% 33.6% 19.4%

64K~128K 구간에서 GPT-5.4는 86.0%를 유지하는데, mini는 47.7%로 떨어집니다. 128K~256K 구간에서는 mini가 33.6%까지 내려갑니다. 본 모델 대비 42% 수준입니다. 400K 창을 지원한다고 해서 긴 문서 전체를 정확하게 처리하는 것과는 다릅니다. 대용량 코드베이스 분석이나 수십 페이지 계약서 리뷰처럼 긴 맥락이 핵심인 작업에는 mini가 적합하지 않습니다.

Graphwalks 벤치마크(그래프 순회 계산)에서는 76.3%로 본 모델(93.1%) 대비 상대적으로 낮지만 GPT-5 mini(73.4%)보다는 높습니다. 연속 참조가 많은 작업보다는 단발성 쿼리 집약 작업에 mini가 적합합니다.

▲ 목차로 돌아가기

GPT-5.4 nano는 왜 ChatGPT에서 못 쓰나

💡 nano와 mini를 같은 선상에서 보면 안 됩니다. 두 모델의 설계 목적이 다릅니다.

API 가격은 입력 $0.20 / 출력 $1.25 (100만 토큰 기준)으로, mini(입력 $0.75 / 출력 $4.50)보다 훨씬 저렴합니다. 단, OSWorld-Verified에서 nano는 39.0%로, mini(72.1%)보다 성능이 큰 폭으로 낮고, 전 세대 GPT-5 mini(42.0%)보다도 낮습니다. 컴퓨터 사용(CUA) 작업에 nano는 적합하지 않습니다.

API 가격이 전 세대 대비 크게 올랐다는 점도 확인했습니다. nano는 GPT-5 nano 대비 입력 4배, 출력 3.125배 올랐고, mini는 입력 3배, 출력 2.25배 인상됐습니다. (출처: 나무위키 GPT-5 문서, 2026.03.18) OpenAI가 공식 블로그에서 별도 이유를 밝히지 않은 부분입니다.

▲ 목차로 돌아가기

자주 묻는 질문 5가지

▶ Q1. Free 사용자가 ChatGPT에서 GPT-5.4 mini를 쓰려면 어떻게 해야 하나요?

메시지 입력창 왼쪽의 + 아이콘을 클릭하고 ‘잘 생각하기(Thinking)’를 선택하면 됩니다. 이렇게 직접 눌러야만 GPT-5.4 mini가 사용됩니다. 기본값으로 자동 활성화되지 않습니다. (출처: OpenAI 공식 블로그, 2026.03.17)

▶ Q2. Plus 사용자는 GPT-5.4 mini를 직접 선택할 수 있나요?

직접 선택은 불가능합니다. Plus는 GPT-5.4 Thinking을 직접 쓸 수 있고, mini는 GPT-5.4 Thinking 주간 한도(3,000개)를 모두 소진했을 때 자동으로 전환됩니다. Plus 입장에서 mini는 ‘선택 모델’이 아닌 ‘한도 초과 대체 모델’입니다. (출처: OpenAI 헬프 센터)

▶ Q3. Codex에서 mini를 쓰면 할당량을 얼마나 아낄 수 있나요?

GPT-5.4 mini는 Codex에서 GPT-5.4 할당량의 30%만 소비합니다. (출처: OpenAI 공식 블로그, 2026.03.17) 같은 할당으로 약 3.3배 더 많은 작업을 처리할 수 있는 구조입니다. 서브에이전트 설정을 직접 해야 자동으로 mini가 사용됩니다.

▶ Q4. GPT-5.4 nano를 ChatGPT에서 쓸 수 없나요?

맞습니다. nano는 API 전용 모델로, ChatGPT 앱에서는 선택 자체가 불가능합니다. 분류, 데이터 추출 등 고속 배치 처리 작업에 최적화된 모델이고, 컴퓨터 사용(CUA) 작업에는 성능이 충분하지 않습니다. (출처: OpenAI 공식 블로그, 2026.03.17)

▶ Q5. 긴 문서 분석에 GPT-5.4 mini를 써도 괜찮을까요?

짧은 컨텍스트(64K 이하)라면 충분히 쓸 수 있습니다. 그러나 64K~256K 구간에서 성능이 급격히 낮아집니다. OpenAI MRCR v2 벤치마크 기준으로 128K~256K 구간에서 mini는 33.6%로, GPT-5.4 본 모델(79.3%)의 42% 수준입니다. (출처: OpenAI 공식 발표, 2026.03.17) 긴 맥락이 핵심인 작업에는 본 모델을 사용하는 것이 적합합니다.

▲ 목차로 돌아가기

마치며 — 총평

그런데 “무료도 된다”는 문구 뒤에 따라오는 조건들을 모르고 쓰면 원하는 모델을 쓰고 있지 않을 수 있습니다. Free는 직접 눌러야 하고, Plus는 한도 초과 후 자동 강등으로만 만납니다. Codex에서 할당을 아끼려면 서브에이전트 설정을 따로 해야 합니다.

롱컨텍스트 성능 급락 구간은 솔직히 아쉬운 부분입니다. 128K를 넘어가는 작업에서는 mini가 본 모델의 절반도 안 되는 성능을 냅니다. 이 부분이 다음 버전에서 개선될지가 mini의 실용성을 판가름하는 핵심이 될 것 같습니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. ① OpenAI 공식 발표 — Introducing GPT-5.4 mini and nano (openai.com/index/introducing-gpt-5-4-mini-and-nano/)
  2. ② OpenAI 헬프 센터 — GPT-5.3 and GPT-5.4 in ChatGPT (help.openai.com/ko-kr/articles/11909943)
  3. ③ OpenAI Codex 서브에이전트 공식 문서 (developers.openai.com/codex/subagents/)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 본 포스팅은 2026년 3월 21일 기준으로 작성되었으며, 모든 수치는 OpenAI 공식 발표 자료를 기준으로 합니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기