GPT-5.4 mini, 3배 비싼 이유 숫자로 확인했습니다

Published on

in

GPT-5.4 mini, 3배 비싼 이유 숫자로 확인했습니다

2026.03.18 출시 기준 / GPT-5.4 mini (gpt-5.4-mini)

“소형 모델은 싸다”는 상식이 GPT-5.4 mini·nano에서 그대로 적용되지 않습니다.
공식 벤치마크와 API 가격표를 나란히 놓고, 숫자로 직접 따져봤습니다.

SWE-Bench Pro: mini 54.4% (full 57.7%)
API 입력가: $0.75/1M — GPT-5 mini 대비 3배↑
Codex 쿼터: GPT-5.4의 30%만 소모

2026년 3월 18일 오전 3시(KST), OpenAI가 GPT-5.4 miniGPT-5.4 nano를 동시에 공개했습니다. 출시 발표문에서 OpenAI는 “가장 좋은 모델이 항상 가장 큰 모델은 아니다”라고 못 박으면서, 두 경량 모델을 빠른 응답성과 안정적인 도구 사용 능력 중심으로 설계했다고 설명했습니다. (출처: OpenAI 공식 출시 발표, 2026.03.17)

GPT-5.4 mini는 API·Codex·ChatGPT에서 모두 쓸 수 있고, GPT-5.4 nano는 현재 API 전용입니다. 컨텍스트 윈도우는 두 모델 모두 400,000 토큰으로, GPT-5.4 본 모델(1,050,000 토큰)보다 제한적입니다. (출처: 나무위키 GPT-5 문서, 2026.03.28 기준) 이 차이가 나중에 설명할 nano의 함정과 직접 연결됩니다.

모델 ID는 gpt-5.4-minigpt-5.4-nano입니다. Codex 환경에서는 GPT-5.4가 계획·판단을 맡고, mini가 세부 병렬 작업을 처리하는 서브에이전트 역할을 수행합니다.

▲ 목차로 돌아가기

“저렴한 소형 모델”인데 가격이 3배 오른 이유

💡 공식 가격표와 이전 세대 수치를 함께 놓고 보니, “경량 모델 = 저렴”이라는 공식이 GPT-5.4 세대부터 달라진 게 보였습니다.

그런데 이전 세대와 비교하면 이야기가 달라집니다. GPT-5 mini는 입력 $0.25/1M, 출력 $2.00/1M이었습니다. GPT-5.4 mini는 입력이 3배, 출력이 2.25배 올랐습니다. (출처: 나무위키 GPT-5 문서, 2026.03.28) 경량 모델을 쓴다고 해서 비용이 자동으로 내려간다고 보기 어렵습니다.

모델 입력 (1M 토큰) 출력 (1M 토큰) 이전 대비
GPT-5 mini (전 세대) $0.25 $2.00 기준
GPT-5.4 mini (신규) $0.75 (+3배) $4.50 (+2.25배) 입력 3배↑
GPT-5 nano (전 세대) $0.05 $0.40 기준
GPT-5.4 nano (신규) $0.20 (+4배) $1.25 (+3.125배) 입력 4배↑

※ 전 세대 GPT-5 nano 수치: 나무위키 GPT-5 문서 (2026.03.28) / GPT-5.4 mini·nano 수치: OpenAI 공식 API 가격 페이지 (2026.03.31)

OpenAI는 가격 인상 이유를 별도로 발표하지 않았습니다. 다만 성능이 대폭 오른 만큼 단순 “경량” 모델이라는 포지셔닝보다 “고효율 서브에이전트용” 모델로 보는 게 더 정확합니다.

▲ 목차로 돌아가기

공식 벤치마크 수치, 직접 계산해 봤습니다

OpenAI 공식 출시 문서에는 GPT-5.4 제품군 전체 벤치마크가 한 표에 담겨 있습니다. (출처: OpenAI introducing-gpt-5-4-mini-and-nano, 2026.03.17) 숫자를 직접 뽑아보면 mini와 full 사이 간격이 생각보다 좁습니다.

벤치마크 GPT-5.4 GPT-5.4 mini GPT-5.4 nano GPT-5 mini
SWE-Bench Pro (코딩) 57.7% 54.4% 52.4% 45.7%
OSWorld-Verified (컴퓨터 사용) 75.0% 72.1% 39.0% 42.0%
GPQA Diamond (지식) 93.0% 88.0% 82.8% 81.6%
Terminal-Bench 2.0 75.1% 60.0% 46.3% 38.2%
MRCR v2 128K–256K (롱컨텍스트) 79.3% 33.6% 33.1% 19.4%

※ 출처: OpenAI 공식 GPT-5.4 mini·nano 출시 발표 (2026.03.17) / reasoning_effort 기준: xhigh (GPT-5 mini는 high)

코딩(SWE-Bench Pro)에서 mini는 full과 3.3%p 차이에 불과합니다. 가격 차이(30% 수준)를 감안하면 코딩 서브에이전트로 mini를 쓰는 게 압도적으로 유리합니다. 한 가지만 건집니다 — OSWorld 기준 nano는 39.0%로 GPT-5 mini(42.0%)보다 오히려 낮습니다. 컴퓨터 사용 작업엔 nano가 역효과입니다.

▲ 목차로 돌아가기

Codex 서브에이전트에서 mini가 유리한 진짜 이유

💡 OpenAI 공식 서브에이전트 문서와 API 가격표를 동시에 보니, Codex 환경에서 mini의 “쿼터 30% 구조”가 단순 비용 절감 이상의 의미를 갖는다는 게 보였습니다.

Codex 공식 서브에이전트 문서에 따르면, GPT-5.4가 오케스트레이터(계획·판단)를 맡고 mini가 병렬 하위 작업을 처리하는 구조가 기본입니다. (출처: OpenAI Codex Subagents 공식 문서, 2026.03) mini는 Codex에서 GPT-5.4 쿼터의 30%만 소비합니다. (출처: OpenAI introducing-gpt-5-4-mini-and-nano, 2026.03.17)

이게 실제로 어떤 의미인지 계산해 봤습니다. Codex Plus($20/월)에서 동일한 쿼터 예산으로 GPT-5.4를 단독으로 쓸 때와 mini를 서브에이전트로 쓸 때를 비교하면, mini 서브에이전트를 쓰면 같은 예산에서 약 3배 더 많은 작업 스텝을 돌릴 수 있습니다. 쿼터를 시간 단위로 재분배할 수 있기 때문에 대형 PR 리뷰 같은 병렬 작업에서 체감 차이가 큽니다.

공식 문서 예시에서는 보안 점검·코드 품질·버그·레이스 컨디션·테스트 안정성·유지보수성 6가지를 각각 별도 서브에이전트에게 맡기는 패턴을 권장합니다. (출처: OpenAI Codex Subagents 공식 문서) 이 때 실무용 reviewer 에이전트는 GPT-5.4, 코드베이스 탐색용 explorer와 문서 조회용 docs_researcher에는 mini를 배치하는 구성이 제안됩니다.

서브에이전트 기본 설정값 — 모르면 비용 폭발합니다

Codex의 서브에이전트 기본값은 max_threads: 6, max_depth: 1입니다. 특히 max_depth를 2 이상으로 올리면 에이전트가 에이전트를 재귀적으로 호출하면서 토큰 사용량이 기하급수적으로 늘어납니다. OpenAI 공식 문서는 명시적으로 “특별히 재귀 위임이 필요한 경우가 아니면 기본값 유지”를 권고합니다. (출처: OpenAI Codex Subagents 공식 문서) 이 설정을 건드리지 않으면 mini를 써도 비용 통제가 안 됩니다.

▲ 목차로 돌아가기

nano를 고르면 오히려 손해인 조건이 있습니다

첫 번째는 컴퓨터 사용(Computer Use)입니다. OSWorld-Verified 벤치마크에서 nano는 39.0%인데, GPT-5 mini(전 세대)가 42.0%입니다. nano가 오히려 구세대보다 낮습니다. (출처: OpenAI 공식 GPT-5.4 mini·nano 출시 문서, 2026.03.17) 브라우저 자동화나 화면 해석이 포함된 작업에 nano를 쓰면 실패율이 높아집니다.

두 번째는 128K~256K 구간의 롱 컨텍스트입니다. MRCR v2 8-needle 128K–256K 벤치마크에서 GPT-5.4는 79.3%인데 nano는 33.1%로 46.2%p 급락합니다. (출처: 동일) 대형 코드베이스 전체를 한 번에 입력하거나 긴 문서를 컨텍스트로 넣을 때 nano는 절반도 못 따라갑니다. 저렴하다고 선택했다가 답변 품질로 손해를 보는 구간입니다.

요약하면 nano는 “짧고 단순한 대량 처리” 전용입니다. 그 외 용도에는 mini가 낫습니다.

▲ 목차로 돌아가기

ChatGPT에서 mini 쓰는 법 — 무료 사용자도 됩니다

이 부분이 의외로 알려지지 않았습니다. ChatGPT에서 GPT-5.4 mini는 Free·Go 요금제 사용자에게 ‘+’ 메뉴의 ‘잘 생각하기’ 버튼으로 제공됩니다. (출처: OpenAI 공식 GPT-5.4 mini 출시 문서, 2026.03.17) 무료로 GPT-5.4 세대의 추론 모델을 쓸 수 있다는 뜻입니다.

반면 Plus 이상 요금제에서는 mini가 폴백(fallback) 모델입니다. GPT-5.4 Thinking 한도를 다 소진하면 자동으로 mini로 전환됩니다. 즉, 플러스 사용자는 고를 수 없고 한도 소진 후 자동으로 붙는 모델입니다. 무료 사용자가 오히려 더 의식적으로 mini를 선택할 수 있는 구조입니다.

기존 GPT-5 Thinking mini는 2026년 4월 18일(KST)에 지원이 종료됩니다. (출처: 나무위키 GPT-5 문서, 2026.03.28) 4월 중순 이후에는 GPT-5.4 mini가 유일한 “소형 추론 모델” 선택지가 됩니다.

▲ 목차로 돌아가기

Q&A

GPT-5.4 mini와 nano 중 코딩에 더 적합한 모델은?

SWE-Bench Pro에서 mini는 54.4%, nano는 52.4%로 mini가 앞섭니다. 단일 파일 단위 빠른 코딩에는 nano도 쓸 만하지만, 대형 코드베이스 탐색(롱 컨텍스트)이 필요한 작업에는 nano가 급격히 성능이 떨어집니다. Codex 서브에이전트 구조에서 코딩 역할에는 mini를 권장합니다.

GPT-5.4 nano는 ChatGPT에서 쓸 수 있나요?

아직 API 전용입니다. ChatGPT 앱이나 Codex에서는 제공되지 않습니다. 분류·데이터 추출처럼 단순하고 반복적인 대량 처리에만 API를 통해 활용하는 게 현재 의도된 사용 방식입니다.

지역별 처리(데이터 레지던시) 요금이 따로 붙나요?

네. OpenAI 공식 API 가격 페이지 기준으로 지역별 처리 엔드포인트를 쓰면 10% 추가 요금이 붙습니다. mini 기준으로 입력이 $0.75가 아닌 $0.825/1M이 됩니다. (출처: OpenAI API 가격 페이지, 2026.03.31) 한국 규정 준수가 필요한 경우 이 점을 사전에 고려해야 합니다.

Codex 서브에이전트의 max_depth를 올리면 어떻게 되나요?

에이전트가 에이전트를 재귀 호출하는 깊이가 늘어납니다. OpenAI 공식 문서는 기본값 1(직접 자식 에이전트까지만 허용)을 유지하도록 권고합니다. max_depth를 2 이상으로 올리면 광범위한 위임 지시가 반복 팬아웃으로 변해 토큰 사용량, 지연 시간, 로컬 리소스 소비가 동시에 폭발할 수 있다고 경고합니다.

GPT-5 Thinking mini는 언제 종료되나요?

2026년 4월 18일(KST)에 지원이 종료됩니다. (출처: 나무위키 GPT-5 문서, 2026.03.28) 이후에는 GPT-5.4 mini가 ChatGPT 내 유일한 소형 추론 모델로 남습니다. 현재 GPT-5 Thinking mini 기반 자동화 파이프라인이 있다면 4월 중순 전에 전환해야 합니다.

▲ 목차로 돌아가기

마치며

nano는 분류·추출·랭킹처럼 정말 단순한 대량 반복 작업에 한정해서 쓸 때 효과적입니다. 컴퓨터 사용이나 128K 이상의 롱 컨텍스트가 들어가는 순간 nano보다 mini가 훨씬 낫고, 심지어 컴퓨터 사용에서는 이전 세대 GPT-5 mini보다 성능이 낮습니다. 비용만 보고 nano를 골랐다가 실패율로 손해 보는 케이스가 생길 수 있습니다.

한 가지 더 챙겨야 할 건 4월 18일 GPT-5 Thinking mini 종료입니다. 이미 GPT-5 mini 기반으로 자동화 파이프라인을 짜놓은 경우라면 전환 작업이 필요합니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. OpenAI — GPT-5.4 mini·nano 공식 출시 문서 (2026.03.17) openai.com/ko-KR/index/introducing-gpt-5-4-mini-and-nano/
  2. OpenAI — API 공식 가격 페이지 (2026.03.31 기준) openai.com/ko-KR/api/pricing/
  3. OpenAI — Codex 서브에이전트 공식 문서 developers.openai.com/codex/subagents/

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. OpenAI API 가격 및 모델 스펙은 공식 페이지(openai.com/ko-KR/api/pricing/)에서 최신 정보를 확인하세요.

댓글 남기기


최신 글

  • 안심상속 원스톱 서비스 2026, 재산조회 신청 순서
    안심상속 원스톱 서비스 2026 기준으로 신청 가능 가족, 금융·토지·차량, 상속포기 기한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 전입세대확인서 열람 2026, 계약 전 주소 확인
    전입세대확인서 열람 2026 기준으로 주소와 동·호수, 기존 전입 여부, 등기부·확정일자 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 휴대폰 명의도용 신고 2026, 개통 내역 확인
    휴대폰 명의도용 신고 2026 기준으로 모르는 회선, 최근 인증·개통 문자, 통신사와 번호 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 카드 분실신고 재발급 2026, 자동이체 누락 체크
    카드 분실신고 재발급 2026 기준으로 카드 정지, 분실 전후 사용처, 새 카드 수령 전 결제 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 휴면보험금 조회 청구 2026, 내보험찾아줌 전 확인
    휴면보험금 조회 청구 2026 기준으로 보험금 종류, 계약자와 피보험자, 현재 담당 보험사 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 자동차 압류조회 해제 2026, 이전등록 전 체크
    자동차 압류조회 해제 2026 기준으로 압류·저당 표시, 기관과 금액, 반영 시점 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 자동차 의무보험 미가입 과태료 2026, 조회 전 확인
    자동차 의무보험 미가입 과태료 2026 기준으로 공백 발생일, 명의 이전일과 보험 시작일, 과태료 금액과 납부 기한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 육아휴직 급여 신청 2026, 회사 확인서 전 체크
    육아휴직 급여 신청 2026 기준으로 시작일과 대상 자녀, 회사 제출 상태, 고용보험 가입 기간 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • ChatGPT Plus 해지 환불 2026, 다음 결제 전 확인
    ChatGPT Plus 해지 환불 2026 기준으로 OpenAI 계정 구독 상태, 앱스토어 구독 목록, 자동 갱신 상태 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 배달앱 주문취소 환불 2026, 조리 시작 전 기준
    배달앱 주문취소 환불 2026 기준으로 가게 접수 전후, 가게 처리 상태, 사진과 주문 내역 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기