2026.03.18 출시 기준
GPT-5.4 mini · nano
IT/AI

GPT-5.4 mini, 더 싸다고요?
이 수치 먼저 보세요

2026년 3월 18일, OpenAI가 소형 모델 두 개를 동시 출시했습니다. GPT-5.4 mini는 속도가 2배 빠르고, GPT-5.4 nano는 역대 가장 저렴한 GPT-5.4 계열 모델이라고 합니다. 그런데 “저렴하다”는 말을 그대로 믿으면 기존 워크플로우에서 비용이 3~4배 뛸 수 있습니다. 공식 수치를 직접 따져봤습니다.

3×

mini 입력 토큰 인상폭
(GPT-5 mini 대비)

4×

nano 입력 토큰 인상폭
(GPT-5 nano 대비)

54.4%

mini SWE-Bench Pro
(GPT-5 mini 45.7%)

🚀 출시 배경 — 왜 지금 mini·nano인가

GPT-5.4가 2026년 3월 5일(KST) 출시된 지 13일 만에 mini와 nano가 바로 뒤를 따랐습니다. OpenAI는 공식 발표문에서 이 두 모델이 “고용량 워크로드, 코딩 어시스턴트, 서브에이전트, 멀티모달 작업”을 위한 빠르고 효율적인 선택지라고 설명합니다. (출처: OpenAI 공식 블로그 Introducing GPT-5.4 mini and nano, 2026.03.17)

핵심 맥락은 에이전트 구조입니다. 큰 모델(GPT-5.4)이 계획·판단을 맡고, 병렬로 작동하는 서브에이전트들이 mini나 nano를 써서 빠르게 보조 작업을 처리하는 방식입니다. 속도와 비용을 동시에 잡으려는 설계입니다. 이 흐름은 기업 개발자들이 AI 에이전트 파이프라인을 구축할 때 실질적인 부담을 낮춰줍니다.

다만 “서브에이전트용이니까 무조건 저렴할 것”이라는 기대는 다음 섹션에서 완전히 뒤집힙니다.

▲ 목차로 돌아가기

💸 API 가격 전격 비교 — “소형 모델 = 저렴”이 틀린 이유

솔직히 말하면, 처음 가격표를 보고 깜짝 놀랐습니다. OpenAI 커뮤니티 포럼에서 실제 사용자가 직접 계산한 세대 간 인상폭은 아래와 같습니다.

모델	입력 (1M 토큰)	출력 (1M 토큰)	캐시 입력
GPT-5.4 mini 신규	$0.75	$4.50	$0.075
GPT-5 mini 구형	$0.25	$2.00	$0.025
인상폭 (mini)	+200% (3배)	+125% (2.25배)	+200%
GPT-5.4 nano 신규	$0.20	$1.25	$0.02
GPT-5 nano 구형	$0.05	$0.40	$0.005
인상폭 (nano)	+300% (4배)	+213% (3.125배)	+300%

출처: OpenAI API Pricing 공식 페이지 (openai.com/api/pricing/) + OpenAI 커뮤니티 포럼 검증 (2026.03.18)

💡 공식 발표문과 실제 가격표를 같이 놓고 보면 이런 차이가 보입니다. OpenAI는 신규 모델을 “더 비용 효율적”이라고 표현했는데, 이건 이전 세대 구형 nano보다 싼 것이 아니라 같은 세대 GPT-5.4 플래그십 대비 싸다는 의미입니다. 기존 GPT-5 nano로 대규모 API 호출을 하던 개발자라면 그대로 버전만 올렸다가는 비용이 4배 뛰는 구조입니다.

Reddit에서도 같은 반응이 나왔습니다. 사용자 Balance-는 “입력 가격이 $0.25에서 $0.75로 3배가 됐다. 드롭인 교체로 쓰기 매우 어렵다”고 직접 지적했습니다. (출처: r/OpenAI, 2026.03.17)

▲ 목차로 돌아가기

📊 핵심 벤치마크 7종 직접 정리

아래 수치는 OpenAI 공식 발표문에 수록된 벤치마크입니다. (출처: Introducing GPT-5.4 mini and nano, OpenAI, 2026.03.17) 추론 노력 수준은 모두 xhigh 기준이며, GPT-5 mini는 최대 high까지만 지원합니다.

벤치마크	GPT-5.4	5.4 mini	5.4 nano	GPT-5 mini
SWE-Bench Pro (코딩)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0 (터미널)	75.1%	60.0%	46.3%	38.2%
GPQA Diamond (과학추론)	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified (컴퓨터 사용)	75.0%	72.1%	39.0%	42.0%
Toolathlon (도구 호출)	54.6%	42.9%	35.5%	26.9%
τ2-bench (통신 도구)	98.9%	93.4%	92.5%	74.1%
MRCR v2 8-needle 128K~256K (장문)	79.3%	33.6%	33.1%	19.4%

출처: OpenAI 공식 블로그 Introducing GPT-5.4 mini and nano (2026.03.17) / 추론 노력: xhigh (GPT-5 mini는 high 최대)

수치를 보면서 가장 눈에 걸린 부분은 두 가지입니다. 첫째, mini는 코딩·과학추론에서 플래그십에 거의 근접하는데, 장문 컨텍스트에서 갑자기 79.3%에서 33.6%로 추락합니다. 이 격차가 실제로 어떤 의미인지는 섹션 6에서 자세히 다룹니다. 둘째, nano는 OSWorld-Verified에서 구세대 GPT-5 mini(42.0%)보다도 낮은 39.0%를 기록했습니다. 컴퓨터 사용 에이전트에 nano를 붙이면 오히려 후퇴하는 셈입니다.

▲ 목차로 돌아가기

📱 어디서 쓸 수 있나 — ChatGPT vs API vs Codex

접근 방식이 모델마다, 플랫폼마다 다릅니다. 공식 발표문 기준(2026.03.17)으로 직접 정리했습니다.

GPT-5.4 mini

API: 텍스트·이미지·도구·웹검색·컴퓨터 사용 지원, 400K 컨텍스트
Codex: GPT-5.4 쿼터의 30%만 소모
ChatGPT 무료·Go: ‘+’ 메뉴 → ‘잘 생각하기’로 접근
ChatGPT Plus 이상: GPT-5.4 Thinking 한도 소진 시 자동 전환

GPT-5.4 nano

API 전용 (ChatGPT UI 미지원)
이미지 입력·도구 호출·함수 콜링·구조화 출력 지원
400K 컨텍스트
컴퓨터 사용(CUA) 공식 비권장

💡 Plus 이상 구독자에게 mini는 사실상 “한도 초과 보험”입니다. 직접 선택해서 쓰는 모델이 아니라, GPT-5.4 Thinking을 다 쓴 뒤 자동으로 붙는 구조입니다. 공식 문서에 이 부분이 작게 적혀 있어서 놓치기 쉽습니다. (출처: OpenAI 공식 블로그, 2026.03.17)

개인 사용자 입장에서 nano는 ChatGPT를 아무리 써도 직접 접근이 안 됩니다. 개발자 API 키가 없으면 nano의 혜택을 전혀 누리지 못하는 구조입니다. 이 부분이 좀 아쉬웠습니다.

▲ 목차로 돌아가기

⚔️ Gemini 3 Flash·Claude Haiku 4.5와 비교하면

경쟁 모델과 나란히 놓고 보면 GPT-5.4 mini·nano의 포지션이 더 선명하게 보입니다. Reddit 사용자 bortlip이 직접 공식 벤치마크를 엮어 작성한 비교에 DataCamp 분석을 더했습니다.

모델	입력 ($/ 1M)	Terminal-Bench 2.0	GPQA Diamond
GPT-5.4 mini	$0.75	60.0%	88.0%
GPT-5.4 nano	$0.20	46.3%	82.8%
Gemini 3 Flash	$0.50	47.6%	— (미공개)
Gemini 3.1 Flash Lite	$0.25	51.7%	— (미공개)
Claude Haiku 4.5	$1.00	— (미공개)	— (미공개)

출처: OpenAI 공식 블로그 (2026.03.17), Reddit r/OpenAI (2026.03.17), DataCamp 분석 (2026.03.17) / Gemini 3 Flash는 preview 상태

GPT-5.4 nano($0.20)와 Gemini 3 Flash($0.50)를 Terminal-Bench 2.0으로만 비교하면 nano가 46.3%로 살짝 낮은 대신 가격이 절반도 안 됩니다. 코딩 성능이 조금 낮아도 괜찮은 대량 분류·추출 작업이라면 nano가 비용 면에서 우위입니다.

반면 Claude Haiku 4.5는 입력 $1.00으로 GPT-5.4 mini($0.75)보다 비싼데, DataCamp 분석 기준 GPQA Diamond나 τ2-bench에서 nano보다도 낮은 수치가 확인됩니다. GPT-5.4 nano가 Haiku 4.5를 가격과 범용 추론 두 영역에서 동시에 앞서는 상황입니다. (출처: DataCamp, GPT-5.4 mini and nano: Benchmarks, Access, and Reactions, 2026.03.17)

▲ 목차로 돌아가기

⚠️ 장문 컨텍스트 함정 — nano가 생각보다 불리한 상황

GPT-5.4 mini와 nano 모두 400K 토큰 컨텍스트 윈도우를 지원합니다. 숫자만 보면 플래그십과 같습니다. 그런데 OpenAI MRCR v2 장문 테스트를 보면 이야기가 달라집니다.

실측 수치 (MRCR v2 8-needle, 128K~256K 구간)

GPT-5.4: 79.3%
GPT-5.4 mini: 33.6% (플래그십 대비 -45.7%p)
GPT-5.4 nano: 33.1%
GPT-5 mini: 19.4%

출처: OpenAI 공식 블로그 Introducing GPT-5.4 mini and nano (2026.03.17)

코딩(SWE-Bench)에서 mini가 플래그십과 3.3%p밖에 차이 안 났는데, 장문 컨텍스트에서는 45.7%p가 벌어집니다. 400K 창을 지원한다는 것과 400K 분량의 문서에서 정확히 찾아낸다는 것은 완전히 다른 이야기입니다.

💡 기존에 알려진 “컨텍스트 창 크기 = 장문 처리 능력”이라는 공식이, 실제 수치와 나란히 놓이면 전혀 다르게 보입니다. 레거시 코드베이스 전체를 집어넣고 분석하는 용도로 mini를 쓰려던 계획이라면, 이 수치를 먼저 확인하는 게 맞습니다.

결론부터 말하면, mini와 nano는 “짧고 빠른 작업”에 최적화됐습니다. 긴 문서 요약, 대규모 코드베이스 분석, 복잡한 멀티턴 대화 유지에는 플래그십 GPT-5.4를 써야 하는 상황이 여전히 많습니다. 비용 절감 목적으로 무조건 소형 모델로 교체하려다가 정확도가 뚝 떨어지는 상황이 생길 수 있습니다.

▲ 목차로 돌아가기

❓ Q&A 5선

Q1. GPT-5.4 mini와 GPT-5 mini, 그냥 교체해도 될까요?

API 비용부터 확인하세요. 입력 토큰 기준으로 mini가 $0.25에서 $0.75로 3배 올랐습니다. 코드베이스를 수정 없이 모델명만 바꾸면 비용 청구서가 3배 가까이 늘어납니다. 성능은 올랐지만, 가격도 같이 올랐습니다.

Q2. ChatGPT Plus 구독자도 GPT-5.4 mini를 선택해서 쓸 수 있나요?

직접 선택은 안 됩니다. GPT-5.4 Thinking 한도를 다 소진했을 때 자동으로 mini로 전환되는 구조입니다. 무료·Go 플랜은 ‘+’ 메뉴의 ‘잘 생각하기’에서 접근 가능합니다. (출처: OpenAI 공식 블로그, 2026.03.17)

Q3. GPT-5.4 nano로 컴퓨터 사용 에이전트를 만들 수 있나요?

공식 비권장입니다. OSWorld-Verified에서 39.0%로 구세대 GPT-5 mini(42.0%)보다 낮게 나왔습니다. 스크린샷 기반 인터페이스 조작이 필요한 작업이라면 mini 또는 플래그십이 적합합니다.

Q4. Codex에서 GPT-5.4 mini는 어떻게 작동하나요?

Codex에서 mini는 GPT-5.4 쿼터의 30%만 소모합니다. 더 간단한 서브에이전트 작업을 mini에 위임하면 플래그십 모델의 한도를 아낄 수 있습니다. 플래그십이 계획하고 mini가 실행하는 구조를 Codex가 자동으로 지원합니다.

Q5. GPT-5 mini가 아직 저렴한데 굳이 5.4 mini로 바꿔야 할까요?

사실 당장 바꿀 필요는 없습니다. 다만 OpenAI는 GPT-5 mini의 지원 종료를 공식 고지하지 않은 상태입니다. 비용이 중요하다면 당분간 기존 모델을 유지하되, 이미 GPT-5.4 mini가 더 빠르고 코딩·추론 성능이 뚜렷하게 높으므로 새 프로젝트는 5.4 mini로 시작하는 것이 현실적입니다.

▲ 목차로 돌아가기

✍️ 마치며

GPT-5.4 mini·nano는 분명 성능이 좋아졌습니다. 코딩 벤치마크에서 플래그십에 근접하고, 도구 호출 정확도도 전 세대 대비 눈에 띄게 올랐습니다. 다만 “소형 모델 = 저렴”이라는 등식은 이번에도 성립하지 않았습니다. 전 세대보다 3~4배 비싼 채로 나왔고, 장문 컨텍스트에서의 성능 격차는 컨텍스트 창 크기에서 읽히지 않습니다.

개인적으로 GPT-5.4 mini는 빠른 코딩 서브에이전트 용도로 인상적이었습니다. 반면 nano는 분류·데이터 추출처럼 정말 단순하고 대량인 작업 외에는 굳이 선택할 이유가 쉽게 보이지 않습니다. 경쟁사 모델과의 비용-성능 비교를 꼼꼼히 한 번 더 해볼 필요가 있습니다.

DataCamp가 지적한 것처럼, 지금 시대에 단일 모델 최적화보다는 모델을 쉽게 교체할 수 있는 아키텍처를 짜는 것이 더 오래가는 선택입니다. 오늘의 미니가 내일의 기본값이 되고, 오늘의 플래그십이 내년의 무료 티어가 되는 속도로 시장이 움직이고 있습니다.

▲ 목차로 돌아가기

📎 본 포스팅 참고 자료

※ 본 포스팅은 2026년 3월 27일 기준으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 모든 API 요금과 벤치마크 수치는 공식 출처 기반이나, OpenAI의 업데이트로 달라질 수 있으므로 이용 전 공식 페이지에서 직접 확인하시기 바랍니다.

GPT-5.4 mini, 더 싸다고요?
이 수치 먼저 보세요

🚀 출시 배경 — 왜 지금 mini·nano인가

💸 API 가격 전격 비교 — “소형 모델 = 저렴”이 틀린 이유

📊 핵심 벤치마크 7종 직접 정리

📱 어디서 쓸 수 있나 — ChatGPT vs API vs Codex

⚔️ Gemini 3 Flash·Claude Haiku 4.5와 비교하면

⚠️ 장문 컨텍스트 함정 — nano가 생각보다 불리한 상황

❓ Q&A 5선

✍️ 마치며

📎 본 포스팅 참고 자료

댓글 남기기응답 취소

최신 글

카테고리

Tags

GPT-5.4 mini, 더 싸다고요? 이 수치 먼저 보세요

🚀 출시 배경 — 왜 지금 mini·nano인가

💸 API 가격 전격 비교 — “소형 모델 = 저렴”이 틀린 이유

📊 핵심 벤치마크 7종 직접 정리

📱 어디서 쓸 수 있나 — ChatGPT vs API vs Codex

⚔️ Gemini 3 Flash·Claude Haiku 4.5와 비교하면

⚠️ 장문 컨텍스트 함정 — nano가 생각보다 불리한 상황

❓ Q&A 5선

✍️ 마치며

📎 본 포스팅 참고 자료

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기