ChatGPT o3 API, 싸졌다고요? 이 조건 보세요

Published on

in

ChatGPT o3 API, 싸졌다고요? 이 조건 보세요

2026.03.19 기준
o3 모델 기준
OpenAI 공식 가격 기준

ChatGPT o3 API, 싸졌다고요? 이 조건 보세요

지난해 6월, OpenAI는 o3 API 가격을 80% 인하했습니다. 입력 토큰 기준 $10에서 $2로, 출력 토큰은 $40에서 $8로 떨어졌죠. 그런데 막상 청구서를 받고 나면 “이게 진짜 저 가격 맞나?”라는 생각이 드는 경우가 생깁니다. 추론 모델에는 보이지 않는 토큰이 더 있습니다.

$2.00
o3 입력 / 1M 토큰
$8.00
o3 출력 / 1M 토큰
80%↓
2025년 6월 인하폭
$1.00/M
Batch API 적용 시

o3 API 가격, 실제로 어떻게 바뀌었나

ChatGPT o3 API 가격은 2025년 6월 10일, Sam Altman의 공개 발표와 함께 전격 인하됐습니다. 당시 인하 전 가격은 입력 1M 토큰당 $10, 출력 1M 토큰당 $40이었는데, 인하 후에는 각각 $2와 $8로 떨어졌습니다. 퍼센트로 따지면 정확히 80% 인하입니다. (출처: OpenAI 공식 가격 페이지, openai.com/api/pricing/)

구분 인하 전 인하 후 (현재) 인하율
o3 입력 토큰 (1M) $10.00 $2.00 80%↓
o3 출력 토큰 (1M) $40.00 $8.00 80%↓
o3 Batch API 입력 (1M) $1.00 추가 50%↓
o3 Batch API 출력 (1M) $4.00 추가 50%↓

(출처: OpenAI 공식 가격 페이지, 2026.03 기준 / devtk.ai OpenAI Pricing Guide 2026.02)

이 가격은 o3가 처음 등장했을 때 개발자들이 “너무 비싸서 실서비스에 못 쓴다”고 입을 모았던 시절과 비교하면 완전히 다른 모델처럼 느껴집니다. 그런데 여기서 끝이 아닙니다. 표시 가격은 어디까지나 기본 입출력 토큰 기준이고, 추론 모델에는 그 안에 더 중요한 변수가 하나 숨어 있습니다.

▲ 목차로 돌아가기

추론 토큰, 눈에 안 보이지만 돈은 나갑니다

o3는 추론 모델입니다. 답을 내기 전에 내부적으로 “생각하는 과정”을 거칩니다. 이 과정에서 생성되는 토큰이 바로 추론 토큰(reasoning tokens)인데, 이 토큰들은 사용자에게 보이지 않지만 출력 토큰으로 과금됩니다. OpenAI 공식 가격 페이지에는 이 점이 명시돼 있습니다: “text output tokens include model reasoning tokens”라는 문구가 이미지 생성 API 설명에 적혀 있고, 추론 모델 전반의 구조가 같습니다. (출처: openai.com/api/pricing/)

💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다

OpenAI는 o1 출시 당시부터 “추론 토큰은 실제 사고 과정 원문이 아닌 요약본”이라고 공식 발표했습니다 (출처: openai.com/index/learning-to-reason-with-llms). 즉, 청구는 되지만 내용은 요약된 형태로 노출됩니다. 복잡한 수학 문제 하나를 o3에게 보내면, 사용자가 받은 답변 토큰 외에도 내부 추론 과정에서 수백~수천 토큰이 추가로 소비됩니다. 실제로 초기 o3 버전에서는 복잡한 쿼리 하나에 GPT-4o 대비 최대 50배 토큰이 사용됐다는 사례가 LinkedIn 게시글(2026.03.05)로 보고됐습니다.

이게 실생활에서 무슨 의미냐면, 표시 가격인 $8/M 출력 토큰에 추론 토큰까지 더해지면 실제 과금 토큰 수는 체감상 훨씬 많아진다는 겁니다. 물론 OpenAI가 2025년 6월 이후 효율을 크게 개선한 것은 사실이지만, 쿼리 복잡도에 따라 실제 비용 편차가 커지는 구조는 지금도 변하지 않았습니다. 간단한 요약 작업에 o3를 쓰면 이 추론 토큰이 오히려 낭비가 됩니다.

▲ 목차로 돌아가기

o3 vs o4-mini, 가격 차이는 얼마나 날까

o4-mini는 o3와 같은 200K 컨텍스트, 100K 최대 출력을 지원하면서 가격은 크게 낮습니다. 입력 $1.10/M, 출력 $4.40/M으로, o3($2.00/$8.00)와 비교하면 입력은 약 1.8배, 출력은 약 1.8배 저렴합니다. (출처: devtk.ai OpenAI API Pricing Guide, 2026.02) 이 수치 자체로는 “그냥 o4-mini 쓰면 되는 거 아냐?”라는 생각이 들 수 있습니다.

모델 입력 (1M) 출력 (1M) 컨텍스트 특화 영역
o3 $2.00 $8.00 200K 수학·논리·복잡 추론
o4-mini $1.10 $4.40 200K 코딩·중간 복잡도 추론
GPT-5 (비교) $1.25 $10.00 400K 범용·멀티모달

(출처: devtk.ai OpenAI Pricing Guide, 2026.02 기준)

막상 써보면 다릅니다. o4-mini가 코딩 버그 수정이나 중간 난이도 수학에서 o3와 비슷한 결과를 내는 경우가 많습니다. 하지만 증명 문제나 다단계 논리 분석처럼 추론 깊이가 중요한 작업에서는 o3가 확실히 앞섭니다. 따라서 무조건 싼 쪽을 고르기보다 작업 유형을 먼저 분류하는 게 훨씬 현명합니다.

▲ 목차로 돌아가기

Batch API 쓰면 GPT-4o보다 싸집니다

여기서 기대했던 것과 달랐던 부분이 있습니다. o3가 “비싼 추론 모델”이라는 인식이 여전히 강하지만, Batch API를 조합하면 구세대 GPT-4o의 표준 요금보다 오히려 저렴해집니다. 구체적으로 계산하면 이렇습니다.

💡 직접 계산 가능한 비교 수치입니다

o3 Batch API: 입력 $1.00/M + 출력 $4.00/M
GPT-4o 표준: 입력 $2.50/M + 출력 $10.00/M

입력 1M + 출력 300K 기준으로 계산하면,
▸ o3 Batch: $1.00 + (0.3 × $4.00) = $2.20
▸ GPT-4o 표준: $2.50 + (0.3 × $10.00) = $5.50
o3 Batch가 약 60% 저렴합니다. 실시간 응답이 불필요한 배치 작업에서 o3를 GPT-4o 대신 쓰는 게 비용 면에서 더 유리하다는 뜻입니다.

(출처: OpenAI 공식 가격 페이지 기반 직접 계산, 2026.03 기준)

Batch API는 24시간 이내 처리를 보장하는 비동기 방식입니다. 실시간 챗봇이 아니라 대량 문서 요약, 코드 리뷰 파이프라인, 야간 데이터 처리처럼 응답 시간에 여유가 있는 작업에서 이 조합이 빛을 발합니다. 이걸 모르고 o3 표준 API를 그대로 쓰면 불필요한 비용을 쓰게 됩니다.

▲ 목차로 돌아가기

실제 월 비용, 직접 계산해봤습니다

이게 핵심입니다. 토큰 단가만 보면 감이 안 잡히니, 실제 사용 규모별로 월 비용을 계산해봤습니다. 세 가지 시나리오로 정리했습니다. (출처: devtk.ai OpenAI API Pricing Guide 2026.02 수치 기반, 직접 계산)

🧑‍💻 개인 개발자

하루 100K 입력 + 50K 출력
(월 3M 입력 + 1.5M 출력)

o3 표준: $18.00/월

o3 Batch: $9.00/월

계산식: (3×$2)+(1.5×$8)=$18

🚀 스타트업 팀

하루 1M 입력 + 500K 출력
(월 30M 입력 + 15M 출력)

o3 표준: $180.00/월

o3 Batch: $90.00/월

계산식: (30×$2)+(15×$8)=$180

🏢 프로덕션 운영

하루 10M 입력 + 5M 출력
(월 300M 입력 + 150M 출력)

o3 표준: $1,800/월

o3 Batch: $900/월

계산식: (300×$2)+(150×$8)=$1,800

프로덕션 규모에서 Batch API를 적용하면 월 900달러가 절약됩니다. 이건 단순 절감이 아니라 동일 예산으로 두 배 규모의 추론 작업을 처리할 수 있다는 의미입니다. 물론 추론 토큰이 얼마나 발생하느냐에 따라 실제 청구액은 달라지고, 쿼리 복잡도가 올라갈수록 위 수치에서 더 올라갑니다. 이 부분은 “확인 필요” 항목으로 각자 OpenAI 대시보드에서 토큰 사용량 로그를 확인하는 게 정확합니다.

▲ 목차로 돌아가기

어떤 경우에 o3를 쓰고, 어떤 경우에 쓰지 말아야 할까

솔직히 말하면, o3가 모든 상황에서 최선은 아닙니다. 가격이 내려갔다고 해서 무조건 o3를 기본 모델로 쓰면 오히려 손해입니다. 간단한 텍스트 요약, FAQ 응답, 분류 작업에 o3를 투입하면 추론 토큰이 불필요하게 소비되면서 GPT-5 Mini($0.25/$2.00)보다 5~10배 더 나옵니다.

💡 모델별 적합 작업 — 이 차이를 먼저 정리하고 쓰는 게 낫습니다

✅ o3가 맞는 경우

  • 수학 증명, 형식 논리
  • 다단계 코드 디버깅
  • 경쟁 프로그래밍 수준 알고리즘
  • 과학적 분석 및 추론

❌ o3가 낭비인 경우

  • 단순 텍스트 요약
  • FAQ, 분류, 라우팅
  • 실시간 챗봇 (지연 문제)
  • 단순 번역 작업

💰 o4-mini가 더 나은 경우

  • 중간 난이도 코딩
  • 코드 리뷰, 설명 생성
  • 수학 과외 수준 문제
  • 비용 제약이 있는 추론

생각보다 간단합니다. 작업이 “맞고 틀림”이 명확하거나 단계가 복잡할수록 o3, 빠르고 가볍게 처리해야 한다면 o4-mini 또는 GPT-5 Mini가 훨씬 경제적입니다. 이 부분이 좀 아쉬웠습니다. 많은 기사에서 “o3가 싸졌다”에만 집중하고, 어떤 작업에 써야 그 가격이 의미가 있는지는 잘 다루지 않더라고요.

▲ 목차로 돌아가기

자주 나오는 질문 5가지

Q1. o3 API 가격이 80% 인하된 게 맞나요? 언제부터 적용됐나요?
맞습니다. 2025년 6월 10일부터 적용됐고, 입력 토큰은 $10→$2, 출력 토큰은 $40→$8로 인하됐습니다. Sam Altman이 직접 X(구 트위터)에서 공지했으며, OpenAI 공식 가격 페이지(openai.com/api/pricing)에서 현재 수치를 확인할 수 있습니다.
Q2. 추론 토큰이 별도로 과금되나요?
추론 토큰은 출력 토큰에 포함되어 과금됩니다. 사용자에게는 요약본 형태로만 보이지만 내부 추론 과정의 토큰이 출력 토큰 단가로 청구됩니다. 쿼리 복잡도가 높을수록 추론 토큰이 많이 발생해 실제 청구 금액이 표시 가격보다 높아질 수 있습니다.
Q3. Batch API를 쓰면 얼마나 절약되나요?
OpenAI Batch API는 표준 가격 대비 50% 할인이 적용됩니다. o3 기준 입력 $1.00/M, 출력 $4.00/M이 됩니다. 24시간 이내 처리를 허용하는 비실시간 작업에 적합하며, 이 경우 구세대 GPT-4o 표준 요금($2.50/$10.00)보다도 저렴합니다.
Q4. o3와 o4-mini 중 뭘 써야 하나요?
수학 증명, 형식 논리, 복잡한 다단계 추론에는 o3가 적합합니다. 코딩 지원, 중간 난이도 추론, 비용이 중요한 환경에서는 o4-mini($1.10/$4.40)가 훨씬 효율적입니다. 같은 컨텍스트 크기(200K)이면서 비용이 약 55% 저렴합니다.
Q5. API 사용 전에 최소 얼마를 충전해야 하나요?
OpenAI는 Tier 1 접근 조건으로 최소 $5 충전을 요구합니다. 이 시점부터 o3와 GPT-5 등 모든 모델에 접근이 가능합니다. Free 티어에서는 GPT-5 Mini와 GPT-4o Mini만 사용 가능하고 요청 수 제한이 매우 낮습니다. (출처: devtk.ai, 2026.02 기준 / 확인 필요: 정책 변동 가능)

▲ 목차로 돌아가기

마치며 — 총평

o3 API 가격 인하는 분명 반가운 소식입니다. 예전에는 복잡한 추론 작업에 쓰기엔 너무 비싸서 “벤치마크용 모델”처럼 취급됐는데, 이제는 실서비스에서도 선택지에 넣을 수 있게 됐습니다.

그런데 여기서 걸립니다. 표시 가격만 보고 o3를 범용 모델처럼 쓰기 시작하면 추론 토큰이 조용히 청구서를 부풀립니다. 복잡한 수학 문제 하나에서 발생하는 추론 토큰이 간단한 요약 쿼리 수십 개 분량과 맞먹는 경우도 있습니다. 이 점을 인식하고 작업 유형에 따라 모델을 분리해서 쓰는 게 핵심입니다.

결론부터 말씀드리면, o3는 “써야 할 때 쓰면 확실히 값어치를 합니다.” 추론이 필요 없는 작업은 GPT-5 Mini나 o4-mini로, 배치 처리가 가능하면 Batch API를 조합하면 됩니다. 이 두 가지만 지켜도 같은 성능을 훨씬 저렴하게 쓸 수 있습니다.

▲ 목차로 돌아가기

📎 본 포스팅 참고 자료

  1. OpenAI 공식 가격 페이지 (openai.com/api/pricing)
  2. OpenAI 공식 블로그 — Introducing o3 and o4-mini (2025.04.16)
  3. devtk.ai — OpenAI API Pricing Guide 2026 (2026.02.24)
  4. OpenAI — Learning to Reason with LLMs (추론 토큰 공식 설명)
  5. SmythOS — OpenAI o3 Price Shock (80% 인하 배경 분석)


⚠️ 본 포스팅 작성 이후 서비스 정책·UI·가격이 변경될 수 있습니다. 모든 가격 수치는 2026.03.19 기준이며, 최신 정보는 반드시 OpenAI 공식 가격 페이지에서 직접 확인하시기 바랍니다. 본 포스팅은 특정 서비스의 구매를 권유하지 않으며, 작성된 수치는 공식 자료 기반이나 실제 청구 금액은 사용 패턴에 따라 달라질 수 있습니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기