Claude API 비용, Opus 4.1이 4.6보다 3배 비싼 이유
결론부터 말씀드리면, Claude API 비용은 모델 이름의 숫자가 클수록 최신·저렴한 구조입니다. Opus 4.1은 입력 $15/MTok인데 Opus 4.6은 $5/MTok — 같은 Opus 계열인데 3배 차이가 납니다. 공식 가격 문서를 직접 펼쳐서 확인한 수치입니다.
모델별 가격표 — 직접 뽑은 숫자
Claude API 비용은 Anthropic 공식 가격 문서(docs.anthropic.com/en/docs/about-claude/pricing)에 모두 나와 있습니다. 아래 표는 2026.03.25 기준 최신 모델군 전체를 공식 수치 그대로 가져온 것입니다.
| 모델 | 입력 (/MTok) | 출력 (/MTok) | 캐시 히트 |
|---|---|---|---|
| Opus 4.6 | $5.00 | $25.00 | $0.50 |
| Opus 4.5 | $5.00 | $25.00 | $0.50 |
| Opus 4.1 | $15.00 | $75.00 | $1.50 |
| Opus 4 | $15.00 | $75.00 | $1.50 |
| Sonnet 4.6 | $3.00 | $15.00 | $0.30 |
| Sonnet 4.5 / 4 | $3.00 | $15.00 | $0.30 |
| Haiku 4.5 | $1.00 | $5.00 | $0.10 |
| Haiku 3.5 | $0.80 | $4.00 | $0.08 |
| Haiku 3 | $0.25 | $1.25 | $0.03 |
💡 공식 가격표와 모델 출시 순서를 같이 놓고 보면 이런 패턴이 보입니다 — Anthropic은 신모델을 출시하면서 구모델보다 동등하거나 더 낮은 가격에 더 높은 성능을 제공합니다. Opus 4.1은 출시 당시 최고가였지만, 이후 나온 Opus 4.6이 같은 계열에서 3분의 1 가격입니다.
(출처: Anthropic 공식 가격 문서, docs.anthropic.com/en/docs/about-claude/pricing, 2026.03.25 기준)
출력 토큰이 입력보다 5배 비싼 이유 — 이 부분이 비용 폭탄의 진짜 원인
Sonnet 4.6 기준 입력은 $3/MTok, 출력은 $15/MTok입니다. 5배 차이입니다. 공식 문서는 “출력 토큰은 모델이 각 토큰을 순차적으로 예측해야 해서 연산량이 훨씬 크다”고 설명합니다. 단순 조회가 아닌 생성이기 때문입니다.
실제 비용에서 이게 의미하는 건 하나입니다. Claude한테 길게 답변하게 시킬수록 비용이 기하급수적으로 오릅니다. 예를 들어 입력 1,000토큰, 출력 500토큰짜리 요청과 입력 1,000토큰, 출력 2,000토큰짜리 요청을 Opus 4.6으로 비교하면:
📊 출력 토큰 길이에 따른 비용 변화 (Opus 4.6 기준)
• 입력 1,000토큰 + 출력 500토큰
= (0.001 × $5) + (0.0005 × $25) = $0.0175
• 입력 1,000토큰 + 출력 2,000토큰
= (0.001 × $5) + (0.002 × $25) = $0.055
→ 출력만 4배 늘었는데 총 비용은 3.1배 증가
많은 개발자가 시스템 프롬프트를 줄이는 데 집중합니다. 막상 해보면 다릅니다 — 실제 비용 절감은 출력 토큰 통제에서 더 크게 나옵니다. max_tokens를 적절히 설정하고, 답변 형식을 간결하게 유도하는 것이 입력 줄이기보다 효과적입니다.
(출처: Anthropic 공식 가격 문서, docs.anthropic.com/en/docs/about-claude/pricing)
프롬프트 캐싱, 무조건 켜면 오히려 손해가 납니다
프롬프트 캐싱은 한 번 처리한 입력 내용을 저장해 두고, 다음 요청 때 재사용하는 기능입니다. 캐시 히트 시 Sonnet 4.6 기준 $0.30/MTok — 표준 입력($3/MTok)의 10%입니다. 여기까지는 다들 아는 내용입니다.
💡 공식 문서의 캐시 쓰기 비용과 TTL(유효 기간)을 같이 놓고 계산해 보면, 생각보다 빨리 손해 구간이 나옵니다.
5분 캐시 (캐시 쓰기 1.25x, 히트 0.1x)
• 쓰기 1회 = 1.25배 비용
• 히트 1회 = 0.1배 비용
→ 첫 번째 히트에서 바로 손익분기 돌파 (1.25 – 0.1 = 절감 시작)
1시간 캐시 (캐시 쓰기 2x, 히트 0.1x)
• 쓰기 1회 = 2배 비용
• 히트 1회 = 0.1배 비용
→ 히트가 최소 2회 이상이어야 손익분기점 도달 (2x 투자 회수 조건)
문제는 1시간 캐시 타입입니다. 쓰기 비용이 표준 입력의 2배인데, 5분 안에 같은 프롬프트로 후속 요청이 2번 이상 오지 않으면 오히려 더 비쌉니다. 단발성 요청이 많거나, 사용자가 대화를 끊고 1시간 이상 지나서 다시 접속하는 서비스라면 캐싱이 비용을 높이는 역할을 합니다.
실제로 캐싱이 효과적인 건 긴 시스템 프롬프트나 RAG 문서처럼 동일한 내용이 반복 재사용되는 맥락일 때입니다. 짧고 일회성인 대화에는 5분 캐시도 고려해서 선택해야 합니다.
배치 API 50% 할인 — 쓸 수 있는 상황과 없는 상황
배치 API는 실시간 응답이 필요 없는 요청을 묶어서 처리하는 방식입니다. 공식 문서 기준 입력·출력 모두 50% 할인이 적용됩니다. Sonnet 4.6 기준 입력 $1.50/MTok, 출력 $7.50/MTok — 일반 호출의 절반입니다.
| 모델 | 배치 입력 /MTok | 배치 출력 /MTok |
|---|---|---|
| Opus 4.6 | $2.50 | $12.50 |
| Sonnet 4.6 | $1.50 | $7.50 |
| Haiku 4.5 | $0.50 | $2.50 |
결과는 24시간 내에 반환됩니다. 데이터 분석, 대량 문서 요약, 콘텐츠 분류 같은 비실시간 파이프라인에 적합합니다. 배치 API와 프롬프트 캐싱은 동시에 사용할 수 있고, 두 할인이 곱해집니다.
단, Fast Mode는 배치 API와 함께 쓸 수 없습니다. 공식 문서에 “Fast mode is not available with the Batch API”라고 명시돼 있습니다. Fast Mode를 쓰면 출력 속도가 올라가지만 6배 요금이 붙고 배치 할인은 사라집니다 — 다음 섹션에서 따로 다룹니다.
(출처: Anthropic 공식 가격 문서, docs.anthropic.com/en/docs/about-claude/pricing#batch-processing)
실제 사용 시나리오별 월 비용 계산
추상적인 단가보다 직접 따라 해볼 수 있는 계산식이 더 유용합니다. 공식 문서에서 제공한 에이전트 예시와 실측 데이터를 기반으로 세 가지 시나리오를 정리했습니다.
시나리오 A — 고객 지원 챗봇 (Opus 4.6, 월 10,000건)
• 대화당 평균 입력 약 2,000토큰 + 출력 약 1,700토큰 = 총 3,700토큰
• 월 입력: 2,000 × 10,000 = 20M 토큰 → $5 × 20 = $100
• 월 출력: 1,700 × 10,000 = 17M 토큰 → $25 × 17 = $425
→ 월 합계 약 $525
(출처: Anthropic 에이전트 가이드, docs.anthropic.com/en/docs/about-claude/pricing#customer-support)
시나리오 B — 문서 요약 파이프라인 (Haiku 4.5, 배치 API, 월 3,000건)
• 문서당 평균 입력 7,000토큰 + 출력 500토큰
• 배치 입력: 7,000 × 3,000 = 21M 토큰 → $0.50 × 21 = $10.50
• 배치 출력: 500 × 3,000 = 1.5M 토큰 → $2.50 × 1.5 = $3.75
→ 월 합계 약 $14.25 — 같은 작업을 일반 API로 하면 약 $28.50
시나리오 C — 개인 개발자 Claude Code (API 빌링, 월 160세션)
• 세션당 평균 입력 약 70,000토큰 + 출력 약 10,000토큰 (Sonnet 4.5 기준)
• 월 입력: 70,000 × 160 = 11,200M… = 11.2B 토큰이 아니라 11,200,000 토큰 = 11.2M → $3 × 11.2 = $33.6
• 월 출력: 10,000 × 160 = 1.6M 토큰 → $15 × 1.6 = $24
→ 월 합계 약 $57.6 — Claude Pro($20) 대비 약 2.9배 비쌈
(출처: vexp.dev 실측, vexp.dev/blog/claude-code-cost-per-month)
Fast Mode 함정 — 6배 요금에 배치 API 병용 불가
Opus 4.6에만 적용되는 Fast Mode는 출력 속도를 크게 높여줍니다. 대신 비용은 표준 요금의 6배입니다. 공식 문서 기준으로 입력 $30/MTok, 출력 $150/MTok입니다. Opus 4.6 표준($5 / $25)과 비교하면 정확히 6배입니다.
⚠️ Fast Mode를 켜면 이렇게 됩니다
• 프롬프트 캐싱 할인은 적용되지만, 6배 요금에 곱해서 계산
• 데이터 레지던시(US-only, 1.1x)도 Fast Mode 위에 곱해짐
• 배치 API와 동시 사용 불가 — Fast Mode 요청은 배치 처리 대상 아님
사용자 인터랙션이 빠른 응답 속도를 요구하는 프로덕션에서는 Fast Mode가 의미 있습니다. 하지만 배치로 처리할 수 있는 비실시간 작업에 Fast Mode를 함께 켜면 배치 할인 50%를 날리고 6배 요금을 그대로 냅니다.
실사용에서 이 조합이 의외로 자주 발생합니다. 에이전트 파이프라인을 설계할 때 속도가 필요한 부분과 그렇지 않은 부분을 분리해서, Fast Mode는 실시간 구간에만 제한적으로 적용하는 구조가 비용 효율적입니다.
(출처: Anthropic Fast Mode 문서, docs.anthropic.com/en/docs/about-claude/pricing#fast-mode-pricing)
API vs Pro($20) vs Max($100), 손익분기점이 여기 있습니다
“API가 더 싸다”는 말이 항상 맞지는 않습니다. 개인 개발자가 Claude Code를 하루 5~8세션 이상 사용한다면 API 빌링이 Pro보다 더 비쌀 수 있습니다. vexp.dev의 실측에 따르면 Sonnet 4.5 기준 하루 8세션, 월 20일 근무 = 160세션이면 API 비용이 월 약 $57~64 수준입니다.
| 사용 패턴 | API 월 비용(추정) | Pro ($20) | Max ($100) |
|---|---|---|---|
| 가벼운 사용 (1~2세션/일) | 약 $15 | $20 | $100 |
| 중간 사용 (5세션/일) | 약 $50 | $20 | $100 |
| 고강도 사용 (10세션/일) | 약 $100 | 한도 초과 위험 | $100 |
💡 Pro와 Max는 구독 내에서 토큰 소비가 이루어지기 때문에 API 빌링처럼 청구서가 폭증하지 않습니다. 단, Pro는 월 사용량 한도가 비공개이고 동적으로 조정됩니다 — 달 중반에 한도를 치면 리셋까지 기다려야 합니다. Max는 Pro의 5배 또는 20배 사용량을 선택할 수 있습니다.
프로덕션 서비스(고객용 API)는 무조건 API 빌링이 맞습니다. 자동화·배치 처리라면 배치 API 50% 할인을 활용하는 게 핵심입니다. 개인 개발자 도구라면 월 50세션 기준으로 API와 Pro 중 유리한 쪽을 판단하면 됩니다.
(출처: vexp.dev 실측 분석, vexp.dev/blog/claude-code-cost-per-month, 2026.03.13)
Q&A
Q. Claude API는 크레딧 선불 방식인가요, 월 청구 방식인가요?
Q. 1토큰이 정확히 몇 글자인가요?
Q. 200k 토큰 초과 시 모든 모델에 추가 요금이 붙나요?
Q. 웹 검색 툴은 토큰 비용 외에 추가 요금이 있나요?
Q. 배치 API와 프롬프트 캐싱을 동시에 쓰면 할인이 두 번 적용되나요?
마치며
Claude API 비용 구조를 한마디로 요약하면 이렇습니다. 모델은 최신이 싸고 강하다, 출력 토큰이 진짜 비용이다, 캐싱과 배치는 써야 할 때와 쓰면 안 될 때가 다르다.
Opus 4.1을 아직 쓰고 있다면 지금 당장 Opus 4.6으로 교체하는 것만으로 같은 작업을 3분의 1 비용으로 처리할 수 있습니다. 그리고 비용 절감의 가장 큰 레버는 입력 토큰을 줄이는 것이 아니라, 출력 토큰과 모델 선택입니다.
개인적으로는 대부분의 작업에 Sonnet 4.6을 쓰고, 복잡도가 높거나 에이전트 루프가 필요한 작업에만 Opus 4.6을 한정해서 씁니다. 이 전략만으로도 풀 Opus 대비 비용이 절반 이하로 내려갑니다.
📚 본 포스팅 참고 자료
- Anthropic 공식 가격 문서 —
docs.anthropic.com/en/docs/about-claude/pricing - Anthropic 모델 개요 문서 —
docs.anthropic.com/en/docs/about-claude/models/overview - vexp.dev — Claude Code 실측 비용 분석 (2026.03.13) —
vexp.dev/blog/claude-code-cost-per-month - InvertedStone — Claude API 가격 계산기 —
invertedstone.com/calculators/claude-pricing
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 모든 가격 수치는 2026.03.25 기준 Anthropic 공식 문서를 토대로 작성됐으며, 최신 요금은 공식 가격 페이지에서 반드시 재확인하시기 바랍니다.

댓글 남기기