Claude API 비용, Opus 4.1이 4.6보다 3배 비싼 이유

Published on

2026년 3월 25일

2026.03.25 기준 / Claude 4 모델군 기준

Claude API 비용, Opus 4.1이 4.6보다 3배 비싼 이유

결론부터 말씀드리면, Claude API 비용은 모델 이름의 숫자가 클수록 최신·저렴한 구조입니다. Opus 4.1은 입력 $15/MTok인데 Opus 4.6은 $5/MTok — 같은 Opus 계열인데 3배 차이가 납니다. 공식 가격 문서를 직접 펼쳐서 확인한 수치입니다.

Opus 4.6 입력 /MTok

$15

Opus 4.1 입력 /MTok

50%

배치 API 할인율

90%

캐시 히트 절감률

모델별 가격표 — 직접 뽑은 숫자

Claude API 비용은 Anthropic 공식 가격 문서(docs.anthropic.com/en/docs/about-claude/pricing)에 모두 나와 있습니다. 아래 표는 2026.03.25 기준 최신 모델군 전체를 공식 수치 그대로 가져온 것입니다.

모델	입력 (/MTok)	출력 (/MTok)	캐시 히트
Opus 4.6	$5.00	$25.00	$0.50
Opus 4.5	$5.00	$25.00	$0.50
Opus 4.1	$15.00	$75.00	$1.50
Opus 4	$15.00	$75.00	$1.50
Sonnet 4.6	$3.00	$15.00	$0.30
Sonnet 4.5 / 4	$3.00	$15.00	$0.30
Haiku 4.5	$1.00	$5.00	$0.10
Haiku 3.5	$0.80	$4.00	$0.08
Haiku 3	$0.25	$1.25	$0.03

💡 공식 가격표와 모델 출시 순서를 같이 놓고 보면 이런 패턴이 보입니다 — Anthropic은 신모델을 출시하면서 구모델보다 동등하거나 더 낮은 가격에 더 높은 성능을 제공합니다. Opus 4.1은 출시 당시 최고가였지만, 이후 나온 Opus 4.6이 같은 계열에서 3분의 1 가격입니다.

(출처: Anthropic 공식 가격 문서, docs.anthropic.com/en/docs/about-claude/pricing, 2026.03.25 기준)

▲ 목차로 돌아가기

출력 토큰이 입력보다 5배 비싼 이유 — 이 부분이 비용 폭탄의 진짜 원인

Sonnet 4.6 기준 입력은 $3/MTok, 출력은 $15/MTok입니다. 5배 차이입니다. 공식 문서는 “출력 토큰은 모델이 각 토큰을 순차적으로 예측해야 해서 연산량이 훨씬 크다”고 설명합니다. 단순 조회가 아닌 생성이기 때문입니다.

실제 비용에서 이게 의미하는 건 하나입니다. Claude한테 길게 답변하게 시킬수록 비용이 기하급수적으로 오릅니다. 예를 들어 입력 1,000토큰, 출력 500토큰짜리 요청과 입력 1,000토큰, 출력 2,000토큰짜리 요청을 Opus 4.6으로 비교하면:

📊 출력 토큰 길이에 따른 비용 변화 (Opus 4.6 기준)

• 입력 1,000토큰 + 출력 500토큰

= (0.001 × $5) + (0.0005 × $25) = $0.0175

• 입력 1,000토큰 + 출력 2,000토큰

= (0.001 × $5) + (0.002 × $25) = $0.055

→ 출력만 4배 늘었는데 총 비용은 3.1배 증가

많은 개발자가 시스템 프롬프트를 줄이는 데 집중합니다. 막상 해보면 다릅니다 — 실제 비용 절감은 출력 토큰 통제에서 더 크게 나옵니다. max_tokens를 적절히 설정하고, 답변 형식을 간결하게 유도하는 것이 입력 줄이기보다 효과적입니다.

(출처: Anthropic 공식 가격 문서, docs.anthropic.com/en/docs/about-claude/pricing)

▲ 목차로 돌아가기

프롬프트 캐싱, 무조건 켜면 오히려 손해가 납니다

프롬프트 캐싱은 한 번 처리한 입력 내용을 저장해 두고, 다음 요청 때 재사용하는 기능입니다. 캐시 히트 시 Sonnet 4.6 기준 $0.30/MTok — 표준 입력($3/MTok)의 10%입니다. 여기까지는 다들 아는 내용입니다.

💡 공식 문서의 캐시 쓰기 비용과 TTL(유효 기간)을 같이 놓고 계산해 보면, 생각보다 빨리 손해 구간이 나옵니다.

5분 캐시 (캐시 쓰기 1.25x, 히트 0.1x)

• 쓰기 1회 = 1.25배 비용

• 히트 1회 = 0.1배 비용

→ 첫 번째 히트에서 바로 손익분기 돌파 (1.25 – 0.1 = 절감 시작)

1시간 캐시 (캐시 쓰기 2x, 히트 0.1x)

• 쓰기 1회 = 2배 비용

• 히트 1회 = 0.1배 비용

→ 히트가 최소 2회 이상이어야 손익분기점 도달 (2x 투자 회수 조건)

문제는 1시간 캐시 타입입니다. 쓰기 비용이 표준 입력의 2배인데, 5분 안에 같은 프롬프트로 후속 요청이 2번 이상 오지 않으면 오히려 더 비쌉니다. 단발성 요청이 많거나, 사용자가 대화를 끊고 1시간 이상 지나서 다시 접속하는 서비스라면 캐싱이 비용을 높이는 역할을 합니다.

실제로 캐싱이 효과적인 건 긴 시스템 프롬프트나 RAG 문서처럼 동일한 내용이 반복 재사용되는 맥락일 때입니다. 짧고 일회성인 대화에는 5분 캐시도 고려해서 선택해야 합니다.

▲ 목차로 돌아가기

배치 API 50% 할인 — 쓸 수 있는 상황과 없는 상황

배치 API는 실시간 응답이 필요 없는 요청을 묶어서 처리하는 방식입니다. 공식 문서 기준 입력·출력 모두 50% 할인이 적용됩니다. Sonnet 4.6 기준 입력 $1.50/MTok, 출력 $7.50/MTok — 일반 호출의 절반입니다.

모델	배치 입력 /MTok	배치 출력 /MTok
Opus 4.6	$2.50	$12.50
Sonnet 4.6	$1.50	$7.50
Haiku 4.5	$0.50	$2.50

결과는 24시간 내에 반환됩니다. 데이터 분석, 대량 문서 요약, 콘텐츠 분류 같은 비실시간 파이프라인에 적합합니다. 배치 API와 프롬프트 캐싱은 동시에 사용할 수 있고, 두 할인이 곱해집니다.

단, Fast Mode는 배치 API와 함께 쓸 수 없습니다. 공식 문서에 “Fast mode is not available with the Batch API”라고 명시돼 있습니다. Fast Mode를 쓰면 출력 속도가 올라가지만 6배 요금이 붙고 배치 할인은 사라집니다 — 다음 섹션에서 따로 다룹니다.

(출처: Anthropic 공식 가격 문서, docs.anthropic.com/en/docs/about-claude/pricing#batch-processing)

▲ 목차로 돌아가기

실제 사용 시나리오별 월 비용 계산

추상적인 단가보다 직접 따라 해볼 수 있는 계산식이 더 유용합니다. 공식 문서에서 제공한 에이전트 예시와 실측 데이터를 기반으로 세 가지 시나리오를 정리했습니다.

시나리오 A — 고객 지원 챗봇 (Opus 4.6, 월 10,000건)

• 대화당 평균 입력 약 2,000토큰 + 출력 약 1,700토큰 = 총 3,700토큰

• 월 입력: 2,000 × 10,000 = 20M 토큰 → $5 × 20 = $100

• 월 출력: 1,700 × 10,000 = 17M 토큰 → $25 × 17 = $425

→ 월 합계 약 $525
(출처: Anthropic 에이전트 가이드, docs.anthropic.com/en/docs/about-claude/pricing#customer-support)

시나리오 B — 문서 요약 파이프라인 (Haiku 4.5, 배치 API, 월 3,000건)

• 문서당 평균 입력 7,000토큰 + 출력 500토큰

• 배치 입력: 7,000 × 3,000 = 21M 토큰 → $0.50 × 21 = $10.50

• 배치 출력: 500 × 3,000 = 1.5M 토큰 → $2.50 × 1.5 = $3.75

→ 월 합계 약 $14.25 — 같은 작업을 일반 API로 하면 약 $28.50

시나리오 C — 개인 개발자 Claude Code (API 빌링, 월 160세션)

• 세션당 평균 입력 약 70,000토큰 + 출력 약 10,000토큰 (Sonnet 4.5 기준)

• 월 입력: 70,000 × 160 = 11,200M… = 11.2B 토큰이 아니라 11,200,000 토큰 = 11.2M → $3 × 11.2 = $33.6

• 월 출력: 10,000 × 160 = 1.6M 토큰 → $15 × 1.6 = $24

→ 월 합계 약 $57.6 — Claude Pro($20) 대비 약 2.9배 비쌈
(출처: vexp.dev 실측, vexp.dev/blog/claude-code-cost-per-month)

▲ 목차로 돌아가기

Fast Mode 함정 — 6배 요금에 배치 API 병용 불가

Opus 4.6에만 적용되는 Fast Mode는 출력 속도를 크게 높여줍니다. 대신 비용은 표준 요금의 6배입니다. 공식 문서 기준으로 입력 $30/MTok, 출력 $150/MTok입니다. Opus 4.6 표준($5 / $25)과 비교하면 정확히 6배입니다.

⚠️ Fast Mode를 켜면 이렇게 됩니다

• 프롬프트 캐싱 할인은 적용되지만, 6배 요금에 곱해서 계산

• 데이터 레지던시(US-only, 1.1x)도 Fast Mode 위에 곱해짐

• 배치 API와 동시 사용 불가 — Fast Mode 요청은 배치 처리 대상 아님

사용자 인터랙션이 빠른 응답 속도를 요구하는 프로덕션에서는 Fast Mode가 의미 있습니다. 하지만 배치로 처리할 수 있는 비실시간 작업에 Fast Mode를 함께 켜면 배치 할인 50%를 날리고 6배 요금을 그대로 냅니다.

실사용에서 이 조합이 의외로 자주 발생합니다. 에이전트 파이프라인을 설계할 때 속도가 필요한 부분과 그렇지 않은 부분을 분리해서, Fast Mode는 실시간 구간에만 제한적으로 적용하는 구조가 비용 효율적입니다.

(출처: Anthropic Fast Mode 문서, docs.anthropic.com/en/docs/about-claude/pricing#fast-mode-pricing)

▲ 목차로 돌아가기

API vs Pro($20) vs Max($100), 손익분기점이 여기 있습니다

“API가 더 싸다”는 말이 항상 맞지는 않습니다. 개인 개발자가 Claude Code를 하루 5~8세션 이상 사용한다면 API 빌링이 Pro보다 더 비쌀 수 있습니다. vexp.dev의 실측에 따르면 Sonnet 4.5 기준 하루 8세션, 월 20일 근무 = 160세션이면 API 비용이 월 약 $57~64 수준입니다.

사용 패턴	API 월 비용(추정)	Pro ($20)	Max ($100)
가벼운 사용 (1~2세션/일)	약 $15	$20	$100
중간 사용 (5세션/일)	약 $50	$20	$100
고강도 사용 (10세션/일)	약 $100	한도 초과 위험	$100

💡 Pro와 Max는 구독 내에서 토큰 소비가 이루어지기 때문에 API 빌링처럼 청구서가 폭증하지 않습니다. 단, Pro는 월 사용량 한도가 비공개이고 동적으로 조정됩니다 — 달 중반에 한도를 치면 리셋까지 기다려야 합니다. Max는 Pro의 5배 또는 20배 사용량을 선택할 수 있습니다.

프로덕션 서비스(고객용 API)는 무조건 API 빌링이 맞습니다. 자동화·배치 처리라면 배치 API 50% 할인을 활용하는 게 핵심입니다. 개인 개발자 도구라면 월 50세션 기준으로 API와 Pro 중 유리한 쪽을 판단하면 됩니다.

(출처: vexp.dev 실측 분석, vexp.dev/blog/claude-code-cost-per-month, 2026.03.13)

▲ 목차로 돌아가기

Q&A

Q. Claude API는 크레딧 선불 방식인가요, 월 청구 방식인가요?

선불 크레딧 방식입니다. Anthropic 콘솔에서 크레딧을 충전한 뒤, 사용한 토큰만큼 차감됩니다. 최소 충전 금액은 $5입니다. 월말에 자동으로 과금되는 후불 방식이 아니기 때문에 예산 초과를 사전에 막을 수 있습니다.

Q. 1토큰이 정확히 몇 글자인가요?

영어 기준으로 약 4자 또는 0.75단어입니다. 공식 문서에 이렇게 나옵니다. 한국어는 영어보다 토큰 효율이 낮아서 같은 분량의 텍스트가 더 많은 토큰을 소비합니다. 한국어 콘텐츠를 대규모로 처리할 때는 영어 기준 추정치보다 실제 사용량이 20~40% 높게 나오는 경우가 많습니다.

Q. 200k 토큰 초과 시 모든 모델에 추가 요금이 붙나요?

Opus 4.6과 Sonnet 4.6은 1M 토큰 컨텍스트 창 전체를 표준 요금으로 제공합니다. 공식 문서에 “A 900k-token request is billed at the same per-token rate as a 9k-token request”라고 명시돼 있습니다. 반면 Sonnet 4.5와 Sonnet 4는 200k 초과 시 베타 헤더를 포함한 경우에 한해 입력이 2배, 출력이 1.5배로 올라갑니다.

Q. 웹 검색 툴은 토큰 비용 외에 추가 요금이 있나요?

있습니다. 공식 가격 문서 기준으로 검색 1회당 $0.01(= $10 / 1,000건)이 토큰 비용에 추가됩니다. 오류가 발생한 검색은 과금되지 않습니다. 웹 페치(fetch) 툴은 추가 요금 없이 표준 토큰 비용만 적용됩니다.

Q. 배치 API와 프롬프트 캐싱을 동시에 쓰면 할인이 두 번 적용되나요?

맞습니다. 공식 문서에 “These multipliers stack with other pricing modifiers, including the Batch API discount”라고 돼 있습니다. 예를 들어 배치 API(50% 할인)에 프롬프트 캐시 히트(10% 요금)를 조합하면, 해당 토큰은 표준 요금의 5%(= 50% × 10%)만 내게 됩니다. 반복되는 긴 시스템 프롬프트가 있는 비실시간 파이프라인에서 가장 큰 절감 효과를 냅니다.

▲ 목차로 돌아가기

마치며

Claude API 비용 구조를 한마디로 요약하면 이렇습니다. 모델은 최신이 싸고 강하다, 출력 토큰이 진짜 비용이다, 캐싱과 배치는 써야 할 때와 쓰면 안 될 때가 다르다.

Opus 4.1을 아직 쓰고 있다면 지금 당장 Opus 4.6으로 교체하는 것만으로 같은 작업을 3분의 1 비용으로 처리할 수 있습니다. 그리고 비용 절감의 가장 큰 레버는 입력 토큰을 줄이는 것이 아니라, 출력 토큰과 모델 선택입니다.

개인적으로는 대부분의 작업에 Sonnet 4.6을 쓰고, 복잡도가 높거나 에이전트 루프가 필요한 작업에만 Opus 4.6을 한정해서 씁니다. 이 전략만으로도 풀 Opus 대비 비용이 절반 이하로 내려갑니다.

▲ 목차로 돌아가기

📚 본 포스팅 참고 자료

Anthropic 공식 가격 문서 —
docs.anthropic.com/en/docs/about-claude/pricing
Anthropic 모델 개요 문서 —
docs.anthropic.com/en/docs/about-claude/models/overview
vexp.dev — Claude Code 실측 비용 분석 (2026.03.13) —
vexp.dev/blog/claude-code-cost-per-month
InvertedStone — Claude API 가격 계산기 —
invertedstone.com/calculators/claude-pricing

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 모든 가격 수치는 2026.03.25 기준 Anthropic 공식 문서를 토대로 작성됐으며, 최신 요금은 공식 가격 페이지에서 반드시 재확인하시기 바랍니다.

AI API 비용 비교, Anthropic 가격, Claude API, 토큰 비용, 프롬프트 캐싱

Claude API 비용, Opus 4.1이 4.6보다 3배 비싼 이유

Claude API 비용, Opus 4.1이 4.6보다 3배 비싼 이유

모델별 가격표 — 직접 뽑은 숫자

출력 토큰이 입력보다 5배 비싼 이유 — 이 부분이 비용 폭탄의 진짜 원인

프롬프트 캐싱, 무조건 켜면 오히려 손해가 납니다

배치 API 50% 할인 — 쓸 수 있는 상황과 없는 상황

실제 사용 시나리오별 월 비용 계산

Fast Mode 함정 — 6배 요금에 배치 API 병용 불가

API vs Pro($20) vs Max($100), 손익분기점이 여기 있습니다

Q&A

마치며

📚 본 포스팅 참고 자료

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

Claude API 비용, Opus 4.1이 4.6보다 3배 비싼 이유

Claude API 비용, Opus 4.1이 4.6보다 3배 비싼 이유

모델별 가격표 — 직접 뽑은 숫자

출력 토큰이 입력보다 5배 비싼 이유 — 이 부분이 비용 폭탄의 진짜 원인

프롬프트 캐싱, 무조건 켜면 오히려 손해가 납니다

배치 API 50% 할인 — 쓸 수 있는 상황과 없는 상황

실제 사용 시나리오별 월 비용 계산

Fast Mode 함정 — 6배 요금에 배치 API 병용 불가

API vs Pro($20) vs Max($100), 손익분기점이 여기 있습니다

Q&A

마치며

📚 본 포스팅 참고 자료

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기