Claude API 비용, Opus 4.1이 4.6보다 3배 비싼 이유

Published on

in

Claude API 비용, Opus 4.1이 4.6보다 3배 비싼 이유

2026.03.25 기준 / Claude 4 모델군 기준

Claude API 비용, Opus 4.1이 4.6보다 3배 비싼 이유

결론부터 말씀드리면, Claude API 비용은 모델 이름의 숫자가 클수록 최신·저렴한 구조입니다. Opus 4.1은 입력 $15/MTok인데 Opus 4.6은 $5/MTok — 같은 Opus 계열인데 3배 차이가 납니다. 공식 가격 문서를 직접 펼쳐서 확인한 수치입니다.

$5
Opus 4.6 입력 /MTok
$15
Opus 4.1 입력 /MTok
50%
배치 API 할인율
90%
캐시 히트 절감률

모델별 가격표 — 직접 뽑은 숫자

Claude API 비용은 Anthropic 공식 가격 문서(docs.anthropic.com/en/docs/about-claude/pricing)에 모두 나와 있습니다. 아래 표는 2026.03.25 기준 최신 모델군 전체를 공식 수치 그대로 가져온 것입니다.

모델 입력 (/MTok) 출력 (/MTok) 캐시 히트
Opus 4.6 $5.00 $25.00 $0.50
Opus 4.5 $5.00 $25.00 $0.50
Opus 4.1 $15.00 $75.00 $1.50
Opus 4 $15.00 $75.00 $1.50
Sonnet 4.6 $3.00 $15.00 $0.30
Sonnet 4.5 / 4 $3.00 $15.00 $0.30
Haiku 4.5 $1.00 $5.00 $0.10
Haiku 3.5 $0.80 $4.00 $0.08
Haiku 3 $0.25 $1.25 $0.03

💡 공식 가격표와 모델 출시 순서를 같이 놓고 보면 이런 패턴이 보입니다 — Anthropic은 신모델을 출시하면서 구모델보다 동등하거나 더 낮은 가격에 더 높은 성능을 제공합니다. Opus 4.1은 출시 당시 최고가였지만, 이후 나온 Opus 4.6이 같은 계열에서 3분의 1 가격입니다.

(출처: Anthropic 공식 가격 문서, docs.anthropic.com/en/docs/about-claude/pricing, 2026.03.25 기준)

▲ 목차로 돌아가기

출력 토큰이 입력보다 5배 비싼 이유 — 이 부분이 비용 폭탄의 진짜 원인

Sonnet 4.6 기준 입력은 $3/MTok, 출력은 $15/MTok입니다. 5배 차이입니다. 공식 문서는 “출력 토큰은 모델이 각 토큰을 순차적으로 예측해야 해서 연산량이 훨씬 크다”고 설명합니다. 단순 조회가 아닌 생성이기 때문입니다.

실제 비용에서 이게 의미하는 건 하나입니다. Claude한테 길게 답변하게 시킬수록 비용이 기하급수적으로 오릅니다. 예를 들어 입력 1,000토큰, 출력 500토큰짜리 요청과 입력 1,000토큰, 출력 2,000토큰짜리 요청을 Opus 4.6으로 비교하면:

📊 출력 토큰 길이에 따른 비용 변화 (Opus 4.6 기준)

• 입력 1,000토큰 + 출력 500토큰

= (0.001 × $5) + (0.0005 × $25) = $0.0175

• 입력 1,000토큰 + 출력 2,000토큰

= (0.001 × $5) + (0.002 × $25) = $0.055

→ 출력만 4배 늘었는데 총 비용은 3.1배 증가

많은 개발자가 시스템 프롬프트를 줄이는 데 집중합니다. 막상 해보면 다릅니다 — 실제 비용 절감은 출력 토큰 통제에서 더 크게 나옵니다. max_tokens를 적절히 설정하고, 답변 형식을 간결하게 유도하는 것이 입력 줄이기보다 효과적입니다.

(출처: Anthropic 공식 가격 문서, docs.anthropic.com/en/docs/about-claude/pricing)

▲ 목차로 돌아가기

프롬프트 캐싱, 무조건 켜면 오히려 손해가 납니다

프롬프트 캐싱은 한 번 처리한 입력 내용을 저장해 두고, 다음 요청 때 재사용하는 기능입니다. 캐시 히트 시 Sonnet 4.6 기준 $0.30/MTok — 표준 입력($3/MTok)의 10%입니다. 여기까지는 다들 아는 내용입니다.

💡 공식 문서의 캐시 쓰기 비용과 TTL(유효 기간)을 같이 놓고 계산해 보면, 생각보다 빨리 손해 구간이 나옵니다.

5분 캐시 (캐시 쓰기 1.25x, 히트 0.1x)

• 쓰기 1회 = 1.25배 비용

• 히트 1회 = 0.1배 비용

첫 번째 히트에서 바로 손익분기 돌파 (1.25 – 0.1 = 절감 시작)

1시간 캐시 (캐시 쓰기 2x, 히트 0.1x)

• 쓰기 1회 = 2배 비용

• 히트 1회 = 0.1배 비용

히트가 최소 2회 이상이어야 손익분기점 도달 (2x 투자 회수 조건)

문제는 1시간 캐시 타입입니다. 쓰기 비용이 표준 입력의 2배인데, 5분 안에 같은 프롬프트로 후속 요청이 2번 이상 오지 않으면 오히려 더 비쌉니다. 단발성 요청이 많거나, 사용자가 대화를 끊고 1시간 이상 지나서 다시 접속하는 서비스라면 캐싱이 비용을 높이는 역할을 합니다.

실제로 캐싱이 효과적인 건 긴 시스템 프롬프트나 RAG 문서처럼 동일한 내용이 반복 재사용되는 맥락일 때입니다. 짧고 일회성인 대화에는 5분 캐시도 고려해서 선택해야 합니다.

▲ 목차로 돌아가기

배치 API 50% 할인 — 쓸 수 있는 상황과 없는 상황

배치 API는 실시간 응답이 필요 없는 요청을 묶어서 처리하는 방식입니다. 공식 문서 기준 입력·출력 모두 50% 할인이 적용됩니다. Sonnet 4.6 기준 입력 $1.50/MTok, 출력 $7.50/MTok — 일반 호출의 절반입니다.

모델 배치 입력 /MTok 배치 출력 /MTok
Opus 4.6 $2.50 $12.50
Sonnet 4.6 $1.50 $7.50
Haiku 4.5 $0.50 $2.50

결과는 24시간 내에 반환됩니다. 데이터 분석, 대량 문서 요약, 콘텐츠 분류 같은 비실시간 파이프라인에 적합합니다. 배치 API와 프롬프트 캐싱은 동시에 사용할 수 있고, 두 할인이 곱해집니다.

단, Fast Mode는 배치 API와 함께 쓸 수 없습니다. 공식 문서에 “Fast mode is not available with the Batch API”라고 명시돼 있습니다. Fast Mode를 쓰면 출력 속도가 올라가지만 6배 요금이 붙고 배치 할인은 사라집니다 — 다음 섹션에서 따로 다룹니다.

(출처: Anthropic 공식 가격 문서, docs.anthropic.com/en/docs/about-claude/pricing#batch-processing)

▲ 목차로 돌아가기

실제 사용 시나리오별 월 비용 계산

추상적인 단가보다 직접 따라 해볼 수 있는 계산식이 더 유용합니다. 공식 문서에서 제공한 에이전트 예시와 실측 데이터를 기반으로 세 가지 시나리오를 정리했습니다.

시나리오 A — 고객 지원 챗봇 (Opus 4.6, 월 10,000건)

• 대화당 평균 입력 약 2,000토큰 + 출력 약 1,700토큰 = 총 3,700토큰

• 월 입력: 2,000 × 10,000 = 20M 토큰 → $5 × 20 = $100

• 월 출력: 1,700 × 10,000 = 17M 토큰 → $25 × 17 = $425

월 합계 약 $525
(출처: Anthropic 에이전트 가이드, docs.anthropic.com/en/docs/about-claude/pricing#customer-support)

시나리오 B — 문서 요약 파이프라인 (Haiku 4.5, 배치 API, 월 3,000건)

• 문서당 평균 입력 7,000토큰 + 출력 500토큰

• 배치 입력: 7,000 × 3,000 = 21M 토큰 → $0.50 × 21 = $10.50

• 배치 출력: 500 × 3,000 = 1.5M 토큰 → $2.50 × 1.5 = $3.75

월 합계 약 $14.25 — 같은 작업을 일반 API로 하면 약 $28.50

시나리오 C — 개인 개발자 Claude Code (API 빌링, 월 160세션)

• 세션당 평균 입력 약 70,000토큰 + 출력 약 10,000토큰 (Sonnet 4.5 기준)

• 월 입력: 70,000 × 160 = 11,200M… = 11.2B 토큰이 아니라 11,200,000 토큰 = 11.2M → $3 × 11.2 = $33.6

• 월 출력: 10,000 × 160 = 1.6M 토큰 → $15 × 1.6 = $24

월 합계 약 $57.6 — Claude Pro($20) 대비 약 2.9배 비쌈
(출처: vexp.dev 실측, vexp.dev/blog/claude-code-cost-per-month)

▲ 목차로 돌아가기

Fast Mode 함정 — 6배 요금에 배치 API 병용 불가

Opus 4.6에만 적용되는 Fast Mode는 출력 속도를 크게 높여줍니다. 대신 비용은 표준 요금의 6배입니다. 공식 문서 기준으로 입력 $30/MTok, 출력 $150/MTok입니다. Opus 4.6 표준($5 / $25)과 비교하면 정확히 6배입니다.

⚠️ Fast Mode를 켜면 이렇게 됩니다

• 프롬프트 캐싱 할인은 적용되지만, 6배 요금에 곱해서 계산

• 데이터 레지던시(US-only, 1.1x)도 Fast Mode 위에 곱해짐

• 배치 API와 동시 사용 불가 — Fast Mode 요청은 배치 처리 대상 아님

사용자 인터랙션이 빠른 응답 속도를 요구하는 프로덕션에서는 Fast Mode가 의미 있습니다. 하지만 배치로 처리할 수 있는 비실시간 작업에 Fast Mode를 함께 켜면 배치 할인 50%를 날리고 6배 요금을 그대로 냅니다.

실사용에서 이 조합이 의외로 자주 발생합니다. 에이전트 파이프라인을 설계할 때 속도가 필요한 부분과 그렇지 않은 부분을 분리해서, Fast Mode는 실시간 구간에만 제한적으로 적용하는 구조가 비용 효율적입니다.

(출처: Anthropic Fast Mode 문서, docs.anthropic.com/en/docs/about-claude/pricing#fast-mode-pricing)

▲ 목차로 돌아가기

API vs Pro($20) vs Max($100), 손익분기점이 여기 있습니다

“API가 더 싸다”는 말이 항상 맞지는 않습니다. 개인 개발자가 Claude Code를 하루 5~8세션 이상 사용한다면 API 빌링이 Pro보다 더 비쌀 수 있습니다. vexp.dev의 실측에 따르면 Sonnet 4.5 기준 하루 8세션, 월 20일 근무 = 160세션이면 API 비용이 월 약 $57~64 수준입니다.

사용 패턴 API 월 비용(추정) Pro ($20) Max ($100)
가벼운 사용 (1~2세션/일) 약 $15 $20 $100
중간 사용 (5세션/일) 약 $50 $20 $100
고강도 사용 (10세션/일) 약 $100 한도 초과 위험 $100

💡 Pro와 Max는 구독 내에서 토큰 소비가 이루어지기 때문에 API 빌링처럼 청구서가 폭증하지 않습니다. 단, Pro는 월 사용량 한도가 비공개이고 동적으로 조정됩니다 — 달 중반에 한도를 치면 리셋까지 기다려야 합니다. Max는 Pro의 5배 또는 20배 사용량을 선택할 수 있습니다.

프로덕션 서비스(고객용 API)는 무조건 API 빌링이 맞습니다. 자동화·배치 처리라면 배치 API 50% 할인을 활용하는 게 핵심입니다. 개인 개발자 도구라면 월 50세션 기준으로 API와 Pro 중 유리한 쪽을 판단하면 됩니다.

(출처: vexp.dev 실측 분석, vexp.dev/blog/claude-code-cost-per-month, 2026.03.13)

▲ 목차로 돌아가기

Q&A

Q. Claude API는 크레딧 선불 방식인가요, 월 청구 방식인가요?
선불 크레딧 방식입니다. Anthropic 콘솔에서 크레딧을 충전한 뒤, 사용한 토큰만큼 차감됩니다. 최소 충전 금액은 $5입니다. 월말에 자동으로 과금되는 후불 방식이 아니기 때문에 예산 초과를 사전에 막을 수 있습니다.
Q. 1토큰이 정확히 몇 글자인가요?
영어 기준으로 약 4자 또는 0.75단어입니다. 공식 문서에 이렇게 나옵니다. 한국어는 영어보다 토큰 효율이 낮아서 같은 분량의 텍스트가 더 많은 토큰을 소비합니다. 한국어 콘텐츠를 대규모로 처리할 때는 영어 기준 추정치보다 실제 사용량이 20~40% 높게 나오는 경우가 많습니다.
Q. 200k 토큰 초과 시 모든 모델에 추가 요금이 붙나요?
Opus 4.6과 Sonnet 4.6은 1M 토큰 컨텍스트 창 전체를 표준 요금으로 제공합니다. 공식 문서에 “A 900k-token request is billed at the same per-token rate as a 9k-token request”라고 명시돼 있습니다. 반면 Sonnet 4.5와 Sonnet 4는 200k 초과 시 베타 헤더를 포함한 경우에 한해 입력이 2배, 출력이 1.5배로 올라갑니다.
Q. 웹 검색 툴은 토큰 비용 외에 추가 요금이 있나요?
있습니다. 공식 가격 문서 기준으로 검색 1회당 $0.01(= $10 / 1,000건)이 토큰 비용에 추가됩니다. 오류가 발생한 검색은 과금되지 않습니다. 웹 페치(fetch) 툴은 추가 요금 없이 표준 토큰 비용만 적용됩니다.
Q. 배치 API와 프롬프트 캐싱을 동시에 쓰면 할인이 두 번 적용되나요?
맞습니다. 공식 문서에 “These multipliers stack with other pricing modifiers, including the Batch API discount”라고 돼 있습니다. 예를 들어 배치 API(50% 할인)에 프롬프트 캐시 히트(10% 요금)를 조합하면, 해당 토큰은 표준 요금의 5%(= 50% × 10%)만 내게 됩니다. 반복되는 긴 시스템 프롬프트가 있는 비실시간 파이프라인에서 가장 큰 절감 효과를 냅니다.

▲ 목차로 돌아가기

마치며

Claude API 비용 구조를 한마디로 요약하면 이렇습니다. 모델은 최신이 싸고 강하다, 출력 토큰이 진짜 비용이다, 캐싱과 배치는 써야 할 때와 쓰면 안 될 때가 다르다.

Opus 4.1을 아직 쓰고 있다면 지금 당장 Opus 4.6으로 교체하는 것만으로 같은 작업을 3분의 1 비용으로 처리할 수 있습니다. 그리고 비용 절감의 가장 큰 레버는 입력 토큰을 줄이는 것이 아니라, 출력 토큰과 모델 선택입니다.

개인적으로는 대부분의 작업에 Sonnet 4.6을 쓰고, 복잡도가 높거나 에이전트 루프가 필요한 작업에만 Opus 4.6을 한정해서 씁니다. 이 전략만으로도 풀 Opus 대비 비용이 절반 이하로 내려갑니다.

▲ 목차로 돌아가기

📚 본 포스팅 참고 자료

  1. Anthropic 공식 가격 문서 —
    docs.anthropic.com/en/docs/about-claude/pricing
  2. Anthropic 모델 개요 문서 —
    docs.anthropic.com/en/docs/about-claude/models/overview
  3. vexp.dev — Claude Code 실측 비용 분석 (2026.03.13) —
    vexp.dev/blog/claude-code-cost-per-month
  4. InvertedStone — Claude API 가격 계산기 —
    invertedstone.com/calculators/claude-pricing

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 모든 가격 수치는 2026.03.25 기준 Anthropic 공식 문서를 토대로 작성됐으며, 최신 요금은 공식 가격 페이지에서 반드시 재확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기