Claude Sonnet 4.6 API 가격, 실제로 계산해봤습니다

Published on

2026년 3월 19일

2026.03.19 기준
claude-sonnet-4-6 기준
Anthropic 공식 가격 기반

Claude Sonnet 4.6 API 가격, 실제로 계산해봤습니다

공식 발표는 입력 $3 / 출력 $15 (100만 토큰당)입니다. 그런데 실제 청구서를 보면 이 숫자 그대로 나오는 경우가 생각보다 적습니다. 200K 토큰 초과, 프롬프트 캐싱 적용 방식, 배치 API 조합에 따라 요금이 최대 2배 이상 벌어집니다. Anthropic 공식 문서와 실측 수치를 기반으로 직접 계산했습니다.

$3/$15

기본 입력/출력 (MTok)

$6/$22.5

200K 토큰 초과 시

$0.30

캐시 히트 입력 (MTok)

$1.5/$7.5

배치 API (MTok)

$3짜리인데 왜 청구서가 다르게 나올까요?

결론부터 말씀드리면, 요금이 달라지는 핵심 변수는 세 가지입니다. 첫째는 요청당 입력 토큰이 200K를 넘느냐, 둘째는 프롬프트 캐싱을 사용하느냐, 셋째는 실시간 API냐 배치 API냐 하는 점입니다. 이 세 조건의 조합에 따라 동일한 100만 토큰 작업이 $1.50에 처리될 수도 있고, $6.00에 청구될 수도 있습니다. 4배 차이입니다.

💡 공식 발표문과 실제 청구 흐름을 같이 놓고 보니 이런 차이가 보였습니다.
Anthropic 공식 문서(platform.claude.com/docs/en/about-claude/pricing)에는 표준 단가 외에 긴 컨텍스트 요금, 캐싱 쓰기·읽기 요금, 배치 요금이 별도 표로 나뉘어 있습니다. 이를 조합하면 실제로는 10가지 이상의 과금 시나리오가 존재합니다.

▲ 목차로 돌아가기

200K 토큰, 생각보다 금방 차 버립니다

여기서 단가가 통째로 바뀝니다

“1M 컨텍스트 창이 생겼다”는 발표를 들으면 요금은 그대로인데 한도만 늘어난 것처럼 들립니다. 막상 API 문서를 보면 다릅니다. Anthropic 공식 가격 문서에는 이렇게 명시되어 있습니다. 입력 토큰이 200K를 초과하면 그 요청의 모든 토큰에 $6/MTok이 적용됩니다. 200K까지만 $3이고 초과분만 $6인 게 아닙니다. 200K 한 개라도 넘으면 해당 요청 전체가 높은 단가로 재계산됩니다. (출처: Apidog, Claude Sonnet 4.6 가격 분석, 2026.02.18)

코드베이스 분석 작업을 예로 들면, 중간 규모 프로젝트(약 15만 줄)를 통째로 컨텍스트에 넣으면 200K 근처에 도달하기 쉽습니다. 시스템 프롬프트(10K)에 대화 이력(30K)까지 더하면 기준선을 넘을 수 있습니다. 이 숫자가 의미하는 건, 코드베이스 분석처럼 큰 컨텍스트가 필요한 작업은 예산을 짤 때 $3이 아니라 $6으로 계산해야 현실에 가깝다는 점입니다.

시나리오	입력 단가	출력 단가	적용 기준
표준 (≤200K)	$3.00	$15.00	일반 요청
긴 컨텍스트 (>200K)	$6.00	$22.50	요청 전체에 적용
배치 API (≤200K)	$1.50	$7.50	24시간 내 결과
배치 + 긴 컨텍스트	$3.00	$11.25	스태킹 할인 적용

(출처: Anthropic 공식 API 가격 문서, apidog.com 분석, 2026.02.18)

▲ 목차로 돌아가기

프롬프트 캐싱, 90% 절감이 항상 가능한 건 아닙니다

캐시 히트 토큰도 200K 합산에 들어갑니다

프롬프트 캐싱을 쓰면 캐시 히트 시 입력 단가가 $3에서 $0.30으로 내려갑니다. 10분의 1입니다. 이 부분은 Anthropic 공식 발표가 정확합니다. 그런데 한 가지 함정이 있습니다. 200K 토큰 초과 여부를 따질 때, 캐시에서 읽어온 토큰도 총 입력 토큰에 합산됩니다. 즉, 시스템 프롬프트를 캐싱해서 $0.30에 읽어왔더라도, 그 캐시 읽기 토큰이 포함된 총량이 200K를 넘으면 요청 전체가 $6 기준으로 바뀝니다.

예를 들어, 150K짜리 시스템 프롬프트를 캐싱해 두고, 사용자 입력 60K와 함께 요청을 보내면 총 210K가 됩니다. 이 경우 캐시 읽기 토큰에도 $6/MTok이 적용됩니다. $0.30에 읽어올 것이라 기대했다가 6배를 내는 상황입니다. 이 구조가 중요한 이유는, 대용량 시스템 프롬프트를 가진 에이전트 파이프라인을 설계할 때 비용 예측 모델이 실제와 크게 달라질 수 있기 때문입니다.

💡 캐싱 비용 계산 시 확인 필요한 항목

Anthropic 공식 문서는 200K 초과 기준 산정 시 input_tokens + cache_creation_input_tokens + cache_read_input_tokens의 합계를 사용한다고 명시합니다. 시스템 프롬프트가 100K 이상이라면 반드시 이 합산값으로 200K 초과 여부를 먼저 체크해야 합니다. (출처: Anthropic API Docs Pricing, 2026.03)

캐싱 절감 효과가 실제로 나타나는 조건

캐싱의 90% 절감은 총 입력이 200K 이하인 상태에서, 같은 시스템 프롬프트를 반복적으로 재사용할 때 가장 잘 작동합니다. 공식 사례 계산에 따르면, 10,000토큰짜리 시스템 프롬프트를 하루 1,000회 반복 호출할 경우, 캐싱 없이는 하루 $30, 캐싱 적용 시 $3.04까지 내려갑니다. (출처: apidog.com, 2026.02.18) 이 숫자가 의미하는 건 단순 반복 쿼리 구조에서는 캐싱이 압도적으로 유리하지만, 요청마다 컨텍스트가 크게 달라지는 에이전트 구조에서는 절감 폭이 크게 줄어든다는 점입니다.

▲ 목차로 돌아가기

배치 API를 모르면 같은 작업에 2배 냅니다

Batch API는 실시간 응답이 필요 없는 작업에서 입·출력 단가를 정확히 절반으로 낮춰 줍니다. 입력 $1.50, 출력 $7.50(MTok당)입니다. 조건은 하나, 24시간 내 결과를 기다릴 수 있어야 합니다. 콘텐츠 분류, 문서 요약, 대량 데이터 정제처럼 사용자가 결과를 즉시 받을 필요가 없는 백엔드 파이프라인에는 적합합니다. 반면 실시간 채팅 인터페이스, 코드 보조 도구처럼 응답 대기가 불가한 용도에는 쓸 수 없습니다.

한 가지 놓치기 쉬운 부분은 배치 API와 긴 컨텍스트 요금이 스태킹된다는 점입니다. 200K 초과 요청을 배치로 보내면 $3/$11.25가 적용됩니다. 이건 표준 단가(200K 이하, 실시간)인 $3/$15보다도 출력 단가가 낮습니다. 즉, 대용량 문서 분석 작업을 배치로 처리하면 표준 단가보다 저렴하게 처리할 수 있습니다. (출처: Apidog 가격 분석표, 2026.02.18) 실제 1백만 건 분류 작업(건당 500 입력+100 출력 토큰 기준)을 배치로 처리하면 총 $1,500, 실시간으로 처리하면 $3,000으로 2배 차이가 납니다.

💡 배치 API 적합 여부 체크 기준 (직접 따라할 수 있는 판단 흐름)
① 사용자가 결과를 즉시 기다리지 않아도 되는가? → Yes면 배치 적합
② 하루 처리량이 1,000건 이상인가? → Yes면 월 절감액이 수십만원 단위로 발생
③ 요청 크기가 200K 초과인가? → Yes면 배치+긴컨텍스트 스태킹 고려

▲ 목차로 돌아가기

Sonnet 4.6 vs Opus 4.6, 가격 차이만큼 성능도 다를까요?

벤치마크는 비슷하지만, 한 가지에서 갭이 있습니다

Sonnet 4.6은 Opus 4.6보다 입력 단가 기준 40% 저렴합니다($3 vs $5). 그런데 실제 내부 테스트에서 개발자들은 Sonnet 4.6을 Opus 4.5보다 59% 더 선호했고, 컴퓨터 사용 벤치마크(OSWorld)에서는 Sonnet 4.6이 72.5%, Opus 4.6이 72.7%로 사실상 동률입니다. (출처: Anthropic 공식 발표문, 2026.02.17) 이 수치가 의미하는 건, 코딩·에이전트·문서 분석 같은 대부분의 실사용 시나리오에서 Sonnet 4.6을 쓰고 비용을 절감하는 것이 더 합리적이라는 점입니다.

단, 한 가지 명확한 차이가 있습니다. 최대 출력 토큰입니다. Sonnet 4.6의 최대 출력은 64K토큰이고, Opus 4.6은 128K토큰입니다. (출처: Apidog 비교표, 2026.02.18) 이 차이가 실질적으로 중요한 순간은 길이가 극히 긴 응답을 단일 요청으로 받아야 할 때입니다. 긴 리포트 생성, 전체 코드 파일 일괄 출력 같은 경우가 해당됩니다. 단순 코드 작성·분석·QA 대응에서는 64K 제한이 걸리는 경우가 거의 없습니다.

항목	Sonnet 4.6	Opus 4.6
입력 단가 (MTok)	$3.00	$5.00
출력 단가 (MTok)	$15.00	$25.00
최대 출력 토큰	64K	128K
OSWorld 점수	72.5%	72.7%
1M 컨텍스트 창	베타 지원	베타 지원
적합 용도	대부분의 실사용	초장문 출력·극한 추론

(출처: Anthropic 공식 발표문, Apidog 비교 분석, 2026.02.17~18)

▲ 목차로 돌아가기

웹 서치·코드 실행 도구, 토큰 말고 추가 과금이 붙습니다

Claude API에 내장된 도구들은 토큰과 별개로 요금이 추가됩니다. 웹 서치 도구는 검색 1회당 $0.01, 즉 1,000회당 $10입니다. 검색 결과 처리에 발생하는 토큰 비용은 별도입니다. (출처: Apidog 가격 문서, 2026.02.18) 하루 100회 검색을 자동화한 에이전트를 한 달 운영하면 검색 비용만 $30이 추가됩니다. 이 금액은 소규모 프로젝트라면 토큰 비용과 비슷한 수준에 달할 수 있습니다.

코드 실행 도구는 조건부 무료입니다. 웹 서치나 웹 페치 도구와 함께 사용하면 무료로 번들 제공되지만, 단독으로 사용하면 월 조직당 1,550시간 무료 후 컨테이너당 $0.05/시간이 부과됩니다. 컴퓨터 사용(computer use) 기능의 경우, 도구 정의만으로도 요청당 약 735토큰의 오버헤드가 발생합니다. 100회 요청이면 73,500토큰, $0.22 정도지만 턴이 많아지면 누적됩니다.

▲ 목차로 돌아가기

실제 사용 패턴별 월 비용 시뮬레이션

같은 토큰량, 다른 요금 — 직접 계산해봤습니다

세 가지 실제 시나리오로 월 비용을 계산했습니다. 모두 Sonnet 4.6 기준이며, 환율은 1달러=1,450원으로 환산했습니다.

📌 시나리오 A — 고객 지원 챗봇 (월 50만 건, 소형 컨텍스트)

요청당 입력 500토큰 + 출력 300토큰 / 표준 실시간 API

입력: 500 × 500,000 = 250M토큰 × $3/MTok = $750
출력: 300 × 500,000 = 150M토큰 × $15/MTok = $2,250
월 합계: $3,000 (약 435만원)

📌 시나리오 B — 문서 분류 파이프라인 (월 100만 건, 배치 API)

요청당 입력 500토큰 + 출력 100토큰 / 배치 API 사용

입력: 500M토큰 × $1.50/MTok = $750
출력: 100M토큰 × $7.50/MTok = $750
월 합계: $1,500 (약 217만원) — 동일 실시간 처리 대비 50% 절감

📌 시나리오 C — 코드베이스 분석 (일 100건, 300K 컨텍스트)

요청당 입력 300K토큰 + 출력 5K토큰 / 실시간 API (200K 초과 적용)

월 3,000건 처리
입력: 300K × 3,000건 = 900M토큰 × $6/MTok = $5,400
출력: 5K × 3,000건 = 15M토큰 × $22.50/MTok = $337.5
월 합계: $5,737 (약 831만원) — 200K 이하로 쪼갤 경우 $3/MTok 적용, $2,700+$337.5=$3,037이므로 약 47% 절감 가능

시나리오 C가 말해주는 건 명확합니다. 코드베이스를 통째로 넣는 것보다 관련 파일만 선택적으로 넣는 구조가 비용을 거의 절반으로 줄일 수 있습니다. Anthropic 공식 문서에서도 컨텍스트 최적화를 1순위 비용 절감 전략으로 언급합니다. (출처: Anthropic 공식 API 가격 문서, 2026.03)

▲ 목차로 돌아가기

자주 묻는 질문

Q. Claude Sonnet 4.6 API 기본 단가는 얼마인가요?

입력 $3/MTok, 출력 $15/MTok입니다. 이는 200K 토큰 이하 표준 실시간 API 기준입니다. 배치 API 사용 시 절반인 $1.50/$7.50, 200K 초과 시 $6/$22.50이 적용됩니다. (출처: Anthropic 공식 페이지, 2026.02.17)

Q. 1M 컨텍스트 창은 무료인가요?

1M 컨텍스트 창 접근 자체에는 별도 요금이 없습니다. 다만 입력 토큰이 200K를 초과하면 그 요청의 전체 입력에 $6/MTok이 적용됩니다. 표준 단가($3)의 2배입니다. 현재 API에서 베타 상태로 제공 중입니다. (출처: Anthropic 공식 API 문서, 2026.03)

Q. 프롬프트 캐싱을 쓰면 항상 90% 절감되나요?

캐시 히트 시 입력 단가가 $0.30/MTok으로 내려가는 건 맞습니다. 단, 캐시 읽기 토큰도 200K 합산에 포함되므로, 시스템 프롬프트가 크거나 다른 입력과 합쳐서 200K를 넘으면 캐시 히트 토큰에도 $6/MTok이 적용될 수 있습니다. 실제 절감 효과는 컨텍스트 총량과 반복 구조에 따라 달라집니다.

Q. Sonnet 4.6과 Opus 4.6 중 어떤 걸 써야 하나요?

대부분의 코딩·분석·에이전트 작업에서는 Sonnet 4.6이 40% 저렴하면서 성능 차이가 거의 없습니다. OSWorld 벤치마크 기준 Sonnet 4.6(72.5%) vs Opus 4.6(72.7%)로 사실상 동률입니다. 단일 요청에서 64K 이상의 출력이 필요하거나, 가장 복잡한 추론 작업에는 Opus 4.6(최대 128K 출력)을 쓰는 게 맞습니다.

Q. 웹 서치 도구를 많이 쓰면 비용이 얼마나 추가되나요?

웹 서치 도구는 검색 1회당 $0.01입니다. 하루 100회 검색 × 30일 = 3,000회 = $30/월이 토큰 비용 외에 추가됩니다. 검색 결과 처리에서 발생하는 토큰 비용은 별도입니다. 자동화 에이전트에 웹 서치를 내장할 때는 이 금액을 예산에 반드시 포함해야 합니다. (출처: Apidog 가격 문서, 2026.02.18)

▲ 목차로 돌아가기

마치며

솔직히 말하면, 요금 구조가 복잡하게 느껴지는 건 당연합니다. 하지만 핵심은 세 가지 변수만 파악하면 됩니다. 요청 크기가 200K를 넘는지, 실시간이 필요한지, 동일한 시스템 프롬프트를 반복하는지. 이 세 질문에 답하면 어떤 조합이 유리한지 바로 나옵니다. 서비스를 실제로 만들기 전에 예상 토큰량으로 각 시나리오를 계산해보는 습관이 예산 초과를 막는 가장 확실한 방법입니다.

본 포스팅 참고 자료

※ 본 포스팅은 2026년 3월 19일 기준 Anthropic 공식 자료를 바탕으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 특히 API 가격 및 요금 체계는 Anthropic의 정책에 따라 예고 없이 변경될 수 있으므로, 실제 과금 전 반드시 Anthropic 공식 가격 페이지(claude.com/pricing#api)에서 최신 내용을 확인하시기 바랍니다.

AI API 비용 비교, Claude API, Claude Sonnet 4.6, 프롬프트 캐싱, 앤트로픽 API 가격

Claude Sonnet 4.6 API 가격, 실제로 계산해봤습니다

Claude Sonnet 4.6 API 가격, 실제로 계산해봤습니다

$3짜리인데 왜 청구서가 다르게 나올까요?