Claude API 1M 토큰, 수치 3개로 직접 확인했습니다

Published on

in

Claude API 1M 토큰, 수치 3개로 직접 확인했습니다
2026.03.26 기준 / Anthropic 공식 가격 페이지 기준

Claude API 1M 토큰, 수치 3개로 직접 확인했습니다

“1M 토큰도 표준 가격”이라는 설명이 돌아다니고 있는데, 막상 공식 가격 페이지를 열어보면 이야기가 달라집니다.
Sonnet 4.6 기준 200K 초과 요청은 $3이 아니라 $6입니다.
수치 3개로 정확히 어디서 가격이 바뀌는지 짚어봤습니다.

$3→$6
Sonnet 4.6
200K 초과 할증
90%
프롬프트 캐싱
절감 최대치
50%
Batch API
기본 할인율

“1M 토큰 표준 가격” — 공식 페이지가 말하는 실제 조건

Claude API 1M 토큰 컨텍스트 관련 글이 최근 여러 개 나왔는데, 상당수가 “Opus 4.6과 Sonnet 4.6은 1M 토큰도 표준 가격”이라고 정리합니다. 저도 처음엔 그렇게 읽었습니다. 그런데 공식 가격 페이지(anthropic.com/api)를 직접 열어보니 이야기가 조금 달랐습니다.

💡 공식 발표 문구와 실제 과금 테이블을 나란히 놓고 보니 이런 차이가 보였습니다: Anthropic은 “200K까지 표준 가격, 그 이상은 장문 컨텍스트 가격”이라는 구조를 유지하면서 장문 컨텍스트 범위를 1M까지 확장한 것입니다. “할증 폐지”가 아니라 “할증 구간을 열어뒀다”는 쪽이 더 정확합니다.

Claude API 1M 토큰 가격을 실제로 쓸 때 영향을 주는 포인트는 세 개입니다. 200K 초과 시 입력 요금 2배 할증, 프롬프트 캐싱으로 캐시 읽기 90% 절감, Batch API 50% 할인 — 이 세 가지를 순서대로 짚어봤습니다.

▲ 목차로 돌아가기

200K를 넘는 순간 요금이 달라지는 구조

공식 가격 페이지 기준으로 Sonnet 4.6과 Opus 4.6의 실제 요금 구조는 아래와 같습니다 (출처: Anthropic 공식 가격 페이지, 2026.03.26 기준).

모델 200K 이하 입력 200K 초과 입력 출력 (공통)
Sonnet 4.6 $3 / MTok $6 / MTok $15~$22.50 / MTok
Opus 4.6 $5 / MTok $10 / MTok $25~$37.50 / MTok
Haiku 4.5 $1 / MTok 할증 없음 $5 / MTok

※ MTok = 백만 토큰 / 출처: anthropic.com/api, 2026.03.26 기준

결정적인 부분은 이겁니다. 200K를 1토큰이라도 넘기면 해당 요청 전체가 장문 컨텍스트 단가로 청구됩니다. 199K짜리 요청은 $3/MTok, 201K짜리 요청은 전체가 $6/MTok — 201번째 토큰부터만 비싸게 적용되는 게 아닙니다. 한 요청 안에서 입력 토큰이 임계값을 넘는 순간 전부 비싸집니다. (출처: Anthropic API 공식 페이지, 2026.03.26)

👉 프롬프트가 딱 경계선에 걸리는 경우, 200K 이하로 잘라 두 번 보내는 게 실제로 더 쌉니다.

▲ 목차로 돌아가기

프롬프트 캐싱으로 90% 아끼는 게 현실적인 조건

Anthropic 공식 문서에 캐싱 읽기 비용이 딱 이렇게 나옵니다: 표준 입력 단가의 10%, 즉 90% 절감. Sonnet 4.6 기준 200K 이하 구간은 $0.30/MTok, 200K 초과 구간은 $0.60/MTok이 됩니다. (출처: Anthropic 공식 가격 페이지, 2026.03.26)

90% 절감이라는 수치만 보면 매력적인데, 실제로는 전제 조건이 있습니다. 캐시를 최초로 쓸 때는 쓰기 비용(Write)이 발생합니다. 5분 캐시 기준으로 표준 입력 단가의 1.25배, 1시간 캐시는 2배입니다. 캐시 히트가 2번 이상 있어야 5분 캐시는 본전이고, 8번 이상이어야 1시간 캐시가 이득입니다.

📊 직접 계산해보면 이렇습니다

200K 토큰짜리 문서를 Sonnet 4.6으로 시간당 100회 반복 조회한다고 가정합니다.
캐싱 없이: 100회 × 200K × $3/MTok = $60/시간
1시간 캐싱: 캐시 쓰기 1회 ($6/MTok) + 캐시 읽기 99회 ($0.30/MTok)
= $1.20 + $5.94 = $7.14/시간 → 88% 절감
매 시간 첫 요청의 2배 비용이 들지만, 나머지 99번은 거의 공짜 수준입니다.

단, 캐싱이 효과를 발휘하려면 동일한 컨텍스트를 짧은 시간 내에 반복 사용하는 구조여야 합니다. 각기 다른 문서를 한 번씩 처리하는 파이프라인에서는 캐시 히트 자체가 일어나지 않으므로 쓰기 비용만 추가로 발생합니다.

▲ 목차로 돌아가기

Batch API와 캐싱을 같이 쓰면 실제 비용이 어떻게 바뀌나

Batch API는 비동기 처리를 수락하는 대신 입력·출력 모두 50% 할인을 줍니다. 24시간 이내 처리가 보장되지만 실시간 응답은 없습니다. Sonnet 4.6 기준 배치 처리 단가는 $1.50/$7.50 (입력/출력)입니다. (출처: Anthropic 공식 가격 페이지, 2026.03.26)

배치와 캐싱을 동시에 적용하면 절감 효과가 쌓입니다. 공식 문서에 따르면 두 기능은 중첩 적용이 가능합니다. Sonnet 4.6으로 200K 문서를 100개씩 배치 처리하면서 동일 문서를 반복 분석하는 시나리오를 계산해봤습니다.

방식 입력 단가 (Sonnet 4.6) 출력 단가
기본 (200K 이하) $3.00 / MTok $15.00 / MTok
Batch API만 $1.50 / MTok $7.50 / MTok
캐싱 읽기만 (5분) $0.30 / MTok $15.00 / MTok
Batch + 캐싱 읽기 $0.15 / MTok $7.50 / MTok

※ 캐싱 읽기는 5분 TTL 기준, 입력만 적용됨 / 출처: anthropic.com/api, 2026.03.26 기준

입력 기준으로 기본 대비 95% 절감이 가능합니다. 실시간성이 필요 없는 대규모 문서 분석 파이프라인이라면 이 조합이 가장 저렴합니다. 단, 출력 토큰에는 캐싱 효과가 없습니다. 출력이 많은 작업에서는 배치 50% 할인만 적용되므로 입력 절감률과 헷갈리지 않도록 주의가 필요합니다.

▲ 목차로 돌아가기

Extended Thinking 켜면 출력 토큰이 예상보다 훨씬 많아지는 이유

Extended Thinking(확장 사고) 기능은 별도 요금제가 아닙니다. 사고 과정에서 발생하는 토큰이 전부 출력 토큰으로 청구됩니다. 즉 모델이 “생각”하는 동안 쓴 토큰도 같은 출력 단가로 과금됩니다. (출처: Anthropic API 공식 페이지, 2026.03.26)

💡 Extended Thinking이 “무료로 더 잘 생각해준다”고 알고 있다면 실제 청구서가 낯설게 느껴질 수 있습니다. Sonnet 4.6 기준 복잡한 코딩 작업 한 번에 사고 토큰 8,000개가 추가로 붙으면 $0.12가 더 나옵니다. 단순 작업에 Extended Thinking을 켜두면 오히려 비용이 올라갑니다.

공식 권장 사항은 사고 토큰 예산(thinking budget)을 최솟값인 1,024 토큰에서 시작해 점진적으로 늘리라는 겁니다. 예산은 목표치이지 강제 상한이 아니라서, 복잡한 요청에서는 설정값보다 실제 사용량이 더 나오기도 합니다. 고정 예산이 아닌 변동 비용으로 관리하는 것이 현실적입니다.

▲ 목차로 돌아가기

Claude Code 오프피크 2배 프로모션 — 주간 한도와 별개입니다

Anthropic은 2026년 3월 13일부터 27일까지 모든 요금제(무료·Pro·Max·Team)에서 미국 동부시간(ET) 오전 8시~오후 2시 이외의 시간대와 주말 전 시간에 사용량 한도를 2배로 늘리는 프로모션을 운영했습니다. (출처: Anthropic 공식 Claude 도움말, 2026.03.13)

여기서 알려진 것과 다른 부분이 하나 있습니다. 오프피크 보너스 사용량은 기존 주간 한도에서 차감되지 않습니다. 주간 한도를 이미 다 쓴 상태여도, 오프피크 시간대에는 보너스 할당량이 별도로 주어집니다. 주간 한도를 100% 소진한 뒤 밤에 추가로 쓸 수 있다는 뜻입니다.

🕒 오프피크 기준 (ET 기준, 한국시간 기준으로 환산)

한국시간 기준: 밤 9시(21:00) ~ 다음날 새벽 3시(03:00) = 오프피크 구간
주말은 하루 종일 2배 적용
보너스 사용량은 주간 한도 소진 여부와 무관하게 독립 적용

이 프로모션이 눈에 띄는 이유는 단순한 혜택 때문만이 아닙니다. Anthropic 입장에서 보면 야간·주말에 놀고 있는 GPU 서버 용량을 사용자 경험에 투자한 겁니다. 항공권의 비성수기 특가, 전력의 심야 요금제와 같은 논리입니다. GPU가 유휴 상태인 시간대를 채우는 대신 사용자 락인(lock-in) 효과를 얻는 구조라는 걸 알고 쓰면 이 프로모션이 더 선명하게 보입니다.

▲ 목차로 돌아가기

자주 나오는 질문 5가지

Q1. Sonnet 4.6이 1M 토큰을 표준 가격으로 지원한다고 하는데, 공식 페이지에는 할증이 있네요. 어떻게 된 건가요?

2026.03.26 기준 공식 가격 페이지를 확인하면 Sonnet 4.6은 200K 이하 $3, 200K 초과 $6의 이단 구조를 유지하고 있습니다. “1M 지원”은 기술적 지원 범위 확대를 의미하고, “표준 가격”이라는 설명은 일부 써드파티 자료에서 발생한 오해입니다. Anthropic이 공식 답변을 별도로 내놓지 않은 부분이라 현재로선 공식 페이지 수치가 기준입니다.

Q2. 프롬프트 캐싱은 언제 쓰는 게 효과적인가요?

동일한 대용량 컨텍스트(문서·코드베이스·시스템 프롬프트)를 5분 이내에 2회 이상 반복 사용하는 구조일 때 효과적입니다. 매번 다른 문서를 단 1회씩 처리하는 작업에는 쓰기 비용만 추가되므로 역효과입니다.

Q3. Batch API를 쓰면 결과가 느리게 오나요?

공식 기준으로는 24시간 이내 처리를 보장합니다. 실제로는 대부분 수 시간 내에 완료되는 경우가 많지만, 실시간 응답이 필요한 사용자 대화 시스템에는 적합하지 않습니다. 야간 문서 처리, 대규모 데이터 변환, 비동기 분석 파이프라인에 적합합니다.

Q4. Extended Thinking을 켰을 때 추가 비용을 미리 예측하기 어렵나요?

맞습니다. 사고 예산(thinking budget)은 목표치일 뿐 강제 상한이 아닙니다. 요청의 복잡도에 따라 실제 사용 토큰이 달라지므로, 고정 비용 구조가 아닙니다. Anthropic 권장 방식은 1,024 토큰부터 시작해 점진적으로 늘리면서 결과 품질과 비용 트레이드오프를 측정하는 겁니다.

Q5. Claude Code 오프피크 프로모션이 3월 27일 이후에도 이어지나요?

공식 안내 기준으로는 2026년 3월 13일~27일이 프로모션 기간입니다. 이후 연장 여부는 Anthropic이 공식적으로 발표한 내용이 없습니다. 다만 Anthropic이 야간 GPU 유휴 용량을 활용하는 구조 자체는 이번에 처음 도입된 것이 아니므로, 비슷한 형태의 프로모션이 반복될 가능성을 배제하기 어렵습니다.

▲ 목차로 돌아가기

마치며

Claude API 1M 토큰 관련 정보가 많아졌는데, 서로 다른 내용이 섞여 있는 상황입니다. 써드파티 분석 자료는 “1M 표준 가격”이라고 하고, 공식 페이지에는 여전히 200K 이상 2배 할증이 명시돼 있습니다. 정책 변경이 이뤄졌다면 공식 문서에 반영되는 게 맞고, 현재로선 공식 페이지 수치가 기준입니다.

비용 최적화는 방향이 명확합니다. 반복성이 높은 작업에는 캐싱, 실시간성이 낮은 작업에는 배치, 두 가지를 중첩하면 입력 비용의 95% 절감도 현실적입니다. Extended Thinking은 단순 작업엔 오히려 비용 상승 요인이므로, 복잡도가 높을 때만 선택적으로 활성화하는 게 맞습니다.

Anthropic이 가격 구조를 자주 업데이트하는 만큼, 프로젝트 시작 전 공식 가격 페이지를 직접 확인하는 습관이 필요합니다. 이 글도 예외가 아닙니다.

▲ 목차로 돌아가기

📚 본 포스팅 참고 자료


  1. Anthropic 공식 API 가격 페이지 (2026.03.26 기준)

  2. Anthropic 공식 도움말 — Claude 2026년 3월 사용량 프로모션 (2026.03.13)

  3. MetaCTO — Claude API Pricing 2026: Full Anthropic Cost Breakdown (2026.03 업데이트)

  4. William Couturier — Claude Code in March 2026: The Economics of the Quota (2026.03.15)

⚠️ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Anthropic은 API 가격 구조를 사전 공지 없이 업데이트하는 경우가 있으므로, 프로젝트 적용 전 반드시 공식 가격 페이지(anthropic.com/api)를 직접 확인하시기 바랍니다. 본 글의 수치는 2026년 3월 26일 공식 페이지 기준이며, 이후 변경된 내용을 반영하지 않을 수 있습니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기