Claude Opus 4.6 1M 컨텍스트, $5로 끝인지 직접 계산했습니다

Published on

in

Claude Opus 4.6 1M 컨텍스트, 로 끝인지 직접 계산했습니다

2026.03.13 기준
Claude Opus 4.6 · Sonnet 4.6
GA 정식 지원

Claude Opus 4.6 1M 컨텍스트,
$5로 끝인지 직접 계산했습니다

2026년 3월 13일, Anthropic이 조용히 발표를 하나 올렸습니다. Claude Opus 4.6과 Sonnet 4.6의 100만 토큰 컨텍스트 윈도우가 정식 지원(GA)으로 전환됐고, 핵심은 딱 한 줄이었습니다. “장거리 컨텍스트 프리미엄 없이, 표준 가격 그대로.” 이게 얼마나 달라진 건지, 경쟁 모델과 비교하면 어떤지 — 공식 수치를 직접 놓고 따져봤습니다.

Opus 4.6 표준 요금
$5 / $25
입력 / 출력 (100만 토큰당)
Sonnet 4.6 표준 요금
$3 / $15
입력 / 출력 (100만 토큰당)
MRCR v2 정확도
78.3%
1M 토큰 구간, 프론티어 1위

베타 때 얼마였고 지금은 얼마인가요?

Claude Opus 4.6의 1M 컨텍스트 윈도우는 2026년 2월 5일 출시 당시 베타로만 제공됐고, 200K 토큰을 넘는 순간 프리미엄 요금이 붙었습니다. Anthropic 공식 출시 노트에 따르면 당시 1M 구간 요금은 입력 $10/MTok, 출력 $37.50/MTok이었습니다. (출처: Anthropic 공식 블로그 “Introducing Claude Opus 4.6”, 2026.02.05)

그런데 3월 13일, 공식 GA 발표에서 Anthropic은 명확하게 밝혔습니다.

“Standard pricing now applies across the full 1M window for both models, with no long-context premium. There’s no multiplier: a 900K-token request is billed at the same per-token rate as a 9K one.”

— Anthropic 공식 블로그 “1M context window: Now generally available”, 2026.03.13

즉, 900K 토큰짜리 요청과 9K 토큰짜리 요청이 토큰당 같은 요금으로 처리됩니다. 이 문장이 나왔을 때 개발자 커뮤니티가 일제히 반응했던 이유가 있습니다. 경쟁 모델인 GPT-5.4와 Gemini 3.1 Pro는 특정 토큰 수를 넘으면 요금이 올라가는 구조를 유지하고 있기 때문입니다.

시점 Opus 4.6 입력 Opus 4.6 출력 비고
2026.02.05 (베타) $5 (200K 이하)
$10 (200K 초과)
$25 (200K 이하)
$37.50 (200K 초과)
프리미엄 구간 별도
2026.03.13 (GA) $5 (전 구간) $25 (전 구간) 단일 요금

(출처: Anthropic 공식 블로그 2026.02.05 / 2026.03.13)

▲ 목차로 돌아가기

$10/$37.50가 $5/$25가 되면 실제로 얼마 차이인가요?

숫자만 보면 감이 잘 안 올 수 있습니다. 실제 시나리오로 직접 계산해봤습니다. 가령 대형 코드베이스 분석 작업을 가정합니다: 입력 500K 토큰 + 출력 50K 토큰인 요청 하나입니다. 500K는 약 37만 5천 단어 분량이고, 웬만한 중견 기업의 전체 코드 저장소를 통째로 담을 수 있는 양입니다.

💡 공식 발표문과 요금 구조를 같이 놓고 보니 이런 차이가 보였습니다

📌 베타 기간 요금 계산 (입력 500K, 출력 50K)

입력: 200K × $5/M + 300K × $10/M = $1.00 + $3.00 = $4.00

출력: 50K × $37.50/M (200K 초과 세션 전체 프리미엄 적용) = $1.875

합계: $5.875

📌 GA 전환 후 요금 계산 (동일 조건)

입력: 500K × $5/M = $2.50

출력: 50K × $25/M = $1.25

합계: $3.75

절감액: $2.125 → 같은 작업에 약 36% 저렴

이 비율은 입력 토큰이 많을수록, 장거리 구간이 길수록 더 벌어집니다.

단 하나의 API 호출에서 36% 절감이라는 건, 하루에 수백 번 이런 작업을 돌리는 개발팀 기준으로는 월 비용 구조가 완전히 달라지는 수준입니다. 일 200회 호출 기준으로 환산하면 월 약 $12,750 → $8,100으로 줄어드는 계산이 나옵니다. (추정치: 위 단가 기준 200회/일 × 30일)

▲ 목차로 돌아가기

GPT-5.4, Gemini 3.1 Pro랑 장거리에서 비교하면?

Simon Willison의 3월 13일 블로그 포스팅이 이 차이를 정확하게 집었습니다. “OpenAI와 Gemini는 모두 특정 토큰 수를 넘으면 추가 요금을 부과한다. GPT-5.4는 272K, Gemini 3.1 Pro는 200K가 기준점이다.” 반면 Claude Opus 4.6은 이 기준점이 없습니다. (출처: simonwillison.net, 2026.03.13)

모델 기준 입력 요금 장거리 전환점 전환 후 입력 요금
Claude Opus 4.6 $5/M 없음 (전 구간 동일) $5/M (변동 없음)
GPT-5.4 $2.50/M 272K 초과 $5.00/M (2배)
Gemini 3.1 Pro Preview $2/M 200K 초과 $4/M (2배)

(출처: OpenAI 공식 API 가격 페이지 / Google Gemini 공식 가격 / Anthropic 공식 GA 발표, 각 2026.03 기준)

여기서 결정적인 포인트가 하나 더 있습니다. GPT-5.4의 경우, 272K를 단 1토큰이라도 초과하면 세션 전체에 높은 요금이 소급 적용됩니다. 처음 270K에 해당하는 부분도 $2.50이 아닌 $5.00으로 재계산된다는 의미입니다. (출처: apiyi.com, “GPT-5.4 Deep Dive: The 272K Pricing Threshold”, 2026.03.06) 이 구조는 코드베이스나 문서 길이를 예측하기 어려운 실무 환경에서는 상당히 다루기 까다롭습니다.

표면적인 단가만 보면 GPT-5.4($2.50)와 Gemini 3.1 Pro($2/M)가 Claude Opus 4.6($5/M)보다 저렴하게 보입니다. 그러나 500K 토큰 이상 장거리 작업이라면, 두 모델 모두 $5~$5.50/M 수준으로 올라가면서 Opus 4.6과 사실상 같은 가격대에 진입합니다. 이 지점이 바로 실무 개발자들이 GA 발표 직후 가장 먼저 계산기를 꺼낸 이유입니다.

▲ 목차로 돌아가기

1M 토큰을 꽉 채워 쓰면 생기는 문제

요금이 같다고 해서 1M 토큰을 항상 꽉 채우는 게 최적 전략은 아닙니다. Anthropic 공식 엔지니어링 블로그는 이를 “컨텍스트 로트(context rot)”라는 개념으로 직접 설명합니다. 컨텍스트가 길어질수록 모델의 정보 회수 정확도가 떨어지는 현상입니다. (출처: Anthropic Engineering Blog “Effective Context Engineering for AI Agents”, 2026)

Opus 4.6 출시 당시 공개된 MRCR v2 벤치마크 결과를 보면 숫자가 명확합니다. Opus 4.6은 1M 토큰 구간에서 78.3%의 정확도를 기록해 프론티어 모델 중 1위입니다. 그런데 이 78.3%라는 수치는 역으로 읽으면, 약 22%의 요청에서는 정보를 정확히 찾아내지 못한다는 의미이기도 합니다. (출처: Anthropic 공식 GA 발표, “1M context window: Now generally available”, 2026.03.13)

💡 성능 벤치마크와 실제 사용 흐름을 함께 보면 이런 패턴이 나타납니다

모델 1M 구간 정확도 (MRCR v2) 이전 버전 (Sonnet 4.5)
Claude Opus 4.6 78.3% 18.5%

(출처: Anthropic 공식 GA 발표 2026.03.13 / 출시 발표 2026.02.05)

Sonnet 4.5 기준 18.5%에서 78.3%로 올라간 것 자체는 극적인 개선입니다. 다만 GPT-5.4는 이 정확도 문제가 훨씬 가파르게 나타납니다. OpenAI가 공개한 평가 데이터에 따르면 GPT-5.4는 512K~1M 구간에서 정확도가 약 36% 수준으로 급락할 수 있습니다. (출처: apiyi.com, GPT-5.4 Deep Dive, 2026.03.06) 요금이 두 배가 되는 구간에서 정확도가 절반 이하로 떨어진다는 뜻입니다.

Anthropic 엔지니어링 블로그는 이에 대한 해법으로 무작정 컨텍스트를 늘리는 대신 “컨텍스트를 유한한 자원으로 다루는 것”을 권고합니다. 1M 토큰이 사용 가능하다고 해서 반드시 채울 필요는 없으며, 핵심 신호를 담은 최소한의 토큰 조합이 장기적으로 더 안정적인 결과를 냅니다.

▲ 목차로 돌아가기

Claude Code Max 사용자는 어떻게 달라지나요?

API를 직접 호출하지 않는 Claude Code 구독자라면 요금 계산보다 더 직접적인 변화가 있습니다. Anthropic 공식 GA 발표에 따르면, Max·Team·Enterprise 플랜 사용자는 3월 13일부터 Opus 4.6 세션에서 1M 컨텍스트가 자동으로 기본 적용됩니다. 별도 설정 없이 세션이 자동으로 늘어납니다. (출처: Anthropic 공식 GA 발표 “1M context window: Now generally available”, 2026.03.13)

이전까지 Claude Code에서 Opus 4.6로 대형 코드베이스를 다루다 보면 컨텍스트 한계에 도달해 압축(compaction)이 발동되는 경우가 잦았습니다. 실제 사용자 사례를 보면, 한 CPO는 “대용량 PDF나 데이터셋을 로드하자마자 컨텍스트를 압축해야 했는데, 1M 전환 이후 압축 발생 횟수가 15% 감소했다”고 밝혔습니다. (출처: Anthropic 공식 GA 블로그 인용 사례, 2026.03.13)

단, Free·Pro 플랜은 해당 없습니다

1M 컨텍스트 자동 적용은 Max 이상 플랜에만 해당됩니다. Pro 플랜($20/월)의 경우 Opus 4.6 접근은 가능하지만 1M 컨텍스트 자동 기본 적용은 확인이 필요합니다. Anthropic 공식 발표에서는 “Max, Team, Enterprise 사용자”를 명시했습니다. Pro 플랜 구독자라면 API를 통한 직접 호출로는 표준 가격으로 1M 컨텍스트를 활용할 수 있지만, Claude Code 인터페이스 내에서 자동으로 늘어나는 것은 아닐 수 있습니다. (확인 필요: claude.ai 공식 요금제 페이지 참고)

⚠️ 베타 헤더 사용자 주의

기존에 베타 기능을 위해 API 요청에 베타 헤더를 넣어뒀다면, GA 전환 이후에도 코드를 수정할 필요는 없습니다. 헤더가 있어도 무시(ignored)됩니다. (출처: Anthropic 공식 GA 발표 2026.03.13)

▲ 목차로 돌아가기

Q&A

Q. GA 이후에도 200K 이하 요청은 기존과 동일한 요금인가요?
네. GA 전환의 핵심은 “200K 초과 구간의 프리미엄이 사라진 것”입니다. 200K 이하 구간의 단가($5/$25 for Opus 4.6, $3/$15 for Sonnet 4.6)는 2월 5일 출시 이후 변동 없습니다. (출처: Anthropic 공식 GA 발표 2026.03.13)
Q. Sonnet 4.6도 동일한 조건인가요?
네. Opus 4.6과 Sonnet 4.6 모두 1M 컨텍스트가 표준 가격으로 GA 전환됐습니다. Sonnet 4.6은 $3/$15(입력/출력 per MTok)로 전 구간 단일 요금이 적용됩니다. (출처: Anthropic 공식 GA 발표 2026.03.13)
Q. Gemini 3.1 Pro와 비교하면 어느 쪽이 장거리 작업에서 더 저렴한가요?
입력 단가만 보면 Gemini 3.1 Pro($2/M)가 낮지만, 200K 초과 시 $4/M으로 상승합니다. Claude Opus 4.6은 $5/M 단일이지만 출력 단가($25/M)도 동일하게 유지됩니다. 500K 이상의 입력을 많이 다루는 작업이라면 두 모델의 입력 요금 차이는 거의 없어집니다. 정확도 측면에서 Opus 4.6이 MRCR v2 기준 프론티어 1위(78.3%)로 높습니다. 어느 쪽이 유리한지는 작업 특성(입출력 비율)에 따라 달라집니다.
Q. 프롬프트 캐싱은 1M 구간에서도 적용되나요?
Anthropic의 공식 API 가격 페이지에서 캐싱 단가를 확인할 수 있습니다. GA 발표에서 캐싱 관련 별도 예외를 공지하지 않았으므로, 기존 캐싱 정책이 1M 구간에도 동일하게 적용되는 것으로 이해됩니다. 단, 최신 캐싱 요금은 공식 페이지(anthropic.com/pricing)에서 직접 확인을 권장합니다. (확인 필요)
Q. Amazon Bedrock이나 Vertex AI에서도 같은 요금인가요?
Anthropic 공식 GA 발표에 따르면, 1M 컨텍스트는 Claude Platform 네이티브, Amazon Bedrock, Google Vertex AI, Microsoft Foundry에서 모두 지원됩니다. 다만 각 클라우드 제공자의 마크업 정책에 따라 실제 과금 금액은 달라질 수 있으므로, 각 플랫폼의 가격 페이지를 별도로 확인하는 것을 권장합니다. (출처: Anthropic 공식 GA 발표 2026.03.13)

▲ 목차로 돌아가기

마치며

3월 13일 발표의 핵심은 단순합니다. 1M 컨텍스트 전 구간이 표준 가격으로 내려왔고, 비용 예측이 훨씬 쉬워졌습니다. 경쟁 모델들이 특정 토큰 수 이후 요금이 올라가는 구조를 유지하는 상황에서, 이 변화는 장거리 컨텍스트 작업이 많은 개발팀에게는 의미 있는 차이입니다.

다만 두 가지는 기억해두는 게 좋습니다. 첫째, 1M을 꽉 채운다고 해서 반드시 최선의 결과가 나오지는 않습니다. Opus 4.6이 78.3%(MRCR v2)로 프론티어 1위지만, 여전히 약 22%의 요청에서는 정확한 정보 회수가 보장되지 않습니다. 둘째, 1M 컨텍스트 자동 기본 적용은 Max·Team·Enterprise 사용자에게만 해당하며, Pro 플랜 사용자는 별도 확인이 필요합니다.

요금 구조가 단순해졌다는 건 실무 계획을 세우기 더 쉬워졌다는 뜻입니다. 잦은 프리미엄 전환점을 계산하지 않아도 되는 API가 하나 늘었습니다.

▲ 목차로 돌아가기

📚 본 포스팅 참고 자료

  1. Anthropic 공식 블로그 — “1M context window: Now generally available for Claude Opus 4.6 and Sonnet 4.6” (2026.03.13) — claude.com/blog/1m-context-ga
  2. Anthropic 공식 블로그 — “Introducing Claude Opus 4.6” (2026.02.05) — anthropic.com/news/claude-opus-4-6
  3. Anthropic Engineering Blog — “Effective Context Engineering for AI Agents” — anthropic.com/engineering/…
  4. Simon Willison’s Weblog — “1M context is now generally available for Opus 4.6 and Sonnet 4.6” (2026.03.13) — simonwillison.net
  5. apiyi.com — “GPT-5.4 Deep Dive: The 272K Pricing Threshold” (2026.03.06) — help.apiyi.com
  6. OpenAI 공식 API 요금 페이지 — openai.com/api/pricing

⚠️ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 모든 요금 정보는 2026년 3월 13일 기준이며, 최신 정보는 반드시 Anthropic 공식 사이트(anthropic.com/pricing)에서 직접 확인하시기 바랍니다. 본 포스팅은 정보 제공 목적으로 작성됐으며 어떠한 투자·구매 결정도 본 글만을 근거로 내리지 마시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기