2026.03.21 기준 / Claude Code v2.1.75 이상 기준
Claude Code 1M 토큰,
가격 직접 따져봤습니다
2026년 3월 13일, Anthropic이 조용히 꺼낸 카드 하나가 AI 코딩 도구 판을 뒤집었습니다. Claude Code의 1M(100만) 토큰 컨텍스트 윈도우가 베타를 졸업하고 정식 출시(GA)됐습니다. 기대했던 것과 달랐던 건 가격 구조입니다. 비쌀 것 같았는데, 공식 문서를 열어보니 생각이 바뀌었습니다.
1M 컨텍스트 GA가 뜻하는 것 — 달라진 딱 4가지
2026년 3월 13일, Claude Code v2.1.75 업데이트와 함께 1M 컨텍스트 윈도우가 정식 버전으로 전환됐습니다. 공식 발표문(출처: Anthropic 공식 블로그, 2026.03.13)에는 변경 사항이 명확하게 네 가지로 정리돼 있습니다.
공식 발표문과 실제 적용 방식을 같이 놓고 보니 이런 차이가 보였습니다
GA 이전에는 200K를 넘기려면 별도 베타 헤더를 요청에 삽입해야 했고, 그 이상 구간엔 별도 요금이 붙었습니다. 두 제약이 동시에 사라졌는데, 이 두 가지를 별개가 아닌 하나의 세트로 이해하는 사람이 많지 않습니다.
- 단일 단가, 전 구간 동일: 900K 토큰 요청과 9K 요청의 토큰당 단가가 같습니다. (출처: Anthropic 공식 블로그, 2026.03.13)
- 전 구간 표준 처리량: 컨텍스트 길이에 관계없이 계정의 기본 처리량(rate limit)이 그대로 적용됩니다.
- 미디어 한도 6배 확대: 한 요청에 이미지 또는 PDF를 100장에서 600장으로 늘릴 수 있습니다.
- 베타 헤더 불필요: 기존에 헤더를 삽입했던 코드가 있어도 무시되므로 코드 수정이 필요 없습니다.
Claude Code Max, Team, Enterprise 구독자는 별도 설정 없이 Opus 4.6 세션에서 자동으로 1M 컨텍스트가 적용됩니다. 세션이 길어져 컨텍스트가 쌓여도 강제 압축(compaction)이 훨씬 덜 발생하게 됩니다. 실제 사용 데이터에서 compaction 이벤트가 15% 줄었다는 수치가 공식 발표문에 포함돼 있습니다. 즉, 대화 초반에 읽었던 맥락을 세션 내내 유지할 수 있다는 뜻입니다.
가격이 생각보다 단순한 이유
결론부터 말씀드리면, GA 이후 API 요금은 컨텍스트 크기에 따라 달라지지 않습니다. Opus 4.6은 입력 $5, 출력 $25(백만 토큰당). Sonnet 4.6은 입력 $3, 출력 $15(백만 토큰당). GA 이전에는 200K 초과 구간에 이 단가의 2배 요금을 부과했습니다. (출처: Anthropic 공식 블로그, 2026.03.13) 이 구조가 없어졌다는 사실이 실제로 얼마나 의미 있는지 수치로 보겠습니다.
| 모델 | 입력 (표준) | 출력 (표준) | GA 이전 200K+ 요금 | GA 이후 200K+ 요금 |
|---|---|---|---|---|
| Opus 4.6 | $5/MTok | $25/MTok | $10/MTok (2배) | $5/MTok (동일) |
| Sonnet 4.6 | $3/MTok | $15/MTok | $6/MTok (2배) | $3/MTok (동일) |
| Sonnet 4.5 이하 | $3/MTok | $15/MTok | — | $6/MTok (여전히 2배) |
※ 표 내 수치는 Anthropic 공식 가격 문서 기준 (2026.03 기준) / MTok = 백만 토큰
마지막 행이 핵심입니다. Sonnet 4.5와 구형 Sonnet 4 모델은 이번 GA에 포함되지 않았습니다. 200K를 넘기면 여전히 2배 요금이 붙습니다. 대용량 컨텍스트 작업에서 비용을 아끼려면 반드시 Opus 4.6 또는 Sonnet 4.6으로 모델을 지정해야 합니다. 기존 코드나 설정에서 model 값이 claude-sonnet-4-5 또는 claude-sonnet-4로 고정돼 있다면, 이번 GA의 혜택이 자동으로 적용되지 않습니다.
Pro 구독자가 조심해야 할 조건
1M 컨텍스트 GA 발표를 보고 “$20 Pro 플랜에서도 바로 쓸 수 있겠다”고 생각했다면, 공식 문서를 한 번 더 확인할 필요가 있습니다. 구독 플랜별로 1M 컨텍스트 접근 방식이 다릅니다.
💡 공식 문서 원문과 실제 구독 조건을 대조해보니 차이가 있었습니다
Anthropic 공식 문서(code.claude.com/docs)에는 “API 및 종량제 사용자는 1M 컨텍스트에 완전히 접근 가능. Pro, Max, Team, Enterprise 구독자는 추가 사용(extra usage)이 활성화된 경우에 가능하다”고 명시돼 있습니다.
구체적으로 정리하면 이렇습니다. Max, Team Premium, Enterprise는 Opus 4.6 세션에서 1M 컨텍스트가 기본값으로 자동 적용됩니다. 추가 비용이 구독료에 포함돼 있습니다. Pro 구독자는 세션이 200K 토큰을 넘기는 시점부터 ‘추가 사용’ 요금이 발생합니다. 즉, 월 $20 정액 안에 포함되지 않습니다. API 종량제 사용자는 GA 즉시 전 구간 동일 단가로 사용 가능합니다.
Pro 구독자가 `/model opus[1m]`을 입력해 시도할 수 있으나, 계정 설정에서 extra usage가 활성화돼 있지 않으면 “The long context beta is not yet available for this subscription” 오류가 뜹니다. 이 오류는 기능 미출시가 아니라 구독 등급 제한을 의미합니다. Reddit r/ClaudeCode 커뮤니티에서 $200/월 Max 20x 구독자도 동일 오류를 겪었다는 게시물이 있었으나, 이는 GA 이전(2026.02) 상황이며 현재는 Max 등급에서 정상 적용됩니다. Pro 플랜은 공식 답변이 별도로 나와 있지 않습니다.
실제 비용은 표시 가격의 10분의 1일 수 있습니다
공식 API 요금을 보고 “Opus 4.6 쓰면 감당 안 되겠다”고 넘겨짚기 쉬운 부분이 있습니다. Anthropic이 공개한 공식 비용 관리 문서(출처: code.claude.com/docs/en/costs, 2026.03 기준)에 따르면, 대량 사용 Claude Code 세션에서 소비되는 토큰의 90% 이상이 캐시 읽기(cache read)입니다. 표시 가격이 중요한 게 아닙니다.
캐시 읽기 단가 비교 — 직접 계산해보면
Sonnet 4.6 표준 입력 단가: $3/MTok
Sonnet 4.6 캐시 읽기 단가: $0.30/MTok (출처: Anthropic 공식 가격 문서, 2026.03)
세션 토큰 소비의 90%가 캐시 읽기라면, 실효 평균 단가는
= 0.9 × $0.30 + 0.1 × $3.00 = $0.27 + $0.30 = $0.57/MTok
표시 가격($3)의 약 19% 수준입니다. 캐시가 잘 걸리는 장기 세션일수록 실제 비용은 더 줄어듭니다.
Anthropic 공식 문서에는 평균 Claude Code 개발자가 하루 약 $6(API 환산 기준)을 소비한다고 나와 있고, 90%는 하루 $12 미만입니다. 월 $20 Pro 구독자가 API 환산 기준으로 약 $180 상당의 사용량을 정액으로 처리하고 있다는 뜻입니다. 이 구조가 유지되는 이유가 캐싱 덕분입니다. 단, 세션을 자주 초기화하거나 매번 새로운 코드베이스를 불러오는 방식이면 캐시 히트율이 낮아져 실효 비용이 올라갑니다.
경쟁 도구와 비교하면 보이는 것
1M 컨텍스트라는 숫자 자체가 새로운 건 아닙니다. 이미 Gemini 1.5 시리즈가 오래전에 1M 컨텍스트를 지원했고, Claude 자체도 API에서는 지원했습니다. 차이는 코딩 에이전트 환경에서 표준 단가로 실제 사용 가능하다는 점입니다.
| 도구 | 최대 컨텍스트 | 장문 프리미엄 | 장문 정확도 |
|---|---|---|---|
| Claude Code (Opus 4.6) | 1M 토큰 | 없음 | MRCR v2 78.3% |
| GitHub Copilot (Opus 4.6) | 약 200K 토큰 | 해당 없음 | 별도 공개 없음 |
| Cursor (Claude 백엔드) | 200K 수준 | 플랜별 상이 | 별도 공개 없음 |
| Gemini (Vertex AI) | 1M 토큰 | 일부 적용 | MRCR v2 미공개 |
※ GitHub Copilot, Cursor 수치는 2026.03 기준 커뮤니티 보고값 / 공식 수치 아님
여기서 MRCR v2(Multi-Round Coreference Resolution) 수치가 중요합니다. 1M 토큰을 넣을 수 있는 것과, 넣은 내용을 모델이 제대로 기억하고 추론할 수 있는 것은 다른 문제입니다. Opus 4.6의 78.3%는 “긴 컨텍스트를 실제로 활용하는 능력”이 수치로 증명된 것입니다. (출처: Anthropic 공식 블로그, 2026.03.13) 같은 조건에서 다른 모델의 공개된 비교 수치가 없어 직접 비교는 어렵지만, Anthropic이 이 수치를 공식 발표에서 전면에 내세운 이유가 있습니다.
음성 모드·/loop·–bare까지 — 같은 달 쏟아진 것들
3월 13일 1M GA 하나만 나온 게 아닙니다. 3월 4일부터 20일까지 Claude Code가 14회 업데이트됐습니다. 400건 이상의 변경 사항 중 실무에서 체감 차이가 큰 것들을 골라보면 이렇습니다.
💡 릴리즈 노트를 버전별로 나열하다 보니 흐름이 보였습니다
Opus 4.6 기본 전환(3/4) → 자동화 명령어(/loop, 크론, 3/7) → 1M GA(3/13) → 출력 토큰 확대(3/17) → VSCode 연동(3/18) → 경량 실행 모드(3/20). 단순 기능 추가가 아니라 “모델이 혼자 더 오래, 더 넓게 작업할 수 있도록” 방향을 잡고 있습니다.
- 음성 모드 (Push-to-Talk): 20개 언어를 지원하며 한국어 포함. 코드 리뷰 중 수정 사항을 구두로 전달하거나, 아이디어를 빠르게 프로토타입할 때 유용합니다.
- /loop + 크론 스케줄링 (v2.1.71): 주기적 작업을 Claude Code가 스스로 실행합니다. 정해진 시간마다 코드 품질 검사나 테스트 스위트를 돌리는 것이 가능해졌습니다.
- 출력 토큰 확대 (v2.1.77): 기본 64K, 최대 128K 토큰. 긴 파일을 한 번의 턴에서 완성하거나 대규모 리팩토링 결과를 잘림 없이 받을 수 있습니다.
- –bare 플래그 (v2.1.81): CI/CD 파이프라인이나 쉘 스크립트에서 Claude Code를 호출할 때 UI 없이 입출력만 처리하는 경량 실행 모드입니다.
- VSCode /remote-control (v2.1.79): 에디터에서 Claude Code 세션을 직접 제어합니다. IDE를 떠나지 않는 워크플로우가 가능해졌습니다.
macOS 응답 속도가 60ms 단축됐고, –resume 재개 속도가 45% 향상됐습니다. 대형 레포 처리 시 메모리도 80MB 절감됩니다. (출처: dev.to Claude Code 3월 업데이트 정리, 2026.03.21) 이 수치들이 체감으로 이어지려면 실제 대형 프로젝트에서 확인이 필요하지만, 수치 자체는 공개돼 있습니다.
Q&A 5가지
Q1. Pro 구독자가 1M 컨텍스트를 쓰면 요금이 얼마나 나올까요?
200K 토큰을 넘기는 순간부터 ‘추가 사용(extra usage)’ 과금이 시작됩니다. 단, 이 구간도 표준 API 단가인 Opus 4.6 기준 $5/입력 MTok, $25/출력 MTok이 적용됩니다. 구독 정액 안에서 200K까지는 무제한, 초과분은 API 요금으로 추가 청구되는 구조입니다. 자주 200K를 넘긴다면 Max 플랜이 합리적입니다.
Q2. 1M 컨텍스트를 쓰면 속도가 느려지지 않나요?
대용량 컨텍스트를 처음 로딩할 때는 분명히 지연이 있습니다. 다만 GA 발표문에는 “전 구간 표준 처리량이 적용된다”고 명시돼 있어, 처리량 제한 측면에서는 200K 세션과 동일합니다. 일부 사용자는 컨텍스트가 600K를 넘으면 정확도가 떨어진다는 의견을 냈습니다. 이 부분은 Anthropic이 공식 답변을 내놓지 않은 부분입니다.
Q3. 기존 코드에 베타 헤더가 있는데 제거해야 하나요?
제거하지 않아도 됩니다. 공식 발표문 기준으로 베타 헤더가 있어도 무시됩니다. 코드 변경 없이 GA 혜택이 자동 적용됩니다. 단, 사용 중인 모델이 Opus 4.6 또는 Sonnet 4.6인지 확인하세요. 구형 모델을 쓰고 있다면 장문 프리미엄이 여전히 적용됩니다.
Q4. /loop과 크론은 토큰을 많이 소비하지 않나요?
반복 실행 주기와 각 실행에서 소비하는 토큰 양에 따라 다릅니다. /loop 자체에 플랜 제한은 없지만, 반복 실행마다 토큰이 소비됩니다. 비용 관리를 위해 Haiku 4.5 모델을 서브에이전트로 지정하면 같은 작업을 Opus 4.6 대비 1/5 비용으로 처리할 수 있습니다.
Q5. AWS Bedrock이나 Vertex AI에서도 동일한 가격인가요?
1M 컨텍스트는 Claude Platform, AWS Bedrock, Vertex AI, Microsoft Foundry에서 모두 사용 가능합니다. 단, Bedrock과 Vertex AI는 리전별 엔드포인트 사용 시 10% 추가 요금이 붙을 수 있습니다. 데이터 거주 요건(data residency)이 중요하다면 이 부분을 비용 계산에 반영해야 합니다.
마치며 — 총평
1M 컨텍스트 GA를 한 줄로 요약하면 “쓸 수 있게 됐다”가 아니라 “쓸 이유가 생겼다”입니다. 기존엔 큰 컨텍스트를 쓸수록 요금이 배로 늘었고, 베타 헤더라는 번거로움도 있었습니다. 두 가지가 동시에 해소됐습니다.
솔직히 말하면 Pro 구독자에게는 아직 반쪽짜리입니다. 200K 이상을 자주 쓰는 실무 개발자라면 Max로 갈 이유가 생겼고, API 종량제 사용자라면 지금 당장 모델을 Opus 4.6 또는 Sonnet 4.6으로 업데이트할 이유가 충분합니다. 이 두 모델만 장문 프리미엄이 폐지됐기 때문입니다.
음성 모드, /loop, 출력 128K 확대, VSCode 연동까지 3월에 한꺼번에 쏟아졌습니다. 기능 하나하나가 완성된 제품이라기보다 빠르게 쌓아가는 과정처럼 느껴집니다. 이 부분이 좀 아쉬웠습니다. 속도는 빠른데, 안정성을 검증할 시간이 부족한 것이 아닌가 싶습니다. 그래도 1M 컨텍스트 표준 단가 적용이라는 이번 변화는 실무에서 체감 가능한 방향입니다.
본 포스팅 참고 자료
- Anthropic 공식 블로그 — 1M Context GA 발표 (https://claude.com/blog/1m-context-ga) 2026.03.13
- Anthropic Claude Code 공식 문서 (https://docs.anthropic.com/en/docs/claude-code)
- Claude Code 비용 관리 공식 문서 (https://code.claude.com/docs/en/costs)
- Claude Code 3월 업데이트 정리 (dev.to, 정상록, 2026.03.21)
- Reddit r/ClaudeCode — 1M 컨텍스트 접근 조건 논의 스레드
본 포스팅은 2026년 3월 21일 기준 공개된 자료를 바탕으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 요금 및 플랜 관련 최신 정보는 Anthropic 공식 사이트에서 직접 확인하시기 바랍니다.
URL slug 권장: claude-code-1m-context-pricing-guide


댓글 남기기