Claude Code 최신 문서 기준
TECH
Claude Code 1M 컨텍스트,
켜는 법보다 켜면 안 되는 조건이 있습니다
1M 컨텍스트 윈도우, 이미 모두가 쓸 수 있습니다. 문제는 200K 토큰을 1개라도 넘는 순간 그 이전 토큰까지 포함해 전체 요금이 2배로 바뀐다는 점입니다. 켜는 명령어보다 언제 쓰면 손해인지를 먼저 봐야 합니다.
1M 컨텍스트, 이미 누구나 쓸 수 있습니다 — 단 조건이 있습니다
결론부터 말씀드리면, Claude Code에서 1M 컨텍스트 윈도우를 선택하는 것 자체는 추가 비용이 0원입니다. 명령어 하나면 됩니다.
Claude Code에서 1M 활성화하는 법
/model opus[1m]
/model sonnet[1m]
/model claude-opus-4-6[1m]
(출처: Claude Code 공식 문서 model-config, code.claude.com)
2026년 3월 13일 이전까지는 1M 컨텍스트 자체가 베타였고 API 티어 4 조직에게만 열려 있었습니다. 그런데 3월 13일 Anthropic이 공식 릴리스 노트를 통해 “베타 헤더 없이 표준 가격으로 일반 제공” 상태로 전환했습니다. (출처: Anthropic 공식 릴리스 노트, 2026.03.13)
문제는 “쓸 수 있다”와 “써도 된다”가 다르다는 점입니다. 컨텍스트 크기에 따라 요금 구조가 완전히 달라지는 절벽이 있고, 플랜별로 실제 접근 조건도 다릅니다. 이 두 가지를 먼저 확인하지 않으면 예상치 못한 청구서가 나올 수 있습니다.
요금 구조가 선형이 아닙니다 — 200K 한 줄 넘으면 전부 바뀝니다
많은 분이 “1M 컨텍스트를 쓰면 토큰이 많아진 만큼 요금이 더 나온다”고 생각합니다. 실제로는 다릅니다. 200K 입력 토큰을 1개라도 초과하는 순간, 이전 토큰 전체가 프리미엄 요금으로 다시 계산됩니다.
⚠️ 200K 절벽 실계산 — 직접 따라해 볼 수 있습니다
201,000 토큰 (Opus 4.6): 201,000 × $10.00/M = $2.010
단 2,000 토큰 차이로 추가되는 비용: $1.015
이 2,000 토큰의 실효 단가: $507.50/M — 표준 단가의 약 101배
(출처: Claude Code Camp 실측, claudecodecamp.com, 2026.03.13 업데이트 기준)
즉, 199K에서 멈추면 $0.995인데 201K로 넘어가면 $2.010입니다. 단 2천 토큰 차이에서 비용이 두 배 이상으로 뜁니다. 한국어로 환산하면 200K 직전과 직후의 체감 단가 차이가 약 100배에 달합니다.
프리미엄 구간 요금표를 직접 확인하면 이렇습니다.
| 항목 | 표준 (200K 이하) | 장문 컨텍스트 (200K 초과) | 배율 |
|---|---|---|---|
| Opus 4.6 입력 | $5.00/M | $10.00/M | ×2 |
| Opus 4.6 출력 | $25.00/M | $37.50/M | ×1.5 |
| Sonnet 4.6 입력 | $3.00/M | $6.00/M | ×2 |
| Sonnet 4.6 출력 | $15.00/M | $22.50/M | ×1.5 |
| Opus 캐시 읽기 | $0.50/M | $1.00/M | ×2 |
| Opus 캐시 쓰기 | $6.25/M | $12.50/M | ×2 |
(출처: Anthropic 공식 Pricing 문서, platform.claude.com, 2026.03.13 기준 / 캐시 90% 할인은 장문 구간에도 적용되지만 기준 단가 자체가 올라감)
💡 공식 문서와 실제 청구 흐름을 함께 놓고 보니 이런 패턴이 보였습니다 — 캐시를 열심히 관리해도 200K를 넘는 순간 캐시 읽기 단가 자체도 2배가 됩니다. “캐시로 아낀다”는 전략이 장문 구간에서는 절반밖에 효과가 없습니다.
플랜별 접근 조건: Max는 되고 Pro는 조건부입니다
1M 모델을 선택할 수 있다고 해서 모든 플랜에서 같은 방식으로 작동하지는 않습니다. Anthropic 공식 문서에 나오는 플랜별 접근 매트릭스를 보면 바로 보입니다.
| 플랜 | 1M Opus 4.6 | 1M Sonnet 4.6 | 비고 |
|---|---|---|---|
| Max / Team Enterprise | ✅ 기본 포함 | Extra usage | Opus는 구독 포함, Sonnet 1M은 추가 사용량 청구 |
| Pro ($20/월) | Extra usage | Extra usage | 200K 초과분은 API 요율로 추가 청구 |
| API (종량제) | ✅ 전면 접근 | ✅ 전면 접근 | 200K 초과 분은 장문 가격 적용 |
(출처: Claude Code 공식 문서 model-config Extended Context 섹션, code.claude.com / Anthropic Support, 2026.03.13 기준)
여기서 놓치기 쉬운 지점이 있습니다. Max 플랜에서 Opus 1M은 기본 구독에 포함됩니다만, Sonnet 1M은 아닙니다. 오히려 Sonnet을 1M으로 쓰려고 하면 Extra usage 과금이 붙습니다. 비싼 플랜을 쓰면서 더 가벼운 모델을 1M으로 쓰는 게 비용적으로 불리한 구조입니다.
Pro 사용자의 경우에는 조건이 다릅니다. Extra usage를 먼저 Settings에서 활성화해야 하고, 200K를 넘는 구간부터 API 요율로 추가 과금이 발생합니다. (출처: Anthropic Support — Extra usage for paid Claude plans, 2026.03.31 기준)
💡 발표문 기준과 실제 요금 흐름을 같이 놓고 보니 이게 보였습니다 — Max에서 “Opus 1M이 무료”라고 이해하는 분이 많은데, 정확히는 “200K 이하에서만 구독 포함”입니다. 세션이 길어져 200K를 넘는 순간부터 Max 구독자도 Extra usage 요금이 붙기 시작합니다.
Sonnet을 1M으로 쓰면 안 되는 이유가 수치로 나옵니다
“1M이 됐으니 Sonnet도 긴 컨텍스트에서 잘 쓸 수 있겠다”고 생각하면 이 데이터를 먼저 봐야 합니다. 모델이 컨텍스트 윈도우를 지원하는 것과 그 안의 내용을 실제로 제대로 활용하는 것은 다른 문제입니다.
MRCR 벤치마크 — 긴 컨텍스트 내 정보 회수율
MRCR(Multi-Round Coreference Resolution)은 긴 컨텍스트 안에 숨긴 특정 정보를 모델이 얼마나 정확하게 찾아내는지를 측정합니다.
| 모델 | 256K 회수율 | 1M 회수율 |
|---|---|---|
| Opus 4.6 | 93% | 76% |
| Sonnet 4.5 | 미공개 | 18.5% |
| Gemini 3 Pro | 미공개 | 26.3% |
(출처: Anthropic 공식 MRCR 벤치마크, Claude Code Camp 실측 보고서, claudecodecamp.com, 2026.03.13 기준 / Sonnet 4.6 MRCR 점수는 2026.03.31 기준 Anthropic이 공식 수치를 발표하지 않은 상태)
Sonnet 4.5 기준 1M 회수율이 18.5%라는 것은, 100만 토큰짜리 문서에 숨겨 놓은 정보를 10번 물으면 2번도 못 찾는다는 뜻입니다. 프리미엄 요금을 내면서 정작 원하는 정보를 8번은 놓치는 셈입니다.
Sonnet 4.6의 1M 회수율은 Anthropic이 아직 공식 수치를 내놓지 않았습니다. 4.5보다 좋아졌을 가능성은 있지만, 공식 수치 없이 1M Sonnet을 신뢰하고 쓰는 건 근거 없는 베팅입니다. 긴 컨텍스트 작업에서 정밀도가 중요한 상황이라면 Opus 4.6을 쓰는 게 맞습니다.
💡 실측 데이터와 공식 벤치마크를 같이 보니 이게 정리됐습니다 — 400K 컨텍스트 실측에서 Opus 4.6은 25%·50%·75% 위치 모두 정확하게 회수했지만, Sonnet 4.6은 200K 이상에서 이미 부분 실패가 나타났습니다. “컨텍스트를 지원한다”와 “컨텍스트를 잘 쓴다”는 완전히 다른 얘기입니다.
실제로 1M이 필요한 상황과 필요 없는 상황
Claude Code Camp의 실측 데이터에 따르면, 대부분의 일반 Claude Code 세션은 최대 컨텍스트 사용량이 80~120K에서 끝납니다. 200K에는 아예 도달하지 않습니다. 즉, 평범한 코딩 세션에서 `/model opus[1m]`을 선택해도 비용은 표준 요율 그대로이고 실질적 차이가 없습니다.
1M이 실제로 도움이 되는 상황
- 대형 코드베이스 단일 요청 분석 — 전체 레포지토리를 한 번에 넣고 한 번에 답을 받을 때. 멀티턴 대화가 없어 컨텍스트 손상이 거의 없습니다.
- 300페이지 이상 계약서·정책 문서 전체 참조 — 특정 조항을 정확히 인용해야 할 때 청킹(분할) 없이 전문을 올리는 경우.
- 멀티 에이전트 팀 공유 상태 유지 — 서브에이전트 여럿이 작업 결과를 축적하는 장시간 자율 실행 세션.
- 파일 간 버그 추적에서 히스토리가 핵심인 경우 — 15개 이상 파일에 걸친 스택 트레이스와 실패 이력이 전부 살아 있어야 할 때.
1M이 필요 없거나 오히려 손해인 상황
- 일반 코딩 세션 — 대부분 80~120K로 끝납니다. 1M 모델을 선택해도 요금은 동일하지만 굳이 선택할 이유도 없습니다.
- 오래 방치되는 세션 — 캐시 유효 기간은 5분입니다. 500K 컨텍스트에서 캐시가 만료되면 재시작 시 응답 시작까지 30~60초 이상 대기가 발생합니다. (출처: Claude Code Camp 실측 레이턴시 데이터)
- 초반부터 맥락이 오염된 긴 세션 — 80턴 이상 대화가 쌓이면 초반 탐색 과정에서 나온 잘못된 방향이 컨텍스트에 계속 남아 오히려 방해가 됩니다. 이 경우
/clear+ 재시작이 1M 유지보다 결과가 좋습니다. - Sonnet 4.6으로 1M 요금 구간 진입 — 공식 회수율 미발표 상태에서 프리미엄 요금을 내는 것은 근거가 불분명합니다.
📌 실무 판단 기준 한 줄 요약
“컨텍스트 없으면 작업이 불가능한 상황”에서만 1M 구간을 의도적으로 넘기고, 나머지는 세션을 짧게 유지하는 게 비용과 품질 모두에서 유리합니다.
활성화 방법과 세션 관리에서 놓치기 쉬운 것들
Claude Code에서 1M 컨텍스트를 사용하는 방법은 공식 문서에 명확하게 정리돼 있습니다. `[1m]` 접미사를 모델 별칭에 붙이면 됩니다.
# Claude Code 내 명령어
/model opus[1m]
/model sonnet[1m]
/model claude-opus-4-6[1m]
/model claude-sonnet-4-6[1m]
# 환경 변수로도 설정 가능ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-6[1m]'
모델을 선택한 뒤 현재 컨텍스트 상태를 확인하는 방법도 있습니다. /status 명령어나 상태 표시줄(statusline)에서 컨텍스트 크기를 확인할 수 있습니다. 200K 근처에 가까워지고 있다면 /clear로 초기화하거나 작업을 분리하는 게 낫습니다.
세션 관리에서 실제로 도움이 됐던 패턴
Claude Code Camp가 실측에서 도출한 “비용 대비 효율이 높은 세션 관리법” 세 가지입니다.
- 덤프-앤-클리어 패턴 — 코드베이스를 한 번 전부 읽힌 뒤 요약 결과를 별도로 저장하고
/clear를 씁니다. 다음 세션에서 요약만 넣으면 비슷한 맥락을 훨씬 낮은 비용으로 유지할 수 있습니다. - 캐시 워밍 유지 — 5분 TTL 안에 다음 요청을 보내면 캐시 읽기 비용만 발생합니다. 500K 컨텍스트에서 캐시 cold 재시작은 35초 지연이 발생하지만, 캐시 warm 상태에서는 3.5초 수준입니다. 10배 차이가 납니다. (출처: Claude Code Camp 레이턴시 실측)
- 중요 정보는 앞이나 뒤에 — 트랜스포머 특성상 컨텍스트 중간에 위치한 정보는 양 끝보다 회수율이 낮습니다. 반드시 참조해야 하는 핵심 내용은 프롬프트 최상단이나 최하단에 배치하는 게 유리합니다.
1M 컨텍스트를 “무조건 켜두자”는 접근보다 “200K를 의도적으로 넘길 상황에서만 켠다”는 기준을 갖는 게 더 실용적입니다.
Q&A
Q1. Pro 플랜에서 /model opus[1m]을 입력하면 바로 쓸 수 있나요?
명령어 입력 자체는 되지만, 200K를 초과하는 순간부터 Extra usage 과금이 발생합니다. Settings > Usage에서 Extra usage를 미리 활성화하지 않으면 200K 초과 시 요청이 차단됩니다. 먼저 설정에서 활성화하고 지출 한도를 정해두는 것이 좋습니다.
Q2. Max $200/월 플랜이면 1M 컨텍스트가 무제한으로 포함되나요?
그렇지 않습니다. Max에서 Opus 4.6의 1M 컨텍스트는 “기본 포함”이지만, 200K를 넘는 구간은 Extra usage로 청구됩니다. 구독 자체에는 200K 이하 사용량이 포함되는 방식이고, 200K 초과분은 API 표준 장문 요율이 적용됩니다. Anthropic 공식 지원 문서에 이 구분이 명시돼 있습니다.
Q3. Sonnet 4.6의 1M 회수율은 얼마인가요?
2026년 3월 31일 기준 Anthropic이 Sonnet 4.6의 MRCR 1M 점수를 공식 발표하지 않은 상태입니다. 이전 세대인 Sonnet 4.5는 18.5%였고, 4.6이 개선됐을 가능성은 있지만 수치 없이 장문 컨텍스트 작업에서 Sonnet을 신뢰하고 쓰기는 어렵습니다.
Q4. 200K를 조금 넘겼을 때 이전 토큰 전체가 2배로 계산된다는 게 맞나요?
맞습니다. Anthropic의 장문 컨텍스트 가격 구조는 “초과분만 비싸게”가 아니라 “초과하면 전체 입력이 프리미엄 요율로 재계산”되는 방식입니다. 201K 요청은 201,000 × $10.00/M으로 계산되고, 199K 요청은 199,000 × $5.00/M입니다. 이 두 요청의 비용 차이는 단 2K 토큰 차이인데 실제 청구 금액은 두 배 이상 납니다.
Q5. 1M을 선택하면 일반 200K 세션보다 느려지나요?
200K 이하 사용 중에는 속도 차이가 없습니다. 세션이 실제로 200K를 넘어서 캐시가 없는 콜드 스타트가 발생하면, 500K 기준으로 첫 응답까지 약 35초가 걸립니다. 캐시가 warm 상태면 3.5초 수준으로 줄어듭니다. 캐시 유효 시간은 5분이고, 자리를 비우다 6분 뒤에 돌아오면 콜드 스타트 페널티가 다시 발생합니다. (출처: Claude Code Camp 레이턴시 실측, 2026.03.13 기준)
마치며 — 총평
Claude Code 1M 컨텍스트는 분명 강력한 기능이지만, 기대했던 것과 달랐던 부분이 두 가지 있습니다.
첫째, 요금 구조가 선형이 아닙니다. 200K를 조금이라도 넘으면 이전 토큰 전체가 2배 요율로 다시 계산됩니다. 이걸 모르고 쓰면 청구서가 예상보다 훨씬 크게 나올 수 있습니다.
둘째, Sonnet 4.6은 1M을 지원하지만 실제로 그 안의 내용을 잘 쓰는지는 아직 공식 수치가 없습니다. Opus 4.6은 76%를 기록했고, 이전 세대 Sonnet은 18.5%였습니다. 1M 선택 = 긴 컨텍스트 이해가 아닙니다.
막상 실제 사용 데이터를 보면 대부분의 세션은 200K에 도달하지 않습니다. 1M 옵션을 켜는 것보다, 세션을 짧게 유지하고 캐시를 잘 활용하는 게 결과와 비용 모두에서 더 효과적인 경우가 많습니다. 이 부분이 좀 아쉬웠습니다 — 화려한 스펙보다 실제 운용 전략이 먼저였으면 좋겠다는 생각이 들었습니다.
결론: 1M은 “항상 켜둔다”가 아니라 “200K를 넘겨야만 하는 상황에서 의도적으로 쓴다”가 맞는 접근입니다.
본 포스팅 참고 자료
- Claude Code 공식 문서 — 모델 설정 (code.claude.com) : https://code.claude.com/docs/ko/model-config
- Anthropic 공식 지원 — Extra usage for paid Claude plans : https://support.claude.com/en/articles/12429409-extra-usage-for-paid-claude-plans
- Claude Code Camp — 1M 컨텍스트 실측 보고서 (2026.03.13) : https://www.claudecodecamp.com/p/claude-code-1m-context-window
- Anthropic 공식 가격 문서 — 장문 컨텍스트 요금 : https://platform.claude.com/docs/ko/about-claude/pricing
⚠️ 면책 조항: 본 포스팅은 2026년 3월 31일 기준 Anthropic 공식 문서를 바탕으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능·요금이 변경될 수 있습니다. 최신 정보는 반드시 공식 문서(code.claude.com, platform.claude.com)에서 직접 확인하세요.











댓글 남기기