Claude Code v2.1.76 기준
Opus 4.6 / Sonnet 4.6
Claude Code 1M Context, 직접 써봤습니다
— Pro에선 안 됩니다
2026년 3월 13일, Anthropic이 공식 블로그를 통해 1M 컨텍스트 윈도우 정식(GA) 출시를 발표했습니다. 기존 베타 딱지가 떨어지고 추가 요금도 없어졌다는 게 핵심입니다. 그런데 막상 써보면 “내 플랜에선 왜 안 되지?”라는 질문이 먼저 나옵니다. 결론부터 말씀드리면, Pro 플랜과 claude.ai 웹앱에서는 해당 사항이 없습니다.
1M Context 정식 출시, 뭐가 달라졌나요?
2026년 2월 5일 Claude Opus 4.6이 출시될 때 1M 컨텍스트는 “베타”였습니다. 개발자 플랫폼에서만 사용 가능했고, 200K를 넘는 요청에는 프리미엄 요금이 붙었습니다. 입력 기준 $10/MTok, 출력 $37.50/MTok라는 별도 요금표가 있었다는 뜻입니다. (출처: Anthropic 공식 Opus 4.6 출시 발표, 2026.02.05)
3월 13일 GA(General Availability) 선언 이후 이 구조가 사라졌습니다. 핵심은 딱 세 가지입니다. 첫째, 900K 토큰짜리 요청이 9K 토큰짜리와 동일한 단가로 청구됩니다. Opus 4.6 기준 입력 $5/MTok, 출력 $25/MTok이 전 구간 동일하게 적용됩니다. (출처: Anthropic 공식 블로그 1m-context-ga, 2026.03.13)
둘째, 기존에 beta header를 붙여서 200K 초과 요청을 보내던 방식이 더 이상 필요 없습니다. 코드 변경 없이 자동으로 1M 창이 열립니다. 셋째, 미디어 첨부 한도가 요청당 100개에서 600개로 6배 늘었습니다. PDF 100페이지 한계에 자주 걸렸다면 체감이 클 겁니다.
💡 공식 발표문과 기존 요금표를 같이 놓고 보니 이런 차이가 보였습니다. 베타 시절 200K 초과 구간 요금은 GA 이후 표준 요금의 정확히 2배였습니다. Opus 4.6 기준 입력 $10 → $5, 출력 $37.50 → $25. API를 통해 큰 코드베이스를 정기적으로 분석하는 팀이라면 이 변화가 월 청구액에 직접 영향을 줍니다.
Amazon Bedrock, Google Cloud Vertex AI, Microsoft Azure Foundry에도 동시 적용됩니다. 클라우드 플랫폼 어디서 호출하든 동일한 조건으로 쓸 수 있습니다.
내 플랜에서 실제로 되는지 확인하는 방법
Anthropic 공식 발표에 “Now available on all plans”라는 문구가 있어서 많은 사람이 혼동합니다. 정확히는 Claude Platform API에서 모든 지원 플랜에 적용된다는 의미입니다. claude.ai 웹 앱, iOS·Android 앱, Claude Pro 구독은 해당 사항이 없습니다. (출처: Reddit r/ClaudeAI 공식 스레드, ClaudeOfficial 계정, 2026.03.13)
Claude Code 기준으로는 Max, Team, Enterprise 플랜에서만 Opus 4.6의 1M 컨텍스트가 자동 활성화됩니다. Claude Code Pro 플랜은 포함되지 않습니다. 터미널에서 Claude Code를 열면 상단에 “↑ Opus now defaults to 1M context · 5x more room, same pricing”이라는 메시지가 표시된다면 해당 플랜입니다.
| 환경 / 플랜 | 1M Context | 기본 컨텍스트 |
|---|---|---|
| Claude Code Max / Team / Enterprise | ✅ 자동 활성화 | 1M (Opus 4.6) |
| Claude Code Pro | ❌ 미포함 | 200K |
| Claude Platform API | ✅ 표준 요금 | 1M (Opus 4.6) |
| claude.ai 웹앱 / Pro 구독 | ❌ 미지원 | 200K |
| Claude Code Desktop GUI | ⚠️ CLI는 되고 GUI는 지연 | 200K (업데이트 전) |
(출처: Anthropic 공식 블로그 1m-context-ga, 2026.03.13 / Reddit r/ClaudeAI 실사용 보고, 2026.03.13)
VSCode 앱에서 여전히 200K가 뜨는 이유
GA 발표 이후 Reddit에서 가장 많이 올라온 질문이 바로 이겁니다. Max 플랜인데 VSCode Claude Code 익스텐션에서는 Opus 4.6의 컨텍스트가 여전히 200K로 표시된다는 보고가 여럿 있었습니다. 원인은 배포 순서 때문입니다.
Anthropic은 CLI 터미널 버전부터 먼저 배포했고, VSCode 익스텐션과 Claude Code Desktop GUI 앱은 이후 순차 업데이트 예정입니다. 2026년 3월 17일 현재 기준으로, 1M Context를 확실하게 활성화하려면 터미널(CLI)에서 직접 실행해야 합니다. v2.1.76 버전 이상에서 작동한다는 사용자 보고가 있습니다. (출처: Reddit r/ClaudeAI 스레드, 2026.03.13)
💡 Windsurf처럼 Claude Code를 내장한 서드파티 IDE에서는 GA 업데이트가 더 늦게 반영될 수 있습니다. 1M Context를 지금 당장 써야 한다면 Claude Code 공식 CLI 경로가 유일한 선택지입니다. (확인 필요: VSCode 익스텐션 공식 업데이트 일정은 Anthropic에서 별도 공지 없는 상태)
Linux 환경에서 전역 설정 파일에 모델을 “opus”로 지정해놓은 경우, 1M 창이 자동 적용되지 않는 케이스도 보고됐습니다. 이럴 때는 설정을 “opus[1m]”으로 변경하거나 해당 항목을 삭제하면 됩니다. (출처: Reddit r/ClaudeAI, 사용자 _fackler, 2026.03.13)
1M 써도 토큰 비용이 줄어드는 경우가 있습니다
컨텍스트 창이 5배 늘면 당연히 비용도 5배 늘 거라고 생각하기 쉽습니다. 그런데 상황에 따라 실제 토큰 소비가 오히려 줄어드는 경우가 있습니다. 이게 이 업데이트에서 많은 블로그가 다루지 않는 부분입니다.
핵심은 컴팩션(Compaction)입니다. 200K 창을 쓸 때 긴 코딩 세션에서는 컨텍스트가 차면 자동으로 이전 내용을 요약(compaction)하게 됩니다. 이 요약 자체가 토큰을 씁니다. 그리고 요약된 내용을 다음 요청에서 다시 읽는 비용도 발생합니다. Anthropic은 1M 창 적용 후 컴팩션 이벤트가 15% 감소했다고 밝혔습니다. (출처: Anthropic 공식 블로그 1m-context-ga, 2026.03.13)
직접 계산해보면 이렇습니다
200K 창 기준 5회 세션을 이어간다고 가정하면, 각 세션 시작 시 CLAUDE.md 재로드(약 10K) + 이전 컨텍스트 요약 재전달(약 30~50K) = 세션당 약 40~60K 토큰이 재투입 비용으로 소모됩니다. 5회 기준 총 재투입 비용: 최소 200K 토큰. 반면 1M 단일 세션에서는 이 재투입 비용이 1회 30K 수준으로 끝납니다. 컨텍스트 창이 커진다고 무조건 비용이 늘지 않는 이유가 여기 있습니다. (참고: Reddit r/ClaudeAI, 사용자 Performer_First 실측, 2026.03.13)
다만 이 효과는 장시간 단일 세션에서만 유효합니다. 짧은 Q&A 작업이나 간단한 단발성 질문에는 오히려 불필요한 컨텍스트를 누적시켜 비용이 더 나올 수 있습니다. 작업의 성격에 맞게 컨텍스트 전략을 조정하는 게 맞습니다.
Pro 플랜에서 1M 세션 쌓으면 생기는 일
GA 발표 직후 Reddit에서 나온 경고 중 실사용자에게 가장 중요한 내용이 이겁니다. Pro 플랜 기준으로 Claude Code에서 1M에 가까운 컨텍스트가 쌓인 세션에서 “Thanks, that worked”처럼 짧은 후속 메시지를 보내면, 그 짧은 메시지 하나가 500K 이상의 컨텍스트 전체를 재처리하게 됩니다.
이 경우 Pro 플랜의 시간당 사용량 한도를 순식간에 소진하게 됩니다. Max 플랜($100/월) 또는 Team·Enterprise 구독이 아니라면, 컨텍스트가 클수록 후속 메시지 하나의 무게가 무거워진다는 점을 인식해야 합니다. (출처: Reddit r/ClaudeAI, 사용자 happytechca, 2026.03.13)
⚠️ Pro 플랜에서 1M Context 세션을 유지하면 안 되는 이유
• Pro 플랜은 현재 1M Context가 공식 미지원이지만, 컨텍스트 누적 자체는 일어납니다.
• 500K 이상 쌓인 세션에서 후속 발화 1건만으로 몇 시간치 사용 한도가 소진될 수 있습니다.
• Max 플랜이 아닌 경우, CLAUDE_AUTOCOMPACT_PCT_OVERRIDE를 낮게 설정해 조기 컴팩션을 유도하는 것이 현실적인 대안입니다.
자동 컴팩션 기준점을 조정하려면 프로젝트의 .claude/settings.json에 "CLAUDE_AUTOCOMPACT_PCT_OVERRIDE": "20"을 추가하면 됩니다. 컨텍스트가 20% 찼을 때 컴팩션을 강제 실행하게 됩니다. (출처: Reddit r/ClaudeAI, 사용자 systemous, 2026.03.13)
1M Context가 진짜 의미 있으려면 이 점수가 핵심입니다
컨텍스트 창이 크다고 무조건 좋은 게 아닙니다. 실제로 1M 토큰 중간 어딘가에 묻혀 있는 정보를 얼마나 정확하게 찾아내느냐가 성능의 진짜 지표입니다. 이 문제를 측정하는 것이 MRCR v2 (Multi-Round Context Recall) 벤치마크입니다.
Anthropic 공식 발표에 따르면 Opus 4.6는 1M 토큰 기준 MRCR v2에서 78.3%를 기록했습니다. 같은 테스트에서 Sonnet 4.5는 18.5%에 그쳤습니다. 수치만 보면 4배 이상 차이입니다. 이 숫자가 의미하는 건 간단합니다. 1M 창에 대규모 코드베이스를 넣었을 때 Sonnet 4.5는 중간의 정보를 거의 잊어버리지만, Opus 4.6는 10개 중 약 8개를 제대로 기억한다는 뜻입니다. (출처: Anthropic 공식 Opus 4.6 출시 발표, 2026.02.05 / 1m-context-ga 업데이트, 2026.03.13)
💡 Gemini 계열은 오래전부터 1M 이상 컨텍스트를 지원했지만 커뮤니티에서 “실제 중간 부분을 기억 못 한다”는 평가를 꾸준히 받아왔습니다. 창 크기보다 MRCR 같은 회상 정확도 지표를 함께 봐야 하는 이유입니다. Anthropic이 이 수치를 전면에 내세운 것 자체가 단순히 창 크기 경쟁이 아님을 드러냅니다.
실사용에서의 의미는 이렇습니다. 4,000~8,000페이지 분량의 코드베이스(약 25K 줄 이상)를 단일 컨텍스트에 올리고 파일 간 의존성을 추적할 때, 이전에는 RAG나 별도 청킹 전략이 필수였습니다. 1M 창 + 78.3% 회상률 조합에서는 이 우회 구조를 생략할 수 있는 작업이 늘어납니다. (출처: Anthropic 공식 블로그, getaibook.com 분석, 2026.03.14)
단, 이는 여전히 “단일 세션 내”의 이야기입니다. 세션을 닫으면 1M 토큰은 사라집니다. 세션 간 기억 지속성은 --resume 명령어로 일부 보완이 가능하지만, 프로젝트 간·기기 간 전환에는 여전히 수동 컨텍스트 재구성이 필요합니다. (출처: Reddit r/ClaudeAI, 사용자 standingstones_dev, 2026.03.13)
Q&A
Q. Claude Pro 월 $20 구독자는 1M Context를 쓸 수 없나요?
맞습니다. 2026년 3월 17일 기준으로 1M Context는 claude.ai 웹앱과 Claude Pro 구독에서 지원되지 않습니다. Claude Code Max($100/월), Team 또는 Enterprise 플랜, 또는 Claude Platform API 직접 호출 환경에서만 쓸 수 있습니다. 향후 일반 사용자에게 확대 적용될 가능성은 있지만 Anthropic이 별도 일정을 공지하지 않은 상태입니다. (확인 필요)
Q. API 호출 시 model 이름을 바꿔야 하나요?
바꿀 필요 없습니다. claude-opus-4-6으로 호출하면 1M 창이 기본 적용됩니다. 기존에 beta header(anthropic-beta: long-context-window-2024-02-29)를 사용하고 있었다면 그냥 두셔도 되고, 없애도 됩니다. 헤더가 있어도 무시됩니다. (출처: Anthropic 공식 블로그, 2026.03.13)
Q. Sonnet 4.6도 1M을 쓸 수 있나요? 가격은요?
Sonnet 4.6도 1M이 표준 가격으로 제공됩니다. 입력 $3/MTok, 출력 $15/MTok으로 전 구간 동일합니다. 단, Claude Code에서 Opus 4.6처럼 자동 기본값으로 설정되지는 않고, 모델을 명시적으로 선택해야 할 수 있습니다. (출처: Anthropic 공식 블로그, 2026.03.13)
Q. 미디어 한도 600개 증가는 어떤 상황에서 체감이 크나요?
PDF 분석, 법률 문서 검토, 의료 이미지 다수 처리, 대규모 UI 스크린샷 분석 같은 멀티모달 워크플로우에서 체감이 큽니다. 이전 100페이지 PDF 한도에서 몇백 페이지짜리 계약서를 한 번에 올리지 못했던 케이스가 600장으로 해소됩니다. (출처: Anthropic 공식 블로그, 2026.03.13)
Q. 1M Context를 최대한 잘 활용하려면 어떻게 해야 하나요?
단순히 창이 커졌다고 모든 걸 다 넣는 건 효율적이지 않습니다. 작업 관련성이 높은 파일만 올리는 게 토큰 낭비를 줄이는 방법입니다. 불필요한 후속 발화(“감사합니다” 같은 짧은 메시지)도 축적된 컨텍스트 전체를 재처리하게 만드니 주의가 필요합니다. 장시간 복잡한 작업 단일 세션에 집중하고, 독립적인 새 작업은 새 세션에서 시작하는 게 현실적으로 유리합니다.
마치며 — 총평
솔직히 말하면, 이번 GA 발표는 “드디어 실용적이 됐다”는 느낌입니다. 2월 베타 시절에는 200K 초과 구간 추가 요금이 진입 장벽이었고, 대부분의 팀이 그냥 API 기반 RAG로 우회했습니다. 단가가 같아진 지금은 계산이 달라집니다.
그러나 누가 쓸 수 있는지를 정확히 알아야 합니다. Max, Team, Enterprise 플랜과 API 직접 사용자의 이야기입니다. claude.ai 웹앱을 쓰는 일반 Pro 구독자는 오늘 당장 달라진 게 없습니다. 이 부분이 발표 원문에서 명확하게 전달되지 않아서 혼선이 생긴 것 같습니다.
MRCR v2 78.3%라는 회상 정확도 수치는 이 업데이트의 진짜 핵심입니다. 창이 큰 것보다 그 안의 내용을 얼마나 잘 기억하느냐가 실용성을 결정합니다. 대규모 코드베이스를 다루거나 장문 문서를 반복 분석해야 하는 작업에서 체감 차이가 나올 겁니다. 짧은 Q&A 용도라면 오히려 불필요한 변화입니다.
📎 본 포스팅 참고 자료
- Anthropic 공식 블로그 — 1M Context GA 발표 (claude.com/blog/1m-context-ga, 2026.03.13)
- Anthropic 공식 뉴스 — Introducing Claude Opus 4.6 (anthropic.com/news/claude-opus-4-6, 2026.02.05)
- Claude Platform 공식 문서 — Context Windows (platform.claude.com/docs/en/build-with-claude/context-windows)
- getaibook.com — GA Changes 실용 분석 (getaibook.com, 2026.03.14)
- Reddit r/ClaudeAI — ClaudeOfficial GA 공지 및 커뮤니티 실사용 보고 (2026.03.13)
⚠️ 본 포스팅은 2026년 3월 17일 기준으로 작성됐습니다. Claude Code 버전 v2.1.76 기준이며, 이후 Anthropic의 서비스 정책·UI·기능이 변경될 수 있습니다. 특히 플랜별 지원 여부 및 요금은 Anthropic 공식 페이지에서 최신 정보를 확인하시기 바랍니다.


댓글 남기기