Claude Code v2.1.75 기준
Claude Code 1M 컨텍스트, Pro 쓰면 안 되는 이유 있습니다
결론부터 말씀드리면, Max·Team·Enterprise 플랜만 기본 포함입니다. Pro 플랜은 추가 사용료가 붙습니다. 발표 직후 “1M 컨텍스트 무료 개방”이라는 말이 퍼졌는데, 절반만 맞는 얘기입니다.
Pro 플랜이 빠진 진짜 이유
2026년 3월 13일, Anthropic 공식 블로그에는 이렇게 나옵니다. “Claude Code Max, Team, and Enterprise users on Opus 4.6 will default to 1M context automatically.” (출처: Anthropic 공식 블로그, 2026.03.13) Pro 플랜이라는 단어는 없습니다.
wmedia.es가 Claude Code 공식 문서를 참조해 정리한 플랜별 접근 현황은 아래 표와 같습니다. (출처: wmedia.es/claude-code-1m-context-window-tips, 2026.03.16)
| 플랜 | Opus 4.6 1M | Sonnet 4.6 1M |
|---|---|---|
| Max · Team · Enterprise | ✅ 기본 포함 | 추가 사용 필요 |
| Pro ($20/월) | 추가 사용 필요 | 추가 사용 필요 |
| API (종량제) | ✅ 전체 접근 | ✅ 전체 접근 |
Pro 플랜은 기본 포함이 아닙니다. API 종량제 사용자는 오히려 전체 접근이 가능하니, 요금 구조가 역설적입니다.
경쟁사 대비 가격 차이, 직접 계산했습니다
이번 변경에서 실제로 놀라운 부분은 따로 있습니다. 긴 컨텍스트에 추가 요금을 매기던 관행을 Anthropic이 먼저 버렸다는 점입니다. 공식 블로그에 딱 이렇게 나옵니다. “No multiplier: a 900K-token request is billed at the same per-token rate as a 9K one.” (출처: Anthropic 공식 블로그, 2026.03.13) 900K 토큰이나 9K 토큰이나 같은 단가라는 뜻입니다.
200K 토큰 초과 구간 입력 단가 비교 (100만 토큰 기준, 2026.03 현재)
- Claude Opus 4.6: $5/M — 초과 구간 동일 단가
- Gemini 3.1 Pro: $2→$4/M (200K 초과 시 2배 과금)
- GPT-5.4: $2.50→$5/M (272K 초과 시 2배 과금)
(출처: martinalderson.com, 2026.03.15 / Anthropic 공식 블로그, 2026.03.13)
직접 계산해보면 이렇습니다. 한 세션에 500K 토큰을 쓴다고 가정할 때:
단순 입력 단가만 보면 Anthropic이 비쌉니다. 하지만 200K를 넘으면 경쟁사는 바로 2배가 됩니다. 긴 컨텍스트를 자주 쓰는 워크플로에선 실제 청구서가 다르게 나옵니다.
1M 채웠다고 끝이 아닌 이유 — context drift
여기서 대부분의 블로그가 얘기하지 않는 부분이 있습니다. 1M 토큰 창이 열렸다고 해서 처음부터 끝까지 동일한 품질로 답변하지는 않습니다. context drift — 세션이 길어질수록 초기 정보에 대한 모델의 정확도가 서서히 떨어지는 현상입니다.
Anthropic이 공개한 MRCR v2 벤치마크에서 Opus 4.6은 1M 토큰 전 구간에서 78.3%를 기록했습니다. (출처: Anthropic 공식 블로그, 2026.03.13) GPT-5.4와 Gemini 3.1 Pro는 둘 다 1M 컨텍스트를 지원하지만, 256K를 넘어서면 정확도가 50% 아래로 떨어집니다. (출처: martinalderson.com, 2026.03.15) 숫자가 클수록 좋은 게 아닙니다.
- auto-compaction은 기본 설정에서 95% 도달 시 자동 실행됩니다. (출처: wmedia.es, 2026.03.16)
- 95%까지 쌓아두면 오래된 토큰 정밀도가 이미 낮아진 상태입니다.
- 선제적으로 70% 시점에 compact 하는 것이 품질 유지에 유리합니다.
wmedia.es는 이를 “more context doesn’t mean better results”라고 정리했습니다. (출처: wmedia.es, 2026.03.16) 창이 크다고 전부 채우는 건 좋은 전략이 아닙니다.
compaction 15% 줄었다는 수치, 실제로 어떤 의미인가
Anthropic 공식 블로그에서 한 CPO(Jon Bell)는 이렇게 말했습니다. “We’ve seen a 15% decrease in compaction events. Now our agents hold it all and run for hours without forgetting what they read on page one.” (출처: Anthropic 공식 블로그, 2026.03.13) compaction 이벤트가 15% 줄었다는 뜻입니다.
compaction이 발생할 때마다 에이전트는 이전 대화를 요약으로 압축합니다. 이 과정에서 세부 정보가 사라지고, 이후 작업에서 에이전트가 파일을 다시 읽어야 하는 상황이 반복됩니다. compaction이 줄어들면 이 루프 자체가 줄어듭니다.
200K → 500K로 컨텍스트를 확장한 사례에서 오히려 전체 토큰 소비가 줄었다는 사용 사례가 공식 블로그에 등장합니다. Izzy Miller(AI Research Lead)는 “We raised our Opus context window from 200k to 500k and the agent runs more efficiently — it actually uses fewer tokens overall.”라고 밝혔습니다. (출처: Anthropic 공식 블로그, 2026.03.13) 컨텍스트를 크게 잡으면 비용이 늘 것 같지만, 반복 재로딩이 없어지면서 총 소비 토큰이 오히려 줄어들 수 있습니다.
코드보다 법률·금융 문서에 더 유리한 이유
이 부분은 거의 모든 한국어 블로그에서 다루지 않는 관점입니다. 프로그래밍 코드는 구조적으로 모듈화가 잘 되어 있어 compaction 요약에 비교적 잘 버팁니다. 코드 파일은 함수 단위로 잘라도 의미가 어느 정도 살아 있습니다.
반면 법률 계약서, 금융 보고서, 의료 차트처럼 전체 흐름이 중요한 문서는 다릅니다. 한 계약서 100페이지 중 57페이지에 있는 예외 조항이 83페이지 조건과 연결될 때, 요약본으로 이 연결고리를 유지하는 건 어렵습니다. martinalderson.com은 이를 이렇게 정리했습니다. “Ironically software is far better suited to being excerpted than many other professional service tasks.” (출처: martinalderson.com, 2026.03.15)
법률 플랫폼 Eve의 ML 엔지니어 Mauricio Wulfovich는 “400페이지 진술 녹취록 교차 검토나 전체 사건 파일의 핵심 연결고리를 찾는 작업에서 1M 컨텍스트 전후로 답변 품질이 눈에 띄게 달라졌다”고 밝혔습니다. (출처: Anthropic 공식 블로그, 2026.03.13)
코딩 도구로만 알려졌지만, 실제 효과는 비정형 장문 문서 작업에서 더 두드러집니다.
낭비 없이 쓰는 4가지 방법
Claude Code v2.1.75 기준, 공식 문서에서 확인한 실사용 설정입니다. (출처: wmedia.es, 2026.03.16 / code.claude.com 공식 문서)
CLAUDE_AUTOCOMPACT_PCT_OVERRIDE=70 환경변수를 설정하면 기본 95% 임계값을 앞당길 수 있습니다.Q&A 5가지
마치며 — 총평
이번 1M 컨텍스트 정식 출시에서 진짜 의미 있는 변화는 두 가지입니다. 하나는 긴 컨텍스트에 추가 요금을 매기던 관행을 Anthropic이 먼저 없앴다는 것, 다른 하나는 경쟁사 모델들이 256K 이후 정확도를 유지하지 못하는 반면 Opus 4.6은 전 구간에서 78.3%를 유지한다는 점입니다.
단, Pro 플랜은 기본 포함이 아니고, 1M을 채운다고 품질이 보장되는 것도 아닙니다. 컨텍스트 창이 커진 만큼 context drift도 더 오래 쌓입니다. 70% 지점에서 선제 compact하고, 필요한 파일만 선택적으로 불러오는 습관이 오히려 비용과 품질 양쪽을 잡는 방법입니다.
이 기능이 가장 빛나는 건 코딩보다 오히려 법률·금융·의료처럼 전체 맥락이 살아있어야 하는 문서 작업입니다. 개발 도구라는 인식 때문에 그쪽 가능성이 덜 알려져 있는데, 직접 써볼 가치가 있습니다.
본 포스팅 참고 자료
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다.
2026년 3월 26일 기준 작성. Claude Code v2.1.75 / Opus 4.6 기준.

댓글 남기기