Claude Code 1M 컨텍스트,
이 조건엔 자동이 아닙니다
2026년 3월 13일, Anthropic이 Claude Code에 100만 토큰 컨텍스트 윈도우를 정식 출시했습니다.
발표문에는 “자동 적용”이라고 나와 있지만, 그게 모든 플랜에 해당되는 얘기는 아닙니다.
요금 프리미엄도 사라지고, 성능 수치도 인상적이지만 — 막상 써보면 걸리는 조건이 있습니다.
(Opus 4.6 1M 기준)
(Anthropic 공식 발표)
요금 프리미엄
무엇이 달라졌는가 — 3월 13일 변경 사항 요약
Claude Code 1M 컨텍스트는 2026년 3월 13일, Anthropic이 공식적으로 일반 출시(GA)를 선언하면서 달라진 서비스입니다.
이전에는 베타 헤더를 따로 추가해야 했고, 200K 토큰을 넘는 요청에는 요금 프리미엄이 붙었습니다.
(출처: Anthropic 공식 블로그, claude.com/blog/1m-context-ga, 2026.03.13)
이번 출시로 달라진 핵심은 네 가지입니다.
첫째, 요금 구조가 단일화됐습니다. 9K 토큰 요청과 900K 토큰 요청이 동일한 단가를 적용받습니다.
둘째, 베타 헤더가 필요 없어졌습니다. 기존 코드에 헤더가 있어도 무시됩니다.
셋째, 미디어 첨부 한도가 100장에서 600장으로 6배 늘어났습니다.
넷째, Claude Code에서 Max·Team·Enterprise 사용자는 Opus 4.6 세션에서 1M 컨텍스트가 자동 적용됩니다.
| 항목 | 변경 전 | 변경 후 |
|---|---|---|
| 장문 요금 프리미엄 | 있음 (2배) | 없음 |
| 베타 헤더 필요 여부 | 필요 | 불필요 (무시됨) |
| 미디어 첨부 한도 | 100장 | 600장 |
| Claude Code 자동 적용 | 미적용 | Max·Team·Enterprise만 |
Pro 플랜에서는 자동이 아닙니다 — 직접 확인한 차이
Anthropic의 발표문을 처음 읽으면 “1M 컨텍스트가 모두에게 열렸다”는 인상을 받습니다.
기술적으로는 맞습니다. 하지만 Claude Code 안에서 실제로 작동하는 방식은 플랜마다 다릅니다.
공식 발표문에는 이렇게 나와 있습니다.
“1M context is now included in Claude Code for Max, Team, and Enterprise users with Opus 4.6.”
Pro 플랜은 이 목록에 없습니다.
(출처: Anthropic 공식 블로그, claude.com/blog/1m-context-ga, 2026.03.13)
Pro 플랜에서 Claude Code의 1M 컨텍스트를 쓰려면 Claude Code 안에서 /extra-usage 명령을 직접 입력해야 합니다.
이 단계를 생략하면 기존 200K 컨텍스트 윈도우에서 세션이 진행됩니다.
대부분의 소개글이 이 조건을 언급하지 않습니다.
이 차이가 왜 중요하냐면, Pro 플랜 사용자는 컴팩션이 발생해도 “1M이 되지 않았나?” 하고 착각하기 쉽기 때문입니다.
세션을 연 상태에서 /context 명령으로 현재 컨텍스트 윈도우를 확인해보면 바로 알 수 있습니다.
Max·Team·Enterprise는 Opus 4.6 세션을 열면 1M이 기본값입니다. Pro는 그렇지 않습니다.
Anthropic이 이 차이를 명확하게 강조하지 않은 이유는 공식 문서에서 별도로 설명되지 않았습니다.
다만 Pro 플랜에서 1M을 자동 적용하지 않는 건, 마진 보호와 업그레이드 유도 신호를 동시에 설계한 제품 전략으로 보입니다.
요금이 절반이 된다는 말이 맞는 경우와 아닌 경우
이번 변경에서 가장 실질적인 내용은 요금 구조입니다.
이전에는 Sonnet 4.6에서 200K 토큰을 넘으면 입력 요금이 $3/MTok에서 $6/MTok으로 2배 뛰었습니다.
Opus 4.6는 1M 컨텍스트 자체가 없었고요.
이제 둘 다 프리미엄 없이 동일 단가가 적용됩니다.
(출처: aitoolranked.com, 2026.03.16)
900K 토큰 요청 하나를 예로 들면 직관적으로 계산이 됩니다.
Sonnet 4.6 기준 변경 전이라면 200K 초과분이 $6/MTok 적용이라 입력 비용이 크게 늘었겠지만,
이제는 900K 전체에 $3/MTok이 적용됩니다. 긴 세션일수록 절감폭이 커집니다.
300K 토큰짜리 요청 하나가 250K 요청보다 약 2배 비싸지는 구조입니다.
월말 청구서에서 이 차이를 체감하는 개발자들이 적지 않습니다.
(출처: karozieminski.substack.com, 2026.03.16)
| 모델 | 최대 컨텍스트 | 장문 프리미엄 | 기준 입력 요금 |
|---|---|---|---|
| Claude Opus 4.6 | 1M 토큰 | 없음 | $5/MTok |
| Claude Sonnet 4.6 | 1M 토큰 | 없음 | $3/MTok |
| GPT-5.4 | 1.05M 토큰 | 있음 (272K 초과 시 2배) | $2.5/MTok~ |
| Gemini 2.5 Pro | 1M 토큰 | 있음 (구간별 티어) | $1.25/MTok~ |
MRCR v2 78.3% — 숫자가 의미하는 것
“컨텍스트 윈도우가 크면 클수록 정확도가 떨어진다”는 게 기존 통념이었습니다.
실제로 기존 모델들은 문서가 길어질수록 중간에 묻힌 정보를 놓치는 패턴이 뚜렷했습니다.
Opus 4.6의 MRCR v2 벤치마크 결과는 이 통념을 정면으로 반박합니다.
MRCR v2는 3,000페이지 분량(약 1M 토큰)의 문서 안에 2개의 특정 정보를 숨겨두고,
모델이 두 가지를 모두 찾아야만 정답으로 인정하는 테스트입니다.
하나라도 빠지면 점수가 오르지 않는 엄격한 방식입니다.
Opus 4.6은 여기서 78.3%를 기록했습니다.
(출처: Anthropic 공식 블로그, claude.com/blog/1m-context-ga, 2026.03.13)
비교 수치를 보면 의미가 더 명확해집니다.
Opus 4.6은 Gemini 대비 약 3배, 이전 Claude 대비 약 4배 높은 점수입니다.
(출처: karozieminski.substack.com, 2026.03.16)
1M 토큰을 그냥 받는 것과, 그 안에서 실제로 정보를 찾는 것은 전혀 다른 문제라는 뜻입니다.
78.3%는 Anthropic 자체 발표 수치입니다. 독립적인 제3자 검증은 아직 나오지 않았습니다.
또한 일부 개발자들은 HN 스레드에서 “컨텍스트 시작 지점의 결정 사항을 모델이 뒤집는” 패턴을 보고했습니다.
긴 세션에서 초반에 내린 결정이 나중에 무시되는 이른바 ‘컨텍스트 로트(context rot)’ 현상은 1M에서도 완전히 해결되지 않았습니다.
1M이 오히려 비용 폭탄이 되는 상황
1M 컨텍스트가 생기면 “더 많이 넣을 수 있으니 더 좋다”고 생각하기 쉽습니다.
그런데 에이전트 루프를 쓰는 경우 이 논리가 완전히 뒤집힙니다.
Cursor 환경에서 AI 도구 호출 하나가 데이터베이스 전체를 풀어버리면서 단번에 80만 토큰을 소비한 사례가 실제로 보고됐습니다.
개발자 입장에서 코드 한 줄짜리 명령을 실행했는데 한 번에 $4 가까이 청구되는 상황이 생기는 겁니다.
Opus 4.6 기준 900K 토큰 세션 하나의 입력 비용만 계산해도 약 $4.50입니다.
반복 실행되는 에이전트라면 루프 한 번에 수십 달러가 쌓입니다.
(출처: karozieminski.substack.com, 2026.03.16)
Claude Code는 단순한 채팅이 아닙니다. 파일 읽기, 배시 명령 실행, 패치 생성, 테스트 검증이 각각 별도 API 호출로 이루어집니다.
15번의 반복 명령을 내리면 마지막 호출 하나에만 이미 20만 토큰 이상이 쌓인다는 분석이 있습니다.
(출처: medium.com/@william.couturier, 2026.03.17)
채팅 1회 교환이 1,000~5,000 토큰인 것과 달리, Claude Code는 같은 티어에서 10~100배 토큰을 소모합니다.
컨텍스트 창이 커졌다는 건 실수 하나가 커지는 창도 함께 커졌다는 뜻입니다.
프로덕션 에이전트에 1M을 붙이기 전에 .claudeignore 파일로 불필요한 파일을 제외하고, 쿼리 범위를 명확하게 좁히는 것이 먼저입니다.
공식 발표문과 실제 사용 흐름을 같이 놓고 보니
Anthropic의 수익 구조를 보면 이번 요금 변경의 맥락이 조금 다르게 읽힙니다.
Anthropic 전체 매출의 70~75%가 API·토큰 기반 과금에서 나오고, Claude Code가 약 18%를 차지합니다.
(출처: karozieminski.substack.com, 2026.03.16)
소비자 구독보다 개발자·기업 API 사용이 훨씬 큰 비중입니다.
그래서 200K 초과 요금 프리미엄 제거는 단순한 할인이 아닙니다.
프로덕션 워크플로우에서 Claude를 쓰기로 결정할 때 가장 큰 마찰 요인 중 하나를 없앤 겁니다.
장문 컨텍스트가 필요한 팀이 GPT-5.4 대신 Claude를 선택하게 만드는 구조적 유인입니다.
2026년 2월 기준 $380억 달러 밸류에이션으로 $300억을 조달한 Anthropic이 요금 압축을 감당할 여력은 충분합니다.
(출처: karozieminski.substack.com, 2026.03.16)
동시에 Pro 플랜의 1M 수동 활성화 설계는 이 맥락에서 완전히 이해됩니다.
Max·Team·Enterprise에만 자동 적용함으로써 Pro 사용자에게 업그레이드 이유를 명확하게 제시합니다.
1M 컨텍스트가 필요한 무거운 워크로드를 실행하는 사람이라면, 어차피 Max가 더 필요한 상황에 놓이게 되는 구조입니다.
Anthropic이 3월 13~27일 피크 외 시간대 사용량을 2배로 늘린 프로모션도 같은 맥락입니다.
오전 8시~오후 2시(ET) 외 시간대와 주말에 보너스가 적용되고, 이 보너스는 기존 주간 한도와는 별개로 추가됩니다.
(출처: medium.com/@william.couturier, 2026.03.17)
밤·주말의 GPU 서버 가동률을 높이면서 사용자 충성도를 함께 높이는 전략입니다.
Q&A — 자주 나오는 질문 5가지
마치며
Claude Code 1M 컨텍스트는 분명 의미 있는 업데이트입니다.
요금 프리미엄이 없어지고, 긴 세션에서의 정확도가 실제 수치로 뒷받침됩니다.
코드베이스 전체를 한 세션에 넣고 리팩터링하거나, 수백 페이지 문서를 중간 청킹 없이 분석하는 워크플로우가 처음으로 현실적인 선택지가 됐습니다.
단, 이 업데이트를 쓰기 전에 확인해야 할 것이 두 가지 있습니다.
첫째, 본인 플랜이 Pro라면 Claude Code 안에서 /extra-usage를 먼저 입력해야 합니다.
둘째, 에이전트 루프에 1M을 그대로 붙이면 의도치 않은 비용 급증이 생길 수 있습니다.
컨텍스트 윈도우가 커진다는 것은 컨텍스트 관리의 중요성도 함께 커진다는 의미입니다.
솔직히 말하면, 지금 이 시점에 Claude Code를 쓰는 가장 실질적인 이유는 1M 자체보다 “요금 불확실성이 줄었다”는 데 있습니다.
장문 세션에서 청구서가 갑자기 두 배가 되는 구조가 사라진 것 — 그게 지금 당장 개발 워크플로우에서 체감하는 가장 큰 변화입니다.
본 포스팅 참고 자료
- ① Anthropic 공식 블로그 — 1M Context GA 발표 (claude.com/blog/1m-context-ga), 2026.03.13
- ② SitePoint — Claude Code Rate Limits Explained 2026 (sitepoint.com)
- ③ AI Tool Ranked — Claude 1M Context GA Breakdown (aitoolranked.com), 2026.03.16
- ④ William Couturier / Medium — Claude Code in March 2026: The Economics of the Quota (medium.com), 2026.03.17
- ⑤ Karo Zieminski / Substack — Claude’s 1M Context Window: What Changed (karozieminski.substack.com), 2026.03.16
본 포스팅은 2026년 3월 23일 기준 공개된 정보를 토대로 작성됐습니다.
본 포스팅 작성 이후 서비스 정책·UI·기능·요금이 변경될 수 있습니다.
수치 및 사양은 Anthropic 공식 발표 자료를 참조했으며, 변경 시 해당 공식 문서를 우선합니다.

댓글 남기기