Claude Code 1M 컨텍스트, 쓸 수 있는 플랜이 따로 있습니다

Published on

in

Claude Code 1M 컨텍스트, 쓸 수 있는 플랜이 따로 있습니다

2026.03.13 GA 기준
Claude Code / Opus 4.6 · Sonnet 4.6

Claude Code 1M 컨텍스트,
쓸 수 있는 플랜이 따로 있습니다

2026년 3월 13일, Anthropic이 Claude Code의 1M 토큰 컨텍스트 윈도우를 정식 공개(GA)했습니다. 베타 딱지를 뗐고, 추가 요금도 사라졌습니다. 그런데 막상 써보려 하면 막히는 경우가 있습니다. 어떤 플랜에서 되고, 어디서 안 되는지 — 공식 발표문과 실사용 보고를 같이 놓고 보니 이런 차이가 보였습니다.

78.3%
MRCR v2 1M 토큰 정확도
(프론티어 모델 중 최고)
15%
compaction 이벤트 감소
(Anthropic 공식 보고)
600개
요청당 미디어 한도
(기존 100개에서 6배 확대)

1M 컨텍스트, 무엇이 달라졌나

Claude Code 1M 컨텍스트 윈도우는 2026년 2월 5일 Opus 4.6 출시 시점에 베타로 처음 등장했습니다. 그러다 3월 13일 정식 GA(일반 공개) 전환이 이뤄졌습니다. 달라진 게 크게 세 가지입니다.

첫째, 요금 체계가 바뀌었습니다. 베타 때는 200K 초과 구간에 별도 프리미엄 요금이 붙었는데, GA 전환 이후에는 Claude Platform 기준으로 Opus 4.6은 입력 $5/1M 토큰, Sonnet 4.6은 $3/1M 토큰 단일 요금이 전체 윈도우에 동일 적용됩니다. 900K짜리 요청과 9K짜리 요청에 토큰당 동일 단가가 붙습니다. (출처: Anthropic 공식 블로그, 2026.03.13)

둘째, 요청당 미디어 첨부 한도가 기존 100개에서 600개로 늘었습니다. 이미지나 PDF 페이지를 대량으로 처리해야 하는 작업에 직접 영향이 있는 변화입니다.

셋째, 베타 헤더가 필요 없어졌습니다. 200K 초과 요청이 자동으로 처리되고, 기존에 베타 헤더를 달고 있던 코드도 그냥 무시됩니다 — 코드 수정이 필요 없습니다.

▲ 목차로 돌아가기

플랜별 접근 가능 여부 — 표로 정리

가장 많이 혼란스러운 부분입니다. 3월 13일 이후 1M 컨텍스트가 “모두에게 열렸다”고 알려졌는데, 정확히는 그렇지 않습니다. 공식 발표문을 보면 Claude Code 기준으로 Max, Team, Enterprise 플랜에서만 Opus 4.6 1M 컨텍스트가 자동 적용됩니다. (출처: claude.com/blog/1m-context-ga)

플랜 Claude Code 1M 월 요금 비고
Free $0 200K 기본
Pro $20/월 200K 기본, Claude Code 사용 가능하나 1M 미지원
Max (Tier 1) $100/월 Pro 대비 5배 사용량, Opus 4.6 자동 1M
Max (Tier 2) $200/월 Pro 대비 20배 사용량, Opus 4.6 자동 1M
Team (Standard) $25/인/월 최소 5명, 1M 자동 적용
Team (Premium) $150/인/월 Claude Code 포함, 1M 자동 적용
Enterprise 별도 협의 1M 자동 적용

💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다 — Pro 플랜도 Claude Code를 쓸 수 있지만, 1M 컨텍스트는 별개입니다. Max 플랜부터 자동 적용됩니다. Reddit에서 Max 구독자임에도 200K에서 자동 compaction이 걸린다는 보고가 있는데, 이는 데스크탑 앱 버그로 공식 확인됐습니다. CLI 터미널에서는 정상 작동합니다.

▲ 목차로 돌아가기

78.3%라는 숫자가 의미하는 것

Anthropic이 공식 발표에서 내세운 핵심 수치는 MRCR v2(Multi-Round Coreference Resolution, 8-needle) 벤치마크 기준 Opus 4.6의 1M 토큰 정확도 78.3%입니다. 이건 프론티어 모델 중 가장 높은 수치라고 발표했습니다. (출처: anthropic.com/news/claude-opus-4-6)

Opus 4.6 (8-needle)
76%
MRCR v2, 1M 토큰
Sonnet 4.5 (이전 세대)
18.5%
동일 벤치마크
Gemini (비교 모델)
26.3%
동일 벤치마크

MRCR v2는 수십만~100만 토큰 분량의 텍스트 속에 숨겨진 특정 정보를 얼마나 정확하게 찾아내는지를 측정합니다. 76% vs. 18.5%. 이전 세대 모델과 비교하면 4배 차이입니다.

다만 주의할 부분이 있습니다. 같은 공식 발표문에서 Anthropic은 “이 점수는 8-needle 1M 변형 기준”이라고 명시했습니다. MRCR v2 일반(78.3%)과 8-needle 변형(76%)은 조건이 다릅니다. 공식 발표에서 두 수치가 함께 언급되는 이유입니다.

▲ 목차로 돌아가기

실제로 써보면 다른 점들

Anthropic이 공개한 실사용 사례를 보면 공통적으로 “compaction이 줄었다”는 말이 나옵니다. 실제로 한 CPO의 증언에서 “compaction 이벤트가 15% 감소했다”는 수치가 언급됩니다. 세션 도중 맥락이 사라지는 현상이 그만큼 줄었다는 뜻입니다. (출처: claude.com/blog/1m-context-ga)

💡 AI 에이전트 실무에서 1M 컨텍스트를 쓰다 보면 발견하게 되는 부분 — “컨텍스트가 커진다고 토큰을 더 쓰는 게 아니다”입니다. Anthropic 파트너사 중 한 곳의 AI 리서치 리드는 “Opus 컨텍스트 윈도우를 200K에서 500K로 올렸더니 오히려 토큰 전체 사용량이 줄었다”고 보고했습니다. 불필요한 반복 요청이 없어졌기 때문입니다.

코드베이스 전체를 한 세션에 넣을 수 있다는 것의 실질적 의미

SentinelOne에서는 멀티밀리언 라인 코드베이스 마이그레이션을 1M 컨텍스트로 처리했고, 기존보다 절반의 시간이 걸렸다고 했습니다. Cursor, Windsurf, Replit 같은 AI IDE 파트너들도 같은 방향의 피드백을 공식 발표 당시 냈습니다.

법무 분야에서도 비슷한 패턴이 나옵니다. 계약서 100페이지 분량 5회 협상 이력을 한 세션에 올려 전체 맥락을 한 번에 파악하는 작업이 가능해졌습니다. 버전 전환마다 맥락을 다시 입력하던 작업이 사라지는 것입니다.

▲ 목차로 돌아가기

컨텍스트가 커질수록 생기는 문제

1M 컨텍스트가 장점만 있지는 않습니다. Reddit r/ClaudeCode에서 실제 Max 구독자들의 사용 보고를 보면 다른 그림이 나옵니다. Opus 4.6 + 1M 컨텍스트 + max effort 조합으로 긴 세션을 진행했을 때, 같은 실수를 반복하거나, 3가지 작업 중 2가지를 조용히 누락하는 패턴이 목격됐습니다.

⚠️ 실사용자 보고 (Reddit r/ClaudeCode, 2026.03.16)

“문제를 정확히 설명할 수 있고, 어느 코드가 잘못됐는지도 찾아낸다. 그런데 정작 고치지는 못한다. 3가지 작업을 주면 1개를 끝내고 나머지 2개는 거절도, 논의도 아닌 그냥 누락한다.”

원인에 대해 커뮤니티에서 나온 분석은 크게 두 가지입니다. 첫 번째는 context poisoning — 잘못된 정보가 세션 내내 남아있고, 컨텍스트가 커질수록 올바른 정보가 우선순위를 잃는 현상입니다. 두 번째는 attention 분산 — 토큰 수가 늘어날수록 모델이 집중할 영역을 잘못 고르는 빈도가 높아지는 경향입니다.

💡 실무자들이 공유한 우회 방법 — 1M 세션을 통째로 유지하는 것보다, 작업 단위를 명확하게 쪼개고 CLAUDE.md에 “완료 조건”을 명시한 뒤 단일 태스크만 넘기는 방식이 더 안정적입니다. “200K가 sweet spot”이라는 실사용자 평가도 나왔습니다.

데스크탑 앱에서 1M이 갑자기 사라지는 상황

앱을 업데이트하면 1M 컨텍스트가 사라지는 버그가 보고됐습니다(Reddit r/ClaudeCode, 2026.03.20). CLI에서는 정상이고 데스크탑 앱에서만 발생하는 문제로, 공식 확인된 알려진 버그입니다. 임시 해결책은 ~/.claude/settings.json"ANTHROPIC_DEFAULT_OPUS_MODEL": "claude-opus-4-6[1m]"을 추가한 뒤 재시작하는 방식입니다.

▲ 목차로 돌아가기

API 요금 구조 — 이전과 달라진 부분

Claude Platform을 통해 API로 직접 쓰는 경우 요금 구조가 바뀌었습니다. 공식 발표에 나온 수치 기준으로 정리하면 아래와 같습니다. (출처: claude.com/blog/1m-context-ga, 2026.03.13)

모델 입력 (1M 토큰) 출력 (1M 토큰) 장거리 프리미엄
Opus 4.6 $5 $25 없음 (GA 이후)
Sonnet 4.6 $3 $15 없음 (GA 이후)

단, 위 요금은 Claude Platform 기준입니다. Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry를 통해 쓸 때는 각 플랫폼 요금 정책을 별도로 확인해야 합니다.

💡 구체적으로 계산해 보면 이렇습니다 — 예컨대 900K 토큰짜리 요청 하나를 Opus 4.6으로 처리할 경우, 입력 비용은 0.9 × $5 = $4.50입니다. GA 이전에는 200K 초과분에 $10/1M 토큰 프리미엄이 붙었으므로 700K × $10 = $7.00이 추가됐습니다. 동일한 요청이 이제 40% 저렴해진 셈입니다.

▲ 목차로 돌아가기

자주 나오는 질문들

Q. Pro 플랜도 Claude Code를 쓸 수 있는데, 1M은 왜 안 되나요?
Claude Code 실행 자체는 Pro에서도 됩니다. 다만 1M 컨텍스트 윈도우는 Max, Team, Enterprise 플랜 전용 기능입니다. Anthropic이 공식 발표문에서 “Claude Code Max, Team, and Enterprise users on Opus 4.6 will default to 1M context automatically”라고 명시했습니다. Pro 플랜의 기본값은 200K입니다.
Q. 데스크탑 앱에서 갑자기 1M이 사라졌습니다. 어떻게 해야 하나요?
앱 업데이트 후 발생하는 알려진 버그입니다. ~/.claude/settings.json"ANTHROPIC_DEFAULT_OPUS_MODEL": "claude-opus-4-6[1m]"을 추가하고 Claude Code를 재시작하면 됩니다. 이 설정은 CLI 기준이며, 데스크탑 앱에는 아직 완전히 적용되지 않을 수 있습니다. CLI 터미널을 통해 쓰는 것이 현재 더 안정적입니다.
Q. 1M 컨텍스트를 항상 최대로 쓰는 게 유리한가요?
꼭 그렇지는 않습니다. 실사용자 커뮤니티에서는 “200K가 sweet spot”이라는 평가가 나옵니다. 컨텍스트가 지나치게 길어지면 모델이 주의를 집중해야 할 정보와 노이즈를 구분하기 어려워지는 경향이 있습니다. 단일 세션에서 모든 걸 처리하기보다 작업 단위를 나눠 명확한 범위 안에서 진행하는 방식이 실무에서 더 안정적입니다.
Q. API로 직접 쓸 때 200K 초과분에 추가 요금이 붙나요?
Claude Platform 기준으로는 더 이상 붙지 않습니다. GA 이전에는 200K 초과 구간에 Opus 4.6 입력 기준 $10/1M 토큰 프리미엄이 있었습니다. 3월 13일 이후 이 차등 요금이 사라졌습니다. Bedrock, Vertex AI, Microsoft Foundry를 통해 쓸 경우 각 플랫폼 요금 정책은 별도 확인이 필요합니다.
Q. Sonnet 4.6도 1M 컨텍스트를 지원하나요?
네. 이번 GA 공개는 Opus 4.6과 Sonnet 4.6 모두 해당됩니다. Sonnet 4.6 기준 GraphWalks BFS 벤치마크 1M 토큰 정확도는 68.4%입니다. Opus보다는 낮지만 Claude Platform과 Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry 모두에서 이용 가능합니다.

▲ 목차로 돌아가기

마치며

Claude Code 1M 컨텍스트 GA는 실제로 의미 있는 변화입니다. 요금 차등이 사라지고, 미디어 한도가 6배 늘었고, compaction 빈도가 줄었습니다. MRCR v2 기준 이전 세대 대비 4배 가까운 정확도 차이는 단순 마케팅 수치가 아닙니다.

다만 1M 컨텍스트가 모든 상황에서 더 낫지는 않습니다. 세션이 길어질수록 context poisoning 위험이 생기고, 작업 누락 패턴도 실사용에서 보고됩니다. 숫자가 크다고 무조건 최대로 쓰는 것보다, 작업 단위를 명확하게 나눠 진행하는 게 실무에서는 더 안정적입니다.

Pro 플랜에서 1M이 안 된다는 점도 놓치기 쉬운 부분입니다. Claude Code는 쓸 수 있지만 1M은 Max부터입니다. 플랜 전환을 고려 중이라면 이 차이를 먼저 따져보는 게 순서입니다.

📎 본 포스팅 참고 자료
  1. Anthropic 공식 블로그 — 1M Context GA 발표 (2026.03.13)
  2. Anthropic 공식 뉴스 — Claude Opus 4.6 출시 (2026.02.05)
  3. Anthropic Claude Platform 공식 가격 정책
  4. Reddit r/ClaudeCode — 1M 컨텍스트 실사용 한계 보고 (2026.03.16)
  5. Reddit r/ClaudeCode — 앱 업데이트 후 1M 사라지는 버그 (2026.03.20)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 본문 내 모든 수치는 2026.03.13 GA 공식 발표 및 2026.03.25 기준이며, 이후 Anthropic의 업데이트로 달라질 수 있습니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기