Claude Code 1M, Pro로 썼더니 막혔습니다

Published on

in

Claude Code 1M, Pro로 썼더니 막혔습니다

📅 2026.03.13 기준 / Claude Code Opus 4.6 · Sonnet 4.6 기준
TECH

Claude Code 1M, Pro로 썼더니 막혔습니다

2026년 3월 13일, Anthropic이 Claude Opus 4.6·Sonnet 4.6의 1M 컨텍스트 윈도우를 정식 출시했습니다. 추가 요금도 없앴다는 발표에 Claude Code 커뮤니티가 환호했죠. 그런데 막상 Pro 플랜에서 켜려고 하면 오류가 납니다. 이 글은 그 이유와 실제 비용 구조, 그리고 1M 창이 넓어졌을 때 생기는 새로운 함정을 공식 수치로 짚은 기록입니다.

1,000,000
토큰 컨텍스트 윈도우 (정식 GA)
78.3%
MRCR v2 장문 회상 점수 (Opus 4.6)
$4.50
900K 세션 입력 토큰 비용 (Opus 4.6)

정식 출시 맞는데, 왜 오류가 날까요?

2026년 3월 13일 Anthropic은 Claude Opus 4.6·Sonnet 4.6의 1M 컨텍스트 윈도우를 정식 GA(General Availability)로 전환했습니다. 발표문에는 “표준 요금이 전체 1M 창에 동일하게 적용된다”고 명시돼 있고, Claude Code Max·Team·Enterprise 플랜 사용자는 Opus 4.6에서 자동으로 활성화된다고 나와 있습니다. (출처: Anthropic 공식 블로그, claude.com/blog/1m-context-ga, 2026.03.13)

그런데 같은 날 Reddit r/ClaudeCode에는 /model opus[1m]을 실행했을 때 "The long context beta is not yet available for this subscription." 오류가 반복된다는 글이 수십 건 올라왔습니다. Pro 구독자였던 사람들이 대부분이었습니다.

이유는 공식 문서에 있습니다. Claude Code 공식 문서(code.claude.com/docs/en/model-config#extended-context)에 따르면 1M 컨텍스트 접근 구조는 플랜별로 다릅니다.

💡 공식 문서에서 직접 확인한 플랜별 접근 구조

플랜 1M 컨텍스트 접근 방식 자동 활성화
API · Pay-as-you-go 전체 접근 ✅ 자동
Max · Team · Enterprise Opus 4.6 기준 자동 포함 ✅ 자동
Pro /extra-usage 명령어 수동 opt-in 필요 ❌ 수동

Pro 플랜은 Claude Code에서 /extra-usage를 직접 입력해야 1M 창이 열립니다. 이것이 “정식 출시됐는데 왜 안 되지?”라는 질문의 정답입니다. 발표문에는 이 차이가 작은 글씨에 묻혀 있었습니다.

▲ 목차로 돌아가기

추가 요금 없앴다는데, 이 경우는 아닙니다

Anthropic 발표의 핵심 문구는 “One price, full context window. No long-context premium.”였습니다. 2025년 8월 베타 당시 Opus 4.6 입력 토큰은 200K 초과 시 $5/MTok에서 $10/MTok으로 2배 뛰었습니다. 이 추가 요금이 이번 GA에서 사라진 것은 맞습니다. (출처: Anthropic 공식 블로그, claude.com/blog/1m-context, 2025.08.12)

그런데 이 “무료 전환”은 API 과금 사용자에게 해당하는 이야기입니다. Pro·Max 구독 사용자에게 1M은 여전히 구독 요금 외 별도 과금이 붙는 extra usage 방식으로 동작합니다. 200K 토큰을 넘는 순간부터 구독에 포함된 사용량이 아니라 추가 과금으로 전환됩니다. 공식 문서(code.claude.com/docs/en/model-config#extended-context)의 표현을 그대로 옮기면 “Beyond 200K tokens, requests are charged at long-context pricing with dedicated rate limits. For subscribers, tokens beyond 200K are billed as extra usage rather than through the subscription.”입니다. 이 말은 $100/월 Max 플랜을 쓰더라도 200K를 넘으면 구독 사용량이 아닌 별도 청구로 빠진다는 뜻입니다.

💡 공식 발표문과 실제 과금 흐름을 같이 놓고 보니 이런 차이가 보였습니다

발표문: “표준 요금, 추가 요금 없음” → API 사용자 기준으로 200K 초과 프리미엄 2배 요금 폐지
구독 사용자: 200K 이후는 구독 포함이 아닌 별도 extra usage 청구 (변동 없음)

즉, API 요금 구조가 개선된 것이지, 구독 사용량 정책이 바뀐 것이 아닙니다.

이 구분을 모르고 $200/월 Max 플랜을 쓰면서 “이제 1M이 공짜로 포함됐겠지”라고 생각하면, 월말 청구서에서 예상 외 금액을 마주하게 됩니다. 실제로 커뮤니티에서 Max 20x 구독자가 “내 플랜에서 1M을 하루 종일 쓸 수 있었는데 다음 날 사라졌다”고 보고한 사례가 있습니다. extra usage 한도를 소진한 결과입니다.

▲ 목차로 돌아가기

창이 커질수록 비용이 터지는 구조

API 사용자 기준으로 실제 비용을 계산해 보겠습니다. Anthropic 공식 가격표(anthropic.com/pricing, 2026.03.13 기준)에 따르면 Opus 4.6 입력 토큰 요금은 $5/MTok(백만 토큰당 5달러), 출력은 $25/MTok입니다. Sonnet 4.6은 입력 $3/MTok, 출력 $15/MTok입니다.

📊 Opus 4.6 기준 세션 규모별 입력 비용 계산 (직접 따라할 수 있는 형태)

계산식: 입력 토큰 수 ÷ 1,000,000 × $5 = 세션 입력 비용

세션 입력 규모 입력 비용 실생활 의미
9K 토큰 $0.045 일반 코드 리뷰 1회 수준
200K 토큰 $1.00 중형 프로젝트 전체 코드베이스
500K 토큰 $2.50 대형 코드베이스 + 문서 병합
900K 토큰 $4.50 단 1회 세션, 커피 한 잔 값

900K 입력 1회에 $4.50이라는 수치가 말하는 것은 이렇습니다. 하루에 대형 세션을 3번만 돌려도 입력 비용만 $13.50, 여기에 출력 토큰이 더해집니다. Claude Code 공식 문서(code.claude.com/docs/en/costs)에 따르면 “구독 없이 API 기준 Sonnet 4.6 사용 시 평균 개발자 1인당 하루 약 $6, 상위 10% 사용자는 $12 이상”이 됩니다. 이것은 1M을 본격 쓰기 전 평균치입니다.

실제 사례로 더 구체적인 위험이 있습니다. 한 개발자는 Cursor에서 Claude 1M 창을 열었다가 AI 툴콜 하나가 데이터베이스 전체를 당겨와 단 1회 호출에 800K 토큰을 소진한 경험을 공유했습니다. 컨텍스트 창이 커지면 “얼마나 넣을지”를 더 신중하게 설계해야 하는 이유입니다. 넓어진 창은 비용 폭발의 스케일도 함께 키웁니다.

Anthropic이 제공하는 /cost 명령어를 주기적으로 실행하거나 상태 표시줄에 컨텍스트 사용량을 표시하는 설정(code.claude.com/docs/en/statusline#context-window-usage)을 켜 두는 것이 장기 세션에서 가장 현실적인 방어선입니다.

▲ 목차로 돌아가기

컨텍스트가 길어야 의미 있는 조건이 따로 있습니다

1M 토큰이 유용한 것과 “당연히 잘 기억하겠지”는 다른 이야기입니다. Anthropic의 GA 발표에는 Opus 4.6이 MRCR v2 벤치마크에서 78.3%를 기록했다고 나와 있습니다. 이 벤치마크는 3,000페이지 분량 문서에 숨겨진 두 가지 사실을 모두 찾아내는 비율을 측정합니다. 이전 최고 Claude 모델은 18.5%, Gemini 3.1 Pro는 26.3%였습니다. (출처: Anthropic 공식 블로그, claude.com/blog/1m-context-ga, 2026.03.13)

78.3%라는 수치가 의미하는 것은 이렇습니다. 100번 중 약 22번은 전체 문서를 넣었어도 숨겨진 정보를 놓친다는 뜻입니다. 그리고 이 벤치마크는 Anthropic이 직접 발표한 수치라 독립 검증은 아직 진행 중입니다. 여러 개발자들이 “context rot”라고 부르는 현상, 즉 창의 중간 구간 정보를 양 끝보다 덜 정확하게 처리하는 문제도 여전히 보고되고 있습니다.

실제로 효과가 명확하게 나타난 사례들을 보면 공통점이 있습니다. 특정 파일, 특정 함수, 특정 결정 사항을 명확히 참조해야 하는 긴 세션에서 compaction 없이 유지되는 것이 핵심이었습니다. Anthropic GA 발표에 인용된 기업 사례에서는 1M 전환 후 compaction 이벤트가 15% 감소했다고 밝히고 있습니다. 이는 “잊기 직전에 자동 요약이 트리거되는 빈도”가 줄었다는 뜻으로, 실제로 측정 가능한 워크플로 개선입니다.

✅ 1M이 실제로 효과적인 상황 vs 주의가 필요한 상황

효과적인 상황

  • 75,000줄 이상 코드베이스 전체 참조
  • 100페이지 이상 문서 교차 분석
  • 장시간 에이전트 세션 (compaction 방지)
  • 600개 이미지/PDF 한 번에 처리

주의가 필요한 상황

  • MCP로 대용량 DB 전체를 무차별 pull
  • 에이전트 팀 구성 (각 인스턴스별 1M 과금)
  • 중간 구간 정보 정밀 참조 필요 작업
  • 루프 반복 작업 (토큰 누적 폭발 위험)

▲ 목차로 돌아가기

GPT-5.4, Gemini 3.1 Pro와 나란히 놓으면

컨텍스트 창 크기만 비교하면 Claude만 큰 게 아닙니다. GPT-5.4도 1.05M 토큰을 지원하고, Gemini 3.1 Pro도 1M 창입니다. 그런데 요금 구조가 다릅니다. 이 차이가 실제 선택에서 결정적입니다.

모델 컨텍스트 창 장문 요금 구조 MRCR v2
Claude Opus 4.6 1M 토큰 단일 요금 (추가 없음) 78.3%
GPT-5.4 1.05M 토큰 272K 초과 시 입력 2배·출력 1.5배 확인 필요
GPT-4.1 1M 토큰 단일 요금 ($2/MTok, 추가 없음) 확인 필요
Gemini 3.1 Pro 1M 토큰 확인 필요 26.3%

GPT-5.4의 272K 초과 요금 구조가 실제로 어떤 의미인지 구체적으로 계산하면 이렇습니다. 300K 토큰 요청 하나가 250K 토큰 요청보다 약 2배 비용이 나옵니다. 그것도 초과분이 아니라 전체 세션에 소급 적용됩니다. 개발 중에는 세션이 얼마나 커졌는지 실시간으로 체크하기 어렵기 때문에 월말 청구서에서 예상치 못한 금액을 발견하는 경우가 생깁니다. (출처: karozieminski.substack.com 분석, 2026.03.16 기준)

MRCR v2 점수만 놓으면 Opus 4.6(78.3%) vs Gemini 3.1 Pro(26.3%)는 약 3배 차이입니다. 단순한 창 크기 경쟁이 아니라, “그 창 안에서 얼마나 정확하게 읽느냐”가 실제 사용성을 결정한다는 것을 보여주는 수치입니다. 단, 이 수치는 Anthropic 자체 발표이므로 독립 기관의 검증 결과가 나오기 전까지는 “약”으로 해석하는 것이 적절합니다.

▲ 목차로 돌아가기

공식 발표와 실제 사용 흐름을 같이 보니 보인 것

이번 GA 발표 전체를 공식 문서, 요금 구조, 커뮤니티 반응을 함께 놓고 보면 하나의 패턴이 보입니다. Anthropic의 매출 구조에서 API 과금이 약 70~75%, Claude Code 관련 매출이 약 18%를 차지한다는 분석이 있습니다. (출처: karozieminski.substack.com, 2026.03 추정치 — 공식 수치는 미공개이므로 추정으로 표기) 이 구조에서 Anthropic이 돈을 버는 방식은 사람들이 Claude를 “진지한 작업”에 쓰는 것입니다.

💡 요금 구조 변경이 사업 전략으로 읽히는 이유

200K 초과 2배 요금은 API로 장시간 프로덕션 워크플로를 돌리는 기업들에게 마찰이었습니다. 그 마찰을 없애면 기업들이 Claude를 프로덕션에 더 깊이 넣습니다. 더 깊이 들어갈수록 토큰 볼륨이 늘고, 볼륨이 Anthropic 매출로 직결됩니다. Pro 사용자에게는 여전히 extra usage 방식을 유지함으로써 마진을 보호하면서 기업 시장을 열었습니다. 이 구조는 Anthropic이 2026년 2월 $380억 기업가치로 $300억 투자를 유치한 이후 매출 확대 경로와 일치합니다. (출처: karozieminski.substack.com, 2026.03 기준 연환산 매출 약 $190억 추정)

이 흐름이 사용자 입장에서 의미하는 것은 이렇습니다. 3월 13일부터 3월 28일까지 진행되는 “March 2026 Usage Promotion”(평일 오프피크 시간대 사용량 2배 제공)도 같은 맥락입니다. 오프피크 서버 여유분을 활용해 사용자들이 1M 창을 직접 경험하게 유도하는 것입니다. 공식 공지(support.claude.com/en/articles/14063676-claude-march-2026-usage-promotion, 2026.03.13)에 따르면 이 프로모션은 Free, Pro, Max, Team 플랜에 적용되며, 추가 행동 없이 자동으로 적용됩니다. 이 기간 동안 1M 세션을 무리하게 길게 돌려도 extra usage 과금은 별도로 붙을 수 있습니다.

결국 1M 컨텍스트 GA는 기능 완성이 아니라 전략적 전환점에 가깝습니다. API 개발자에게는 비용 장벽이 낮아진 것이고, 구독 사용자에게는 더 큰 창을 써보게 유도하되 그 비용은 구독 외로 분리된 구조입니다. 이 차이를 모르면 쓸수록 손해입니다.

▲ 목차로 돌아가기

Q&A 5가지

Q1. Pro 플랜에서 1M 컨텍스트를 쓰려면 정확히 어떻게 해야 하나요?

Claude Code 터미널에서 /extra-usage를 입력해 활성화한 후, /model sonnet[1m] 또는 /model opus[1m]으로 모델을 지정해야 합니다. 200K를 넘는 순간부터 구독 사용량이 아닌 별도 extra usage로 청구됩니다. (출처: code.claude.com/docs/en/model-config#extended-context)
Q2. Max 플랜은 1M이 자동으로 포함된다고 했는데, 추가 요금이 없나요?

Max·Team·Enterprise 플랜에서 Opus 4.6은 자동으로 1M 창을 사용합니다. 그러나 200K 이상 구간은 구독에 포함된 사용량이 아닌 extra usage로 처리됩니다. 따라서 자동 활성화와 무제한 포함은 다른 개념입니다. 실제 청구 내역을 주기적으로 확인하는 것이 필요합니다.
Q3. 1M 창이 있어도 대화 중간에 잊어버리는 현상이 있나요?

네, 있습니다. MRCR v2 점수가 78.3%라는 것은 약 22%의 경우 정보를 놓친다는 의미입니다. 특히 창의 중간 구간에 위치한 정보가 양 끝보다 덜 정확하게 처리되는 “context rot” 현상이 여전히 보고되고 있습니다. 중요한 아키텍처 결정이나 참조 정보는 CLAUDE.md나 별도 파일로 명시적으로 고정하는 것이 현재로서는 더 안전한 방법입니다.
Q4. Sonnet 4.6도 1M을 쓸 수 있나요? 비용은 어떻게 되나요?

네, 가능합니다. Sonnet 4.6은 입력 $3/MTok, 출력 $15/MTok으로 Opus 4.6($5/$25)보다 저렴합니다. 동일한 단일 요금 정책이 적용됩니다. 코딩 보조나 에이전트 하위 작업에는 Sonnet 4.6으로 시작해 비용을 관리하고, 복잡한 추론이 필요한 구간에만 Opus를 쓰는 것이 현실적인 전략입니다. (출처: Anthropic 공식 가격 페이지, anthropic.com/pricing, 2026.03.13 기준)
Q5. 3월 사용량 2배 프로모션이 있다는데, 이 기간에 1M을 쓰면 extra usage도 공짜인가요?

아닙니다. March 2026 Usage Promotion(2026.03.13~03.28)은 평일 오프피크 시간대에 5시간 사용량이 2배로 늘어나는 것입니다. 이 사용량 한도와 extra usage 과금은 별개입니다. 200K를 넘는 1M 세션은 프로모션과 관계없이 extra usage로 청구됩니다. 다만 기본 사용 한도가 2배이므로 더 길게 일반 세션을 돌릴 수 있는 좋은 시점이기는 합니다. (출처: support.claude.com/en/articles/14063676)

▲ 목차로 돌아가기

마치며

Claude Code 1M 컨텍스트 GA는 진짜 의미 있는 업데이트입니다. API 개발자 입장에서 200K 초과 2배 요금이 사라진 것, compaction 없이 대형 코드베이스를 한 세션에 담을 수 있게 된 것은 체감 가능한 변화입니다. MRCR v2 78.3%가 맞다면 이전 모델 대비 4배 이상의 회상 정확도는 실제 작업 품질을 끌어올리는 수치이기도 합니다.

다만 이걸 구독 사용자 관점에서 읽으면 다릅니다. Pro는 opt-in이 필요하고, 구독 플랜 어디서도 1M이 무제한 포함된 적은 없습니다. 발표가 API 사용자 기준으로 쓰여 있고, 구독 사용자 관련 내용은 공식 문서 깊은 곳에 조용히 있습니다. 이 간극을 모르면 “이제 다 됐구나”라고 생각하다가 extra usage 청구서를 받게 됩니다.

컨텍스트 창이 넓어질수록 “무엇을 넣을지 설계”하는 능력이 더 중요해집니다. 1M이 열렸다고 무조건 채우면 비용이 먼저 터집니다. 지금 당장 쓸 계획이 있다면 /cost 명령어를 습관처럼 확인하고, 상태 표시줄에 컨텍스트 사용량을 표시하는 설정을 켜 두는 것부터 시작하는 게 현실적입니다.

▲ 목차로 돌아가기

📚 본 포스팅 참고 자료

  1. Anthropic 공식 블로그 — 1M Context GA 발표 (claude.com/blog/1m-context-ga, 2026.03.13)
  2. Anthropic 공식 블로그 — 1M Context 베타 발표 (claude.com/blog/1m-context, 2025.08.12)
  3. Anthropic 공식 요금 페이지 (anthropic.com/pricing, 2026.03.13 기준)
  4. Claude Code 공식 비용 문서 (code.claude.com/docs/en/costs)
  5. Claude March 2026 Usage Promotion 공식 안내 (support.claude.com, 2026.03.13)
  6. Karo Zieminski — Claude 1M Context 심층 분석 (karozieminski.substack.com, 2026.03.16)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 본문의 가격·기능·플랜 정책은 2026년 3월 13일 기준이며, 최신 정보는 Anthropic 공식 사이트에서 직접 확인하시기 바랍니다. 추정 수치는 “추정” 또는 “약”으로 별도 표기했습니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기