Claude Code 1M 컨텍스트, Pro 플랜은 자동이 아닙니다

Published on

in

Claude Code 1M 컨텍스트, Pro 플랜은 자동이 아닙니다

2026.03.13 GA 기준
Claude Code
Opus 4.6 / Sonnet 4.6

Claude Code 1M 컨텍스트, Pro 플랜은 자동이 아닙니다

2026년 3월 13일, Anthropic이 Claude Opus 4.6·Sonnet 4.6의 100만 토큰 컨텍스트 윈도우를 정식 출시했습니다. “무료로 다 된다”는 말이 빠르게 퍼졌지만, 요금제별로 작동 방식이 다릅니다. 공식 문서와 실사용 보고를 교차해서 확인하니 놓치기 쉬운 조건들이 있었습니다.

100만
토큰 컨텍스트 윈도우 GA
78.3%
MRCR v2 정확도 (Opus 4.6)
15%↓
컴팩션 이벤트 감소

1M 컨텍스트가 정확히 무엇이 달라졌나

2026년 3월 13일 공식 발표 이전, 개발자들이 API에서 Opus 4.6을 쓸 때 입력 토큰이 200K를 넘으면 단가가 자동으로 올랐습니다. Opus 4.6 기준으로 200K 초과 시 입력 1M당 $5 → $10, 출력은 $25 → $37.50으로 뛰었습니다. (출처: Anthropic, 2026.02.05 Introducing Claude Opus 4.6) 즉, 긴 세션을 쓸수록 단가가 갑자기 2배가 되는 구조였습니다.

3월 13일 GA 발표 이후 이 할증이 사라졌습니다. Opus 4.6은 전 구간 $5/$25, Sonnet 4.6은 전 구간 $3/$15로 통일됐고, “900K짜리 요청이나 9K짜리 요청이나 토큰당 단가가 같다”는 게 공식 원문의 표현입니다. (출처: Anthropic 공식 블로그, 2026.03.13)

💡 공식 발표문과 2월 초 출시 노트를 같이 놓고 보니 이런 차이가 보였습니다 — GA 이전까지 API에서 200K를 넘기면 전체 세션에 할증이 붙었습니다. 200K 초과분만이 아니라, 그 세션 전체 토큰이 높은 단가로 재계산되는 방식이었습니다. GA 이후 해당 구조가 완전히 사라진 게 핵심입니다.

미디어 한도도 달라졌습니다. 기존 1회 요청당 이미지 또는 PDF 100페이지가 상한이었는데, 600개·600페이지로 늘었습니다. 이건 코드 리뷰보다 법률·연구 문서 다중 분석 쪽에서 더 직접적으로 쓸 수 있는 변화입니다.

▲ 목차로 돌아가기

Pro 플랜은 자동이 아닌 이유가 있습니다

공식 블로그 발표가 나자마자 “이제 Pro도 1M 컨텍스트를 쓸 수 있다”는 글이 빠르게 퍼졌습니다. 틀린 말은 아니지만 전부도 아닙니다. Anthropic 공식 블로그(2026.03.13)에는 이렇게 나옵니다.

“Claude Code Max, Team, and Enterprise users on Opus 4.6 will default to 1M context automatically.”

(출처: Anthropic 공식 블로그, 2026.03.13)

Max, Team, Enterprise에는 자동 적용. Pro는 빠져 있습니다. Pro 플랜에서 Claude Code의 1M 컨텍스트를 활성화하려면 Claude Code 터미널에서 /extra-usage 명령어를 직접 입력해야 합니다. 이걸 모르고 Pro에서 긴 세션을 돌리면, 200K를 넘긴 시점에 컴팩션이 발생하거나 세션이 제한될 수 있습니다.

💡 Substack 분석가 Karo Zieminski(2026.03.16)는 이 구조를 “Anthropic이 의도적으로 만든 업그레이드 신호”라고 분석했습니다. Max·Team·Enterprise를 쓰는 사람만 자동으로 혜택을 받고, Pro는 직접 설정을 해야 작동합니다. 마진을 지키면서 상위 플랜의 가치를 살리는 방식입니다.

또 하나 — 공식 GitHub 이슈(claude-code #26557, 2026.02.18)에서는 /model sonnet[1m]을 Max 플랜에서 실행했을 때 “Sonnet 4.6 with 1M context is not available for your account” 오류가 발생했다는 보고가 있습니다. GA 이전에는 Opus 1M조차 구독 사용자에게는 막혀 있었다는 증거입니다. GA 이후 해당 제한이 해소됐지만, Pro 자동 적용 이슈는 지금도 남아 있습니다.

▲ 목차로 돌아가기

900K 세션이면 실제로 얼마나 나올까

무료 or 정액 구독 안에서 Claude Code를 쓴다면 추가 토큰 과금은 없습니다. 하지만 API를 직접 호출해 서비스를 만든다면 얘기가 달라집니다. GA 이후의 단가로 직접 계산해 보겠습니다.

시나리오 입력 토큰 Opus 4.6 비용 Sonnet 4.6 비용
짧은 세션 9K 토큰 약 $0.045 약 $0.027
중간 세션 200K 토큰 약 $1.00 약 $0.60
대형 세션 900K 토큰 약 $4.50 약 $2.70
풀 컨텍스트 1M 토큰 약 $5.00 약 $3.00

※ 입력 토큰 기준, 출력 토큰 미포함 계산. 출력 발생 시 Opus 4.6 $25/M, Sonnet 4.6 $15/M 추가 적용. (출처: Anthropic 공식 가격 페이지, claude.com/pricing#api)

900K 세션 입력만 $4.50입니다. 출력까지 포함하면 10달러를 쉽게 넘습니다. 이게 1회 요청 기준입니다. 루프 방식으로 에이전트를 돌린다면 하루 예산이 순식간에 소진됩니다.

실제로 한 개발자가 Cursor 내에서 Claude Code를 쓰다가 단일 툴 호출 한 번에 80만 토큰이 빨려 들어간 사례를 보고했습니다. DB 전체를 한 번에 끌어다 컨텍스트에 쑤셔 넣은 결과였습니다. 컨텍스트 창이 커진다고 무작정 다 넣을 게 아니라, 뭘 넣을지 설계하는 게 더 중요해졌습니다.

▲ 목차로 돌아가기

GPT-5.4와 가격 구조가 다른 지점이 있습니다

GPT-5.4도 API에서 1.05M 토큰을 지원합니다. 그런데 단가 구조가 다릅니다. OpenAI는 272K 입력 토큰을 기준선으로 씁니다. 이 경계를 넘는 순간, 그 세션의 전체 토큰에 2배 단가가 붙습니다. 초과분에만 붙는 게 아닙니다.

💡 GPT-5.4 API 가격표와 Claude 가격표를 같이 놓고 보니 이런 차이가 있었습니다 — 300K 입력 요청과 250K 입력 요청을 각각 GPT-5.4로 보내면 비용 차이가 2배가 납니다. 토큰이 50K 더 많은 게 아니라, 임계값 초과로 인해 전체 요금이 2배가 됩니다. Claude는 이 임계값 자체가 없습니다.

항목 Claude Opus 4.6 (GA 이후) GPT-5.4 API
기본 입력 단가 $5/M $2.50/M
할증 임계값 없음 272K 초과 시 전체 2배
300K 입력 비용 $1.50 $1.50 (2배 적용 = $3.00)
최대 컨텍스트 1M 토큰 약 1.05M 토큰

※ GPT-5.4 272K 임계값 이후 단가는 공식 API 가격 페이지 기준 추정. 공식 공지에서 별도 상한선을 밝히지 않았습니다. (출처: Karo Zieminski, 2026.03.16 / devtk.ai, 2026.02.24)

단, GPT-4.1은 다릅니다. GPT-4.1은 1M 토큰 전 구간 $2/M으로 단일 단가를 씁니다. 할증 없는 플랫 구조입니다. 비용만 기준으로 보면 GPT-4.1과 Claude Sonnet 4.6이 경쟁 관계가 됩니다. 어떤 모델을 쓸지는 성능보다 비용 설계에 따라 갈릴 수 있습니다.

▲ 목차로 돌아가기

컨텍스트가 커도 조심해야 할 함정이 남아 있습니다

Opus 4.6의 MRCR v2 점수는 78.3%입니다. 직전 모델인 Sonnet 4.5가 18.5%였으니 4배 이상 도약입니다. (출처: Anthropic 공식 블로그, 2026.03.13) 수치만 보면 대단합니다. 그런데 78.3%는 뒤집어 보면 21.7%는 찾지 못한다는 뜻이기도 합니다.

Hacker News 댓글에서 한 개발자는 이렇게 표현했습니다. “Opus가 문제를 만나면 ‘더 단순한 방법이 있다’며 방향을 바꾸는데, 그게 내가 명시적으로 기각한 방향이었다.” 컨텍스트 창이 커져도 초반 세션에서 내린 결정을 나중에 무시하는 행동이 여전히 보인다는 지적입니다. Anthropic이 공식 답변을 내놓지 않은 부분입니다.

🔍 실사용 한계 3가지 — 공식 발표에서 다루지 않은 부분

  • 컨텍스트 중간 구간 망각: 창 앞뒤보다 중간에 묻힌 내용이 더 자주 무시됩니다. AlphaSignal 분석에서 지적된 패턴입니다.
  • 비용 폭발: 에이전트 루프에서 큰 DB나 로그 파일을 통째로 끌어오면 단일 실행에 $10 이상 쓰는 사례가 실제로 보고됐습니다.
  • Compaction이 사라지는 게 항상 좋은 건 아닙니다: Compaction은 불필요한 내용을 줄여 다음 작업 집중도를 높이는 역할도 합니다. 15% 감소는 이점이지만, 극단적으로 긴 컨텍스트에서 관련 없는 초반 내용이 모델의 주의를 분산시킬 수 있습니다.

500K에서 1M으로 올렸더니 오히려 토큰을 덜 쓰더라는 역설적인 현장 보고도 있습니다. Izzy Miller(AI Research Lead)는 “컨텍스트를 200k에서 500k로 늘렸을 때 에이전트가 오히려 더 효율적으로 돌았다”고 Anthropic 공식 블로그에서 언급했습니다. 창이 클수록 요약·압축 오버헤드가 줄어 전체 토큰 사용이 줄어드는 것입니다.

▲ 목차로 돌아가기

어떤 요금제가 실제로 유리한가

Claude Code 안에서 1M 컨텍스트를 쓰는 경우를 기준으로 각 플랜을 정리했습니다. API 직접 호출은 별도 계산이 필요합니다.

요금제 월 구독료 1M 컨텍스트 자동 적용 사용 방법
Free $0 3월 프로모션 기간 한시 체험
Pro $20/월 ❌ 수동 설정 필요 /extra-usage 직접 입력
Max 5x $100/월 ✅ 자동 Opus 4.6 기본 적용
Max 20x $200/월 ✅ 자동 Opus 4.6 기본 적용
Team / Enterprise $25+ /시트 ✅ 자동 Opus 4.6 기본 적용

※ 구독료는 연간 결제 기준. 월별 결제 시 Pro $20, Max 5x $100, Max 20x $200. (출처: claude.com/pricing, 2026.03.26 기준)

솔직히 말하면, Pro 플랜에서 긴 코드 세션을 자주 쓴다면 수동 설정을 까먹는 순간 컴팩션으로 컨텍스트가 잘립니다. 이 경험이 반복된다면 Max 5x로 올리는 게 오히려 번거로움을 줄여줍니다. 반대로 API를 직접 쓰는 개발자라면, 3월 13일 이후 단가 변화를 다시 계산해 볼 필요가 있습니다.

▲ 목차로 돌아가기

Q&A

Q1. Pro 플랜에서 /extra-usage를 입력하면 추가 요금이 붙나요?

Claude Code 구독 안에서는 추가 토큰 과금이 없습니다. /extra-usage는 단지 1M 컨텍스트 윈도우 기능을 켜는 명령어입니다. 다만 Pro 플랜의 주간 사용 한도 안에서 소진됩니다. API를 직접 쓰는 경우에는 입력 토큰 단가($5/M for Opus, $3/M for Sonnet)가 그대로 적용됩니다.

Q2. GA 이전에 API로 Opus 4.6을 썼다면 1M 컨텍스트를 못 썼나요?

반은 맞고 반은 틀립니다. API를 통해 1M 컨텍스트를 요청하려면 베타 헤더를 별도로 추가해야 했고, 200K 초과 시 프리미엄 단가($10/$37.50)가 붙었습니다. GA 이후 베타 헤더는 필요 없어졌고, 단가 할증도 사라졌습니다. 구독 사용자(Pro·Max)는 2월 Opus 4.6 출시 시점에는 1M 접근 자체가 제한됐습니다.

Q3. Sonnet 4.6도 1M 컨텍스트를 쓸 수 있나요?

가능합니다. GA 발표는 Opus 4.6과 Sonnet 4.6 모두에 적용됩니다. 다만 Claude Code 안에서 Max·Team·Enterprise 플랜이 기본으로 쓰는 모델은 Opus 4.6입니다. Sonnet 4.6 1M은 API 직접 호출이나 /model 명령어로 선택할 수 있습니다.

Q4. MRCR v2 78.3%가 실제로 얼마나 신뢰할 수 있는 수치인가요?

Anthropic 자체 발표 수치입니다. 독립적인 제3자 검증은 아직 공개되지 않았습니다. 공식 블로그에서 인용한 수치이므로 참고는 가능하지만, HuggingFace MRCR v2 데이터셋을 기반으로 한 외부 재현 결과가 나오면 업데이트될 수 있습니다. 실사용에서는 특히 중간 구간 정보 인출이 불안정하다는 보고가 별도로 존재합니다.

Q5. Amazon Bedrock이나 Google Vertex AI에서도 동일하게 적용되나요?

공식 블로그에서 “Claude Platform natively and through Amazon Bedrock, Google Cloud’s Vertex AI, and Microsoft Foundry”에서 사용 가능하다고 밝혔습니다. 단, 각 플랫폼의 자체 요금 체계가 Anthropic 직접 API와 다를 수 있습니다. 각 플랫폼 별 가격 페이지에서 별도 확인이 필요합니다.

▲ 목차로 돌아가기

마치며 — 총평

Claude Code 1M 컨텍스트 GA는 실질적인 변화입니다. 2월 초 출시 당시 API 베타·구독 제한이라는 이중 장벽이 있었고, 그 장벽이 3월 13일에 없어진 겁니다. 단순히 기능이 추가된 게 아니라, 비용 구조가 바뀌었습니다.

Pro 플랜을 쓰는 개발자라면 /extra-usage를 한 번 입력해 두는 게 좋습니다. 자동 적용이 아니라는 걸 모르면 여전히 200K 제한 안에서 컴팩션과 싸우게 됩니다. API로 서비스를 만든다면 900K 세션의 입력 비용이 $4.50이라는 수치를 먼저 설계에 반영하는 게 맞습니다.

컨텍스트가 크다고 다 쓸 필요는 없습니다. 뭘 어디까지 넣을지 먼저 정하면 비용도, 품질도 같이 잡힙니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. Anthropic 공식 블로그 — 1M Context GA 발표 (claude.com/blog/1m-context-ga)
  2. Anthropic 공식 뉴스 — Claude Opus 4.6 출시 발표 (anthropic.com/news/claude-opus-4-6)
  3. Anthropic 공식 가격 페이지 (claude.com/pricing#api)
  4. GitHub — anthropics/claude-code Issue #26557 (Sonnet 1M Max 플랜 버그 보고)
  5. Karo Zieminski, Substack — “Claude’s 1M Context Window: What Changed and When It’s Worth Using” (2026.03.16)
  6. claudecodecamp.com — “Claude Code 1M Context Window: Cost, Limits, and When to Use It” (2026.03.13)
  7. devtk.ai — “OpenAI API Pricing 2026: GPT-5, GPT-4.1, o3 Per-Token Costs” (2026.02.24)

본 포스팅은 2026년 3월 26일 공개된 공식 자료를 기반으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 특히 API 가격 및 요금제 조건은 Anthropic의 정책에 따라 수시로 업데이트될 수 있으니, 최종 결정 전 공식 페이지에서 반드시 재확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기