Claude Code 1M 컨텍스트, 이 조건엔 자동이 아닙니다

Published on

in

Claude Code 1M 컨텍스트, 이 조건엔 자동이 아닙니다

2026.03.13 기준 / Claude Code Opus 4.6 · Sonnet 4.6 기준

Claude Code 1M 컨텍스트,
이 조건엔 자동이 아닙니다

2026년 3월 13일, Anthropic이 Claude Code에 100만 토큰 컨텍스트 윈도우를 정식 출시했습니다.
발표문에는 “자동 적용”이라고 나와 있지만, 그게 모든 플랜에 해당되는 얘기는 아닙니다.
요금 프리미엄도 사라지고, 성능 수치도 인상적이지만 — 막상 써보면 걸리는 조건이 있습니다.

78.3%
MRCR v2 정확도
(Opus 4.6 1M 기준)
15%↓
컴팩션 이벤트 감소
(Anthropic 공식 발표)
0원
장문 컨텍스트 추가
요금 프리미엄

무엇이 달라졌는가 — 3월 13일 변경 사항 요약

Claude Code 1M 컨텍스트는 2026년 3월 13일, Anthropic이 공식적으로 일반 출시(GA)를 선언하면서 달라진 서비스입니다.
이전에는 베타 헤더를 따로 추가해야 했고, 200K 토큰을 넘는 요청에는 요금 프리미엄이 붙었습니다.
(출처: Anthropic 공식 블로그, claude.com/blog/1m-context-ga, 2026.03.13)

이번 출시로 달라진 핵심은 네 가지입니다.
첫째, 요금 구조가 단일화됐습니다. 9K 토큰 요청과 900K 토큰 요청이 동일한 단가를 적용받습니다.
둘째, 베타 헤더가 필요 없어졌습니다. 기존 코드에 헤더가 있어도 무시됩니다.
셋째, 미디어 첨부 한도가 100장에서 600장으로 6배 늘어났습니다.
넷째, Claude Code에서 Max·Team·Enterprise 사용자는 Opus 4.6 세션에서 1M 컨텍스트가 자동 적용됩니다.

📌 3월 13일 변경 내용 한눈에 보기
항목 변경 전 변경 후
장문 요금 프리미엄 있음 (2배) 없음
베타 헤더 필요 여부 필요 불필요 (무시됨)
미디어 첨부 한도 100장 600장
Claude Code 자동 적용 미적용 Max·Team·Enterprise만

▲ 목차로 돌아가기

Pro 플랜에서는 자동이 아닙니다 — 직접 확인한 차이

Anthropic의 발표문을 처음 읽으면 “1M 컨텍스트가 모두에게 열렸다”는 인상을 받습니다.
기술적으로는 맞습니다. 하지만 Claude Code 안에서 실제로 작동하는 방식은 플랜마다 다릅니다.

공식 발표문에는 이렇게 나와 있습니다.
“1M context is now included in Claude Code for Max, Team, and Enterprise users with Opus 4.6.”
Pro 플랜은 이 목록에 없습니다.
(출처: Anthropic 공식 블로그, claude.com/blog/1m-context-ga, 2026.03.13)

💡 공식 발표문과 실제 적용 범위를 같이 놓고 보니 이런 차이가 보였습니다

Pro 플랜에서 Claude Code의 1M 컨텍스트를 쓰려면 Claude Code 안에서 /extra-usage 명령을 직접 입력해야 합니다.
이 단계를 생략하면 기존 200K 컨텍스트 윈도우에서 세션이 진행됩니다.
대부분의 소개글이 이 조건을 언급하지 않습니다.

이 차이가 왜 중요하냐면, Pro 플랜 사용자는 컴팩션이 발생해도 “1M이 되지 않았나?” 하고 착각하기 쉽기 때문입니다.
세션을 연 상태에서 /context 명령으로 현재 컨텍스트 윈도우를 확인해보면 바로 알 수 있습니다.
Max·Team·Enterprise는 Opus 4.6 세션을 열면 1M이 기본값입니다. Pro는 그렇지 않습니다.

Anthropic이 이 차이를 명확하게 강조하지 않은 이유는 공식 문서에서 별도로 설명되지 않았습니다.
다만 Pro 플랜에서 1M을 자동 적용하지 않는 건, 마진 보호와 업그레이드 유도 신호를 동시에 설계한 제품 전략으로 보입니다.

▲ 목차로 돌아가기

요금이 절반이 된다는 말이 맞는 경우와 아닌 경우

이번 변경에서 가장 실질적인 내용은 요금 구조입니다.
이전에는 Sonnet 4.6에서 200K 토큰을 넘으면 입력 요금이 $3/MTok에서 $6/MTok으로 2배 뛰었습니다.
Opus 4.6는 1M 컨텍스트 자체가 없었고요.
이제 둘 다 프리미엄 없이 동일 단가가 적용됩니다.
(출처: aitoolranked.com, 2026.03.16)

900K 토큰 요청 하나를 예로 들면 직관적으로 계산이 됩니다.
Sonnet 4.6 기준 변경 전이라면 200K 초과분이 $6/MTok 적용이라 입력 비용이 크게 늘었겠지만,
이제는 900K 전체에 $3/MTok이 적용됩니다. 긴 세션일수록 절감폭이 커집니다.

300K 토큰짜리 요청 하나가 250K 요청보다 약 2배 비싸지는 구조입니다.
월말 청구서에서 이 차이를 체감하는 개발자들이 적지 않습니다.
(출처: karozieminski.substack.com, 2026.03.16)

📊 장문 컨텍스트 요금 비교
모델 최대 컨텍스트 장문 프리미엄 기준 입력 요금
Claude Opus 4.6 1M 토큰 없음 $5/MTok
Claude Sonnet 4.6 1M 토큰 없음 $3/MTok
GPT-5.4 1.05M 토큰 있음 (272K 초과 시 2배) $2.5/MTok~
Gemini 2.5 Pro 1M 토큰 있음 (구간별 티어) $1.25/MTok~
* 가격은 2026년 3월 기준. 변경될 수 있습니다.

▲ 목차로 돌아가기

MRCR v2 78.3% — 숫자가 의미하는 것

“컨텍스트 윈도우가 크면 클수록 정확도가 떨어진다”는 게 기존 통념이었습니다.
실제로 기존 모델들은 문서가 길어질수록 중간에 묻힌 정보를 놓치는 패턴이 뚜렷했습니다.
Opus 4.6의 MRCR v2 벤치마크 결과는 이 통념을 정면으로 반박합니다.

MRCR v2는 3,000페이지 분량(약 1M 토큰)의 문서 안에 2개의 특정 정보를 숨겨두고,
모델이 두 가지를 모두 찾아야만 정답으로 인정하는 테스트입니다.
하나라도 빠지면 점수가 오르지 않는 엄격한 방식입니다.
Opus 4.6은 여기서 78.3%를 기록했습니다.
(출처: Anthropic 공식 블로그, claude.com/blog/1m-context-ga, 2026.03.13)

비교 수치를 보면 의미가 더 명확해집니다.
Opus 4.6은 Gemini 대비 약 3배, 이전 Claude 대비 약 4배 높은 점수입니다.
(출처: karozieminski.substack.com, 2026.03.16)
1M 토큰을 그냥 받는 것과, 그 안에서 실제로 정보를 찾는 것은 전혀 다른 문제라는 뜻입니다.

⚠️ 단, 주의가 필요한 부분

78.3%는 Anthropic 자체 발표 수치입니다. 독립적인 제3자 검증은 아직 나오지 않았습니다.
또한 일부 개발자들은 HN 스레드에서 “컨텍스트 시작 지점의 결정 사항을 모델이 뒤집는” 패턴을 보고했습니다.
긴 세션에서 초반에 내린 결정이 나중에 무시되는 이른바 ‘컨텍스트 로트(context rot)’ 현상은 1M에서도 완전히 해결되지 않았습니다.

▲ 목차로 돌아가기

1M이 오히려 비용 폭탄이 되는 상황

1M 컨텍스트가 생기면 “더 많이 넣을 수 있으니 더 좋다”고 생각하기 쉽습니다.
그런데 에이전트 루프를 쓰는 경우 이 논리가 완전히 뒤집힙니다.

Cursor 환경에서 AI 도구 호출 하나가 데이터베이스 전체를 풀어버리면서 단번에 80만 토큰을 소비한 사례가 실제로 보고됐습니다.
개발자 입장에서 코드 한 줄짜리 명령을 실행했는데 한 번에 $4 가까이 청구되는 상황이 생기는 겁니다.
Opus 4.6 기준 900K 토큰 세션 하나의 입력 비용만 계산해도 약 $4.50입니다.
반복 실행되는 에이전트라면 루프 한 번에 수십 달러가 쌓입니다.
(출처: karozieminski.substack.com, 2026.03.16)

💡 발표 내용만 보면 보이지 않는 비용 구조가 있습니다

Claude Code는 단순한 채팅이 아닙니다. 파일 읽기, 배시 명령 실행, 패치 생성, 테스트 검증이 각각 별도 API 호출로 이루어집니다.
15번의 반복 명령을 내리면 마지막 호출 하나에만 이미 20만 토큰 이상이 쌓인다는 분석이 있습니다.
(출처: medium.com/@william.couturier, 2026.03.17)
채팅 1회 교환이 1,000~5,000 토큰인 것과 달리, Claude Code는 같은 티어에서 10~100배 토큰을 소모합니다.

컨텍스트 창이 커졌다는 건 실수 하나가 커지는 창도 함께 커졌다는 뜻입니다.
프로덕션 에이전트에 1M을 붙이기 전에 .claudeignore 파일로 불필요한 파일을 제외하고, 쿼리 범위를 명확하게 좁히는 것이 먼저입니다.

▲ 목차로 돌아가기

공식 발표문과 실제 사용 흐름을 같이 놓고 보니

Anthropic의 수익 구조를 보면 이번 요금 변경의 맥락이 조금 다르게 읽힙니다.
Anthropic 전체 매출의 70~75%가 API·토큰 기반 과금에서 나오고, Claude Code가 약 18%를 차지합니다.
(출처: karozieminski.substack.com, 2026.03.16)
소비자 구독보다 개발자·기업 API 사용이 훨씬 큰 비중입니다.

그래서 200K 초과 요금 프리미엄 제거는 단순한 할인이 아닙니다.
프로덕션 워크플로우에서 Claude를 쓰기로 결정할 때 가장 큰 마찰 요인 중 하나를 없앤 겁니다.
장문 컨텍스트가 필요한 팀이 GPT-5.4 대신 Claude를 선택하게 만드는 구조적 유인입니다.
2026년 2월 기준 $380억 달러 밸류에이션으로 $300억을 조달한 Anthropic이 요금 압축을 감당할 여력은 충분합니다.
(출처: karozieminski.substack.com, 2026.03.16)

동시에 Pro 플랜의 1M 수동 활성화 설계는 이 맥락에서 완전히 이해됩니다.
Max·Team·Enterprise에만 자동 적용함으로써 Pro 사용자에게 업그레이드 이유를 명확하게 제시합니다.
1M 컨텍스트가 필요한 무거운 워크로드를 실행하는 사람이라면, 어차피 Max가 더 필요한 상황에 놓이게 되는 구조입니다.

Anthropic이 3월 13~27일 피크 외 시간대 사용량을 2배로 늘린 프로모션도 같은 맥락입니다.
오전 8시~오후 2시(ET) 외 시간대와 주말에 보너스가 적용되고, 이 보너스는 기존 주간 한도와는 별개로 추가됩니다.
(출처: medium.com/@william.couturier, 2026.03.17)
밤·주말의 GPU 서버 가동률을 높이면서 사용자 충성도를 함께 높이는 전략입니다.

▲ 목차로 돌아가기

Q&A — 자주 나오는 질문 5가지

Q1. Claude.ai 웹에서도 1M 컨텍스트가 되나요?
Claude Platform API와 Claude Code 기준으로 정식 출시된 것입니다. Claude.ai 웹·모바일·데스크톱 앱에서의 적용 범위는 Anthropic이 공식 답변을 내놓지 않은 부분입니다. API 개발자나 Claude Code 사용자 기준으로 변경이 가장 명확합니다.
Q2. Pro 플랜에서 /extra-usage를 입력하면 무제한으로 1M을 쓸 수 있나요?
아닙니다. /extra-usage는 1M 컨텍스트 윈도우를 활성화하는 명령이지, 사용량 한도 자체를 높이는 것이 아닙니다. Pro 플랜에는 여전히 5시간 롤링 사용량, 주간 한도, 분당 토큰 한도(TPM)가 별개로 존재합니다. 1M 세션 하나가 토큰을 많이 소모하면 오히려 한도에 더 빨리 도달합니다.
Q3. Sonnet 4.6도 Opus 4.6과 같은 1M 컨텍스트를 쓸 수 있나요?
네, Sonnet 4.6도 1M 컨텍스트 윈도우와 동일한 단가 정책이 적용됩니다. 입력 $3/MTok, 출력 $15/MTok 기준입니다. MRCR v2 벤치마크에서는 Opus 4.6(78.3%)보다 낮지만, GraphWalks BFS에서 68.4%를 기록해 비용 대비 성능이 요구되는 업무에서는 충분한 선택지입니다. (출처: aitoolranked.com, 2026.03.16)
Q4. 기존에 베타 헤더를 추가했던 코드는 수정해야 하나요?
수정 안 해도 됩니다. Anthropic 공식 발표에 따르면 베타 헤더는 이제 자동으로 무시(ignored)됩니다. 코드를 그대로 두어도 오류가 발생하지 않고, 1M 컨텍스트가 자동 적용됩니다. (출처: Anthropic 공식 블로그, 2026.03.13)
Q5. Amazon Bedrock, Google Vertex AI에서도 쓸 수 있나요?
네. Anthropic 공식 발표 기준 Amazon Bedrock, Google Cloud Vertex AI, Microsoft Azure Foundry에서 이미 사용 가능합니다. 클라우드 플랫폼 표준 엔드포인트를 그대로 사용하면 됩니다. (출처: Anthropic 공식 블로그, 2026.03.13)

▲ 목차로 돌아가기

마치며

Claude Code 1M 컨텍스트는 분명 의미 있는 업데이트입니다.
요금 프리미엄이 없어지고, 긴 세션에서의 정확도가 실제 수치로 뒷받침됩니다.
코드베이스 전체를 한 세션에 넣고 리팩터링하거나, 수백 페이지 문서를 중간 청킹 없이 분석하는 워크플로우가 처음으로 현실적인 선택지가 됐습니다.

단, 이 업데이트를 쓰기 전에 확인해야 할 것이 두 가지 있습니다.
첫째, 본인 플랜이 Pro라면 Claude Code 안에서 /extra-usage를 먼저 입력해야 합니다.
둘째, 에이전트 루프에 1M을 그대로 붙이면 의도치 않은 비용 급증이 생길 수 있습니다.
컨텍스트 윈도우가 커진다는 것은 컨텍스트 관리의 중요성도 함께 커진다는 의미입니다.

솔직히 말하면, 지금 이 시점에 Claude Code를 쓰는 가장 실질적인 이유는 1M 자체보다 “요금 불확실성이 줄었다”는 데 있습니다.
장문 세션에서 청구서가 갑자기 두 배가 되는 구조가 사라진 것 — 그게 지금 당장 개발 워크플로우에서 체감하는 가장 큰 변화입니다.

본 포스팅 참고 자료

  1. ① Anthropic 공식 블로그 — 1M Context GA 발표 (claude.com/blog/1m-context-ga), 2026.03.13
  2. ② SitePoint — Claude Code Rate Limits Explained 2026 (sitepoint.com)
  3. ③ AI Tool Ranked — Claude 1M Context GA Breakdown (aitoolranked.com), 2026.03.16
  4. ④ William Couturier / Medium — Claude Code in March 2026: The Economics of the Quota (medium.com), 2026.03.17
  5. ⑤ Karo Zieminski / Substack — Claude’s 1M Context Window: What Changed (karozieminski.substack.com), 2026.03.16

본 포스팅은 2026년 3월 23일 기준 공개된 정보를 토대로 작성됐습니다.
본 포스팅 작성 이후 서비스 정책·UI·기능·요금이 변경될 수 있습니다.
수치 및 사양은 Anthropic 공식 발표 자료를 참조했으며, 변경 시 해당 공식 문서를 우선합니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기