Claude Code 1M 컨텍스트, 써봤더니 이게 달랐습니다

Published on

2026년 3월 19일

2026.03.13 기준
Claude Code v2.1.76 기준
Opus 4.6 / Sonnet 4.6

Claude Code 1M 컨텍스트, 써봤더니 이게 달랐습니다

결론부터 말씀드리면, 2026년 3월 13일 Anthropic이 Claude Code의 1M 컨텍스트 윈도우를 정식 출시했습니다.
단순히 창이 커진 게 아닙니다. 가격 구조가 바뀌었고, 모델이 실제로 그 안에서 뭔가를 기억하는 방식이 달라졌습니다.
그런데 막상 써보면 “당연히 이렇겠지”라고 생각했던 부분에서 예상과 다른 점이 나왔습니다.

78.3%

MRCR v2 리콜 점수 (1M 토큰)

15%

컨텍스트 압축 이벤트 감소율

600개

이미지·PDF 동시 처리 한도

$0 추가

장기 컨텍스트 추가 요금 없음

200K에서 1M으로 — 실제로 뭐가 바뀌었나

Claude Code 1M 컨텍스트는 2026년 2월 5일 Opus 4.6 출시 당시 베타로 먼저 선보였습니다. 그리고 2026년 3월 13일, Anthropic이 공식 GA(일반 이용 가능) 전환을 발표했습니다.
(출처: Anthropic 공식 블로그, 2026.03.13)

바뀐 핵심은 세 가지입니다. 첫째, 200K를 초과해도 추가 요금이 없어졌습니다. 둘째, 미디어 처리 한도가 요청 당 100개에서 600개로 6배 늘었습니다. 셋째, Claude Code Max, Team, Enterprise 플랜에서는 별도 설정 없이 Opus 4.6 세션이 자동으로 1M 컨텍스트로 동작합니다.

1M 토큰이 구체적으로 어느 정도냐면 — 평균 비소설 도서 75권 분량, 또는 약 11만 줄의 코드와 맞먹습니다. 단일 세션에서 코드베이스 전체를 올려두고 대화하는 것이 처음으로 현실적인 선택지가 된 수준입니다.

API에서 beta 헤더를 지우지 않아도 됩니다

기존에 200K 초과 요청을 사용하던 API 이용자라면 코드를 건드릴 필요가 없습니다. Anthropic 공식 발표에 따르면, 기존에 베타 헤더를 포함하고 있던 요청은 자동으로 무시되고 정상 처리됩니다. 업그레이드 작업 없이 즉시 1M 창을 쓸 수 있는 구조입니다.
(출처: Anthropic 공식 블로그)

▲ 목차로 돌아가기

창이 커지면 토큰을 더 쓴다고요? 계산이 다릅니다

1M 컨텍스트를 보고 가장 많이 나오는 반응이 있습니다. “그러면 토큰 소비가 폭발적으로 늘지 않나?” 막상 실제 사용 데이터를 보면 반대 방향의 결과가 나옵니다.

💡 공식 발표문과 실제 Reddit 세션 로그를 나란히 놓고 보니 이런 패턴이 보였습니다.

200K 세션 5회 vs 1M 세션 1회:
200K 세션 5회의 실제 유효 작업 토큰은 약 750,000개입니다. 세션마다 CLAUDE.md 재독(약 10K), 핵심 파일 재파악, 이전 컨텍스트 복원에 각 30~50K가 소요됩니다. 5회에 걸친 오버헤드 합산만 최대 250K에 달합니다.
반면 1M 세션 1회는 최초 진입 비용 약 30K 이후 970K를 실작업에 씁니다. 같은 작업량을 처리하는 데 오히려 토큰이 절약됩니다.

(출처: Reddit r/ClaudeAI, 실사용자 세션 분석, 2026.03.13)

이 수치가 말하는 바는 간단합니다. 컨텍스트 압축이 반복될 때마다 Claude는 이전 작업을 요약해 새로 읽어들이는 비용이 발생합니다. 1M 창은 그 압축 횟수 자체를 줄이기 때문에, 긴 프로젝트를 다룰 때 단순한 ‘더 큰 공간’이 아니라 실질적인 비용 절감이 됩니다.

Anthropic 공식 자료에 따르면 1M 컨텍스트 GA 이후 컨텍스트 압축 이벤트가 15% 감소했습니다. 이 수치를 실작업 기준으로 해석하면, 세션이 중간에 끊겨 다시 설명해야 하는 상황이 15% 줄었다는 의미입니다.
(출처: Anthropic 공식 블로그)

▲ 목차로 돌아가기

Pro 플랜이라면 이 부분에서 막힙니다

발표를 보고 “이제 Pro 플랜도 1M 컨텍스트 자동 적용이겠지”라고 생각하셨다면, 이 부분이 중요합니다. 공식 발표문과 Reddit 커뮤니티 확인 결과, 1M 컨텍스트의 자동 적용은 Claude Code Max, Team, Enterprise 플랜에만 해당됩니다.

플랜	1M 컨텍스트	자동 적용	비고
Claude Code Max	✅	자동	Opus 4.6 기본 적용
Team / Enterprise	✅	자동	Opus 4.6 기본 적용
Claude Pro	⚠️	수동	`/extra-usage` 직접 입력 필요
API (Opus 4.6)	✅	자동	표준 가격, 추가 헤더 불필요
Free 플랜	△	프로모션	2026년 3월 한정 보너스 사용량 제공

Pro 플랜에서 1M 컨텍스트를 쓰려면 Claude Code 터미널에서 /extra-usage를 직접 입력해야 합니다. 이 동작이 Max·Team·Enterprise와 다르게 설계된 건 이유가 있습니다. Anthropic의 수익 구조상 API·기업 사용 비중이 70~75%이기 때문에, 플랫 프라이싱의 혜택은 고연산 사용 고객에 먼저 집중됩니다. Pro 플랜에서 1M 컨텍스트를 자유롭게 쓰다가는 한두 메시지 만에 시간당 사용 한도를 소진할 수 있으므로, 이 단계는 사실상 업그레이드 유도 장치로 작동합니다.
(출처: Reddit r/ClaudeAI 커뮤니티 검증, 2026.03.13)

▲ 목차로 돌아가기

1M 컨텍스트 자체는 Claude만의 것이 아닙니다. GPT-5.4도 API에서 1.05M 토큰을 지원하고, Gemini 3.1 Pro도 1M 창을 제공합니다. 차이는 요금 구조에서 생깁니다.

💡 API 요금 구조를 발표 자료와 실제 청구서 수준에서 나란히 놓고 보면 실제 사용 패턴과 다른 결과가 나옵니다.

GPT-5.4의 함정:
입력 272,000 토큰 미만: $2.50/M 토큰
입력 272,000 토큰 초과 시: 입력 2배, 출력 1.5배 자동 적용 — 단, 해당 세션 전체에 소급 적용됩니다.
300K 토큰 세션 비용 ≈ 250K 세션 비용의 2배. 이 구조는 세션 중간에 청구 기준이 바뀌기 때문에 사전 예산 산정이 어렵습니다.

(출처: Substack Product with Attitude 분석, 2026.03.13 / Anthropic GA 발표문)

Claude Opus 4.6는 $5/M 입력, $25/M 출력으로 900K 토큰 요청도 9K 요청과 동일한 단가를 적용합니다. 실제로 900K 토큰 단일 세션 비용을 계산하면 입력 기준 $4.50입니다. 이 금액이 연구나 대규모 코드 리뷰 한 번에 발생하는 비용이라는 점을 감안하면 납득 가능한 수준이지만, 루프 형태로 반복 실행되는 에이전트 워크플로에서는 빠르게 쌓입니다.

모델	컨텍스트	입력 단가	장기 컨텍스트 과금
Claude Opus 4.6	1M	$5/M	없음 (플랫)
Claude Sonnet 4.6	1M	$3/M	없음 (플랫)
GPT-5.4	1.05M	$2.50/M	272K 초과 시 2배 급등
GPT-4.1	1M	$2/M	없음 (플랫)
Gemini 3.1 Pro	1M	$2/M	확인 필요

※ 위 API 단가는 2026년 3월 기준. 서비스 정책 변경에 따라 달라질 수 있습니다. (출처: Anthropic 공식 가격표, GuruSup 비교 분석)

솔직히 말하면, 순수 입력 단가만 보면 Claude Opus 4.6이 가장 비쌉니다. Gemini 3.1 Pro나 GPT-4.1 대비 2.5배 수준입니다. Anthropic이 플랫 프라이싱을 내세운 건 단가 경쟁을 피하고 긴 세션이 많은 기업 고객, 특히 Claude Code 헤비 유저를 겨냥한 포지셔닝입니다.

▲ 목차로 돌아가기

78.3%라는 숫자가 의미하는 것

컨텍스트 창의 크기와 그 안에서 실제로 내용을 정확히 기억하는 능력은 다른 문제입니다. 창이 1M으로 늘어났다고 해서 모델이 그 안을 전부 정확하게 읽는다는 보장은 없습니다. 이 점을 측정하는 벤치마크가 MRCR v2(Multi-Round Coreference Resolution)입니다.

MRCR v2가 어떤 테스트인지 직접 따라해 볼 수 있습니다

약 3,000페이지 분량의 문서 안에 특정 사실 2개를 숨겨놓고, 모델이 그 둘을 동시에 찾아내야 합격 처리합니다. 하나만 찾으면 0점입니다. 완전 정확도 기준의 까다로운 테스트입니다. Anthropic 공식 발표 기준으로 Opus 4.6의 점수는 78.3%입니다. 이전 최고 Claude 모델 대비 약 4배, Gemini 3.1 Pro 대비 약 3배 높은 수준입니다.
(출처: Anthropic 공식 블로그, 2026.03.13)

78.3%라는 수치를 실생활에 대입하면, 10번의 장문 세션 중 약 8번은 문서 깊숙이 묻힌 정보를 정확하게 끌어낸다는 의미입니다. 단, 이 수치는 Anthropic 자체 발표 기준이며 현재 시점에서 독립적인 제3자 검증은 진행 중입니다.

그래도 가운데가 흐려지는 문제는 남아 있습니다

커뮤니티 실사용 결과에서 꾸준히 보고되는 현상이 있습니다. 세션 초반에 명시적으로 결정한 방향을 모델이 후반부에서 뒤집는 경우입니다. 창이 1M이 되어도 가운데 구간의 정보보다 앞뒤 정보가 더 강하게 영향을 미치는 어텐션 특성은 완전히 해소되지 않았습니다. 이를 “컨텍스트 로트(context rot)”라고 부르는 사용자도 있습니다. 실제로 특정 스크린샷 해상도 지시가 세션 45% 시점에서 무시된 사례가 Reddit에 보고되었습니다.

▲ 목차로 돌아가기

이 단계에서 비용이 터집니다

“가격이 똑같다”는 말만 기억하면 위험한 구간이 있습니다. API 기반 에이전트를 만들거나 Claude Code에서 자동화 루프를 돌릴 때의 이야기입니다.

⚠️ 실제 발생한 비용 폭증 사례 (Reddit 커뮤니티 보고)

개발자가 Claude Code를 Cursor 내부에서 실행하다가 단 한 번의 AI 도구 호출로 800,000 토큰이 소비된 사례가 있습니다. 에이전트가 데이터베이스 전체를 컨텍스트로 끌어당긴 결과입니다. 컨텍스트 창이 커졌다는 건 에이전트가 실수로 더 많은 것을 집어넣는 ‘사고’도 더 크게 발생할 수 있다는 의미입니다.

구체적으로 900K 세션의 비용을 계산해보면

Opus 4.6 기준 900,000 입력 토큰 × $5/1M = $4.50. 일회성 리뷰나 연구 작업이라면 수용 가능한 수준입니다. 그러나 하루에 10회 반복하는 에이전트 루프라면 입력만으로 $45/일, 월 $1,350이 됩니다. 이 수치는 출력 토큰 비용을 제외한 것입니다. 출력까지 포함하면 실제 비용은 훨씬 높아집니다.

(출처: Anthropic 공식 가격표 $5/M 기준 직접 계산)

이 부분이 핵심입니다. 컨텍스트 창이 크다고 해서 무조건 다 넣는 전략은 더 이상 유효하지 않습니다. 필요한 범위를 정밀하게 설계하는 습관이 오히려 중요해집니다. 컨텍스트 규율(context discipline)이 필요하다는 말이 여기서 나옵니다.

세션이 끝나면 1M 토큰은 사라집니다

또 하나 중요한 제한입니다. 1M 컨텍스트는 세션 내 메모리입니다. 세션을 닫으면 그 내용은 사라집니다. Claude Code에서 --resume 옵션으로 동일 디렉터리 내 세션을 이어갈 수는 있지만, 다른 프로젝트, 다른 디바이스, 다른 도구로 이동하면 그 컨텍스트는 복구할 수 없습니다. 1M이 ‘더 큰 단기 기억’이지, ‘영속 메모리’가 아닌 이유입니다.

▲ 목차로 돌아가기

Q&A — 많이 물어보는 5가지

Q1. Claude.ai 웹 버전에서도 1M 컨텍스트를 쓸 수 있나요?

현재 기준(2026.03.13 GA 기준)으로 1M 컨텍스트는 Claude Code(터미널·CLI) 및 API에서 지원됩니다. claude.ai 웹 인터페이스와 iOS/Android 앱은 이번 GA에 포함되지 않았습니다. 커뮤니티에서는 추후 반영될 것으로 예상하고 있으나, 공식 출시 일정은 확인 필요입니다.

Q2. Sonnet 4.6도 1M 컨텍스트를 쓸 수 있나요?

네. Anthropic GA 발표에서 Opus 4.6과 Sonnet 4.6 모두 1M 컨텍스트가 표준 가격($3/$15 per MTok)에 포함됩니다. Sonnet은 Opus 대비 훨씬 저렴한 단가로 장기 컨텍스트 작업을 처리할 수 있어, 비용 효율이 중요한 경우 실용적인 선택입니다.

Q3. Claude Code VSCode 익스텐션에서도 바로 쓸 수 있나요?

GA 발표 직후 기준으로 CLI(터미널)에서는 즉시 동작하지만, VSCode 익스텐션과 Claude Code Desktop GUI는 롤아웃이 약간 지연되었다는 보고가 있습니다. 모델 슬러그를 opus[1m]으로 명시하면 강제 적용할 수 있습니다. 최신 버전으로 업데이트 후 확인을 권장합니다.

Q4. 자동 압축을 조절할 수 있나요?

Claude Code 설정 파일(.claude/settings.json)에서 CLAUDE_AUTOCOMPACT_PCT_OVERRIDE 값을 조정해 자동 압축 임계치를 설정할 수 있습니다. 예: 20으로 설정 시 컨텍스트 20% 시점에서 압축이 시작됩니다. 1M 창에서 비용 관리를 위해 활용할 수 있는 설정입니다.

Q5. Amazon Bedrock, Google Vertex AI에서도 1M 컨텍스트를 쓸 수 있나요?

네. Anthropic 공식 발표에 따르면 GA와 동시에 Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry에서도 1M 컨텍스트가 표준 가격으로 이용 가능합니다.
(출처: Anthropic 공식 블로그, 2026.03.13)

▲ 목차로 돌아가기

마치며

Claude Code 1M 컨텍스트에서 정말 의미 있는 부분은 창의 크기보다 가격 구조와 리콜 성능의 조합입니다. 컨텍스트가 클수록 토큰을 더 쓴다는 직관은 실제 세션 데이터에서 뒤집혔고, 자동 적용이 모든 플랜에 해당된다는 기대도 Pro 플랜에서는 맞지 않습니다.

이 부분이 좀 아쉬웠습니다 — “모두에게 동일하게”라는 메시지를 먼저 내세우지만 실제로는 Max·Team·Enterprise 중심의 설계입니다. Pro 플랜 사용자는 직접 확인하고 수동으로 켜야 합니다.

기대했던 것과 달랐던 것도 있습니다. 78.3% 리콜 점수는 인상적이지만, 세션 중간부 정보가 앞뒤보다 덜 회상되는 패턴은 남아 있습니다. 더 큰 창이 무조건 더 좋은 결과로 이어진다고 볼 수 없습니다. 긴 세션일수록 중요한 결정사항을 명시적으로 반복하거나, 세션 중간에 핵심 제약을 다시 확인시키는 습관이 필요합니다.

결론적으로 Claude Code 1M 컨텍스트는 대규모 코드베이스를 다루는 개발자, 긴 문서를 분석해야 하는 연구자, 장기 실행 에이전트를 구축하는 팀에게 실질적인 차이를 만들어 줍니다. 단, 코스트 규율을 갖추지 않은 채로 루프를 돌리면 청구서가 예상을 크게 벗어날 수 있습니다. 쓰기 전에 어느 구간에서 1M이 진짜 필요한지 먼저 따져보는 것이 생각보다 중요합니다.

▲ 목차로 돌아가기

📌 본 포스팅 참고 자료

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 본문의 가격, 플랜 정책, 벤치마크 수치는 2026년 3월 13일 Anthropic 공식 발표 및 공식 문서를 기준으로 작성되었으며, 이후 업데이트로 내용이 달라질 수 있습니다. 투자, 구독 결정 전에는 반드시 공식 사이트에서 최신 정보를 확인하시기 바랍니다.

AI 컨텍스트 윈도우, AI 코딩 에이전트, Anthropic Academy, Claude 1M 컨텍스트, Claude Code Desktop

Claude Code 1M 컨텍스트, 써봤더니 이게 달랐습니다

Claude Code 1M 컨텍스트, 써봤더니 이게 달랐습니다