2026.03.13 GA 기준
Claude Code / Opus 4.6 · Sonnet 4.6

Claude Code 1M 컨텍스트, 구독료에 포함된 게 아닙니다

2026년 3월 13일, Anthropic이 Claude Code 1M 컨텍스트 윈도우를 정식 출시했습니다. SNS는 “드디어 1M 시대!”로 들떴지만, 공식 문서를 직접 확인하면 이야기가 달라집니다. Max $200 플랜이라도 200K 토큰을 넘기는 순간 구독 외 별도 청구가 시작됩니다.

78.3%

MRCR v2 (1M 구간 최고)

15%

컴팩션 이벤트 감소 (공식 사례)

$10/MTok

Opus 200K 초과 입력 단가

“GA = 포함”이 아닌 이유, 공식 문서에 딱 이렇게 나옵니다

3월 13일 Anthropic 공식 블로그 원문은 이렇게 시작합니다. “Standard pricing now applies across the full 1M window — no long-context premium.” 번역하면 “1M 구간 전체에 표준 단가가 적용되고, 장문 컨텍스트 추가요금이 없다”는 뜻입니다. 읽으면 뭔가 혜택처럼 느껴지죠. (출처: Anthropic 공식 블로그, 2026.03.13)

그런데 같은 문서 하단 조건을 보면 이야기가 달라집니다. Claude Code Max·Team·Enterprise 사용자는 Opus 4.6 세션에서 1M 컨텍스트가 자동으로 켜지지만, 200K를 초과하는 토큰은 구독에 포함된 게 아니라 추가 사용(extra usage)으로 별도 청구됩니다. 구독료 안에서 무제한으로 쓸 수 있는 게 아니라는 얘기입니다.

💡 공식 발표문과 실제 청구 구조를 같이 놓고 보니 이런 차이가 보였습니다. GA(정식 출시)는 “베타 없이 쓸 수 있다”는 접근성 변화지, 구독 포함 범위가 늘어난 게 아닙니다.

Reddit에서도 같은 혼란이 나왔습니다. Max $200 플랜 사용자가 “나는 1M이 안 된다”고 올린 글에 댓글이 쏟아졌는데, 핵심은 하나였습니다. “200K 초과분은 extra usage로 API 단가 청구라 구독과 별개.” 실제 클로드 코드 문서(code.claude.com/docs)도 이를 명시하고 있습니다.

▲ 목차로 돌아가기

200K 초과 시 실제로 얼마가 나오는가 — 직접 계산했습니다

Anthropic 공식 API 가격표 기준으로 계산합니다. (출처: Anthropic Pricing 문서, 2026.03 기준)

모델	입력 (≤200K)	입력 (>200K)	출력 (≤200K)	출력 (>200K)
Opus 4.6	$5/MTok	$10/MTok	$25/MTok	$37.50/MTok
Sonnet 4.6	$3/MTok	$6/MTok	$15/MTok	$22.50/MTok

200K를 초과하는 순간 Opus 4.6 입력 단가는 정확히 2배가 됩니다. 실제 시나리오로 따져봅니다.

🧮 계산 예시 — 대형 리팩토링 1회 세션 (Opus 4.6 기준)

입력 토큰: 300K (코드베이스 로딩 + 지시)
출력 토큰: 50K (리팩토링 결과)
초과 입력 100K × $10/MTok = $1.00
출력 50K (200K 이하) × $25/MTok = $1.25
1회 세션 합계: 약 $2.25 (약 3,000원)

※ 200K 이하 입력 200K × $5 = $1.00 포함 시 총 $3.25. 하루 5회 반복 시 약 $16.25(22,000원).

구독료가 있어도 이 금액은 추가됩니다. 매일 대형 1M 세션을 돌리면 Max $200 구독 위에 월 수십만 원이 더 붙을 수 있습니다. 구독이 일정 부분을 커버해 주지만, 200K 초과분은 구독 외 별도 항목입니다.

▲ 목차로 돌아가기

컨텍스트를 키울수록 토큰이 줄어드는 경우가 있습니다

💡 Anthropic 발표문과 실제 사용 사례를 교차로 읽어보니 이런 패턴이 나왔습니다. 컨텍스트가 클수록 총 토큰이 오히려 감소하는 역설적 상황입니다.

보통 “1M 컨텍스트를 쓰면 토큰 소비가 많아진다”고 생각하기 쉽습니다. 막상 데이터는 반대를 보여주는 경우가 있습니다. Anthropic 공식 블로그에 실린 Izzy Miller(AI Research Lead) 사례입니다. “Opus 컨텍스트를 200k에서 500k로 올렸더니 에이전트가 더 효율적으로 동작하고 토큰이 전체적으로 더 적게 쓰였다.” (출처: Anthropic 공식 블로그, 2026.03.13)

이유가 뭘까요. 컨텍스트가 좁으면 Claude Code는 같은 파일을 반복해서 읽어들입니다. 컴팩션(compaction)이 발생할 때마다 누적된 맥락이 날아가고, 다음 스텝에서 또 읽어야 합니다. 입력 토큰이 중복으로 쌓이는 구조입니다. 컨텍스트가 넉넉하면 한 번 로드한 내용을 세션 내내 재사용하기 때문에 총 토큰이 줄어드는 거죠.

실제로 Jon Bell(CPO)의 사례에서도 1M으로 전환한 뒤 컴팩션 이벤트가 15% 감소했다고 공식 발표문에 나와 있습니다. (출처: 동일) 즉 “1M = 비용 증가”라는 공식이 항상 성립하지는 않습니다.

다만 이건 긴 세션을 하나로 이어가는 경우에 해당합니다. 짧고 독립적인 작업을 자주 실행하는 경우라면 200K 이하에서 끊는 게 여전히 저렴합니다. 세션 패턴이 어떤지에 따라 달라집니다.

▲ 목차로 돌아가기

플랜별 1M 접근 조건, 한눈에 정리했습니다

3월 13일 GA 이후 플랜별로 1M 컨텍스트에 접근하는 방법과 비용 처리 방식이 다릅니다. 공식 문서를 기준으로 정리했습니다. (출처: Claude Code 공식 문서, claude.com/blog/1m-context-ga)

플랜	월 비용	1M 접근	200K 초과 처리
Pro	$20	Extra usage 필요	API 단가 별도
Max 5x	$100	Extra usage 필요	API 단가 별도
Max 20x	$200	Opus 4.6 자동 활성화	API 단가 별도 청구
Team Premium	$100/seat	Opus 4.6 자동 활성화	API 단가 별도
API 종량제	없음	전체 접근	사용 토큰만 청구

Max 20x에서 “자동 활성화”는 켜지는 것이지, 비용이 포함되는 게 아닙니다. 200K를 넘기면 extra usage 항목으로 API 단가가 별도 청구됩니다. Claude Code 내에서 /model opus[1m] 명령어로 직접 선택도 가능한데, 그 순간부터 200K 초과 세션이 되면 청구가 시작됩니다.

Enterprise 플랜은 기본 컨텍스트가 500K입니다. 1M까지 쓰려면 동일하게 초과분이 별도입니다. 아직 Anthropic이 Enterprise 내 1M 포함 여부에 대한 공식 답변을 내놓지 않은 부분이 있어, 사용 전 확인이 필요합니다.

▲ 목차로 돌아가기

1M을 실제로 쓸 만한 작업과 그렇지 않은 작업

1M 컨텍스트가 유효한 상황과 오히려 과비용을 낳는 상황은 생각보다 구분이 명확합니다. 공식 발표에 실린 실사용 사례를 기준으로 정리합니다.

쓸 만한 경우

대형 코드베이스 전체 디버깅: Datadog 로그, 소스코드, DB 쿼리를 한 세션에서 동시 분석. 세션 중단 없이 원인을 추적합니다.
대규모 diff 리뷰: 수백 파일에 걸친 PR을 쪼개지 않고 한 번에 넣으면 크로스파일 의존성이 유지됩니다. (Adhyyan Sekhsaria 사례, 출처: 동일)
긴 협상 문서 검토: 100페이지짜리 계약서를 5라운드 내역과 함께 한 세션에 올리면 버전 간 변화를 놓치지 않습니다.
연구 자료 종합 분석: 수백 편의 논문, 수식, 시뮬레이션 코드를 한 번에 넣는 경우. (Dr. Alex Wissner-Gross 사례, 출처: 동일)

굳이 쓰지 않아도 되는 경우

짧은 독립 작업: 버그 수정 1건, 단일 함수 추가 등 200K 이하로 충분한 작업. 200K 구간 단가가 훨씬 저렴합니다.
반복 실행 자동화: CI/CD 파이프라인에 Claude Code를 붙이는 경우 구독형이 아니라 API 종량제가 적합하고, 매 호출이 독립적이라 1M 세션이 필요하지 않습니다.
단순 QA·테스트 생성: 컨텍스트가 짧아 1M 범위에 들어갈 이유가 없는 작업. 오히려 Sonnet 4.6이나 Haiku 4.5가 적합합니다.

▲ 목차로 돌아가기

비용을 줄이려면 순서가 있습니다

1M 컨텍스트를 쓰더라도 비용 구조를 이해하면 상당히 줄일 수 있습니다. 공식 문서와 실사용 데이터를 교차해서 도출한 방법입니다.

캐시 히트율을 높입니다. CLAUDE.md나 자주 참조하는 시스템 프롬프트는 세션을 이어가면 캐시 읽기 단가($0.30/MTok)가 적용됩니다. Sonnet 4.6 기준 입력 단가($3)보다 90% 저렴합니다. (출처: Anthropic Pricing 문서) 하루 같은 프로젝트를 작업한다면 세션을 끊지 않는 게 유리합니다.

모델을 작업별로 분리합니다. 아키텍처 설계와 복잡한 추론에는 Opus 4.6, 일반 구현과 테스트 생성에는 Sonnet 4.6을 씁니다. API 단가 기준 Opus는 Sonnet의 약 1.7배입니다. 200K 초과 구간에서는 더 벌어집니다.

플랜 모드를 먼저 씁니다. Shift+Tab으로 진입하는 플랜 모드는 코드를 바로 쓰기 전에 접근법을 먼저 짜게 해줍니다. 잘못된 방향으로 대규모 코드를 생성한 뒤 폐기하는 출력 토큰 낭비를 막습니다.

무관한 작업은 컨텍스트를 리셋합니다. /clear 명령어로 이전 대화를 초기화하면 불필요한 입력 토큰을 30~50% 줄일 수 있습니다. 이전 작업 내용이 다음 작업에 꼭 필요한 게 아니라면 리셋이 맞습니다.

비실시간 작업은 Batch API를 씁니다. Batch API는 모든 토큰 가격이 50% 할인됩니다. 24시간 이내 응답이면 충분한 문서화 작업, 야간 코드 분석, 테스트 수트 생성 등에 적합합니다. Sonnet 4.6 기준 입력이 $3에서 $1.50로 내려갑니다.

Reddit 사용자가 직접 네트워크 로그를 계측한 데이터에 따르면, Max 20x 구독 기준 동일한 작업을 API 직접 청구로 하면 월 약 $3,650이 나오지만 구독으로 커버되는 범위 내에서 작업하면 $200으로 처리됩니다. 18배 차이입니다. 구독을 이미 쓰고 있다면 200K 안에서 끝내는 작업은 실질적으로 무료에 가깝다는 뜻이기도 합니다.

▲ 목차로 돌아가기

Q&A — 실제로 많이 묻는 것들

Q1. Max $200 플랜이면 1M 컨텍스트가 구독에 포함되는 건가요?

아닙니다. Max 20x 플랜에서는 Opus 4.6 세션에서 1M 컨텍스트가 자동으로 활성화되지만, 200K를 초과하는 토큰은 extra usage(추가 사용)로 API 단가가 별도 청구됩니다. 구독 안에 포함된 게 아닙니다. (출처: Claude Code 공식 문서, 2026.03.13)

Q2. Pro 플랜에서 1M 컨텍스트를 쓸 수 있나요?

기술적으로 가능하지만, extra usage 설정이 활성화돼 있어야 하고 200K 초과분은 바로 API 단가로 청구됩니다. Pro 플랜에 포함된 건 아닙니다. Claude Code 내에서 /model opus[1m] 또는 /model sonnet[1m]으로 선택할 수 있습니다.

Q3. 1M 컨텍스트를 쓰면 반드시 비용이 2배 이상 늘어나나요?

꼭 그렇지 않습니다. 컨텍스트를 200K에서 500K로 늘렸더니 오히려 총 토큰이 줄어든 사례가 있습니다. 컴팩션 없이 세션을 유지하면 같은 파일을 반복 읽지 않아도 돼서 중복 입력이 사라지기 때문입니다. 단, 이건 하나의 긴 세션을 유지하는 경우에 해당합니다. (출처: Anthropic 공식 블로그, 2026.03.13)

Q4. MRCR v2 78.3%는 어떤 의미인가요?

MRCR v2(Multi-hop Retrieval and Context Reasoning)는 1M 토큰 전체 구간에서 모델이 정보를 얼마나 정확하게 추출하고 추론하는지 측정하는 벤치마크입니다. Anthropic 발표 기준 Opus 4.6이 프런티어 모델 중 해당 구간 최고 점수를 기록했습니다. 이 수치는 이론적 최대치라, 실제 사용 환경에서는 코드베이스 구조나 작업 복잡도에 따라 다르게 체감됩니다. (출처: Anthropic 공식 블로그, 2026.03.13)

Q5. 비실시간 작업에서 가장 저렴하게 쓰는 방법은 무엇인가요?

Batch API를 쓰는 게 가장 저렴합니다. 전체 토큰 가격 50% 할인이 적용되며, 결과는 24시간 이내 반환됩니다. 야간 배치 분석, 문서 생성, 테스트 코드 생성 등에 적합합니다. Sonnet 4.6 기준 입력 $3/MTok → $1.50/MTok으로 낮아집니다. (출처: Anthropic Pricing 문서, 2026.03 기준)

▲ 목차로 돌아가기

마치며

Claude Code 1M 컨텍스트 GA는 분명 좋은 변화입니다. 베타 헤더가 사라지고, 미디어 한도가 600개로 늘었고, Opus 4.6이 MRCR v2에서 1M 구간 최고점을 받은 건 사실입니다. 그리고 컴팩션이 줄어서 오히려 토큰이 절약되는 경우도 있습니다.

그런데 “GA = 구독에 포함”은 아닙니다. 이 차이를 모르고 쓰면 청구서가 예상보다 훨씬 크게 나올 수 있습니다. 200K가 넘어가는 순간 Opus 4.6 입력은 $5에서 $10으로 올라갑니다. 하루 몇 번의 대형 세션만으로도 월 수만 원이 추가됩니다.

결론적으로 쓸수록 도움이 되는 기능인 건 맞는데, 어떤 플랜이냐보다 어떤 작업에 쓰는지가 비용을 좌우합니다. 짧은 작업은 200K 이하에서 끊고, 긴 세션이 꼭 필요한 작업에만 1M을 쓰는 방식이 현실적으로 맞습니다.

📚 본 포스팅 참고 자료

Anthropic 공식 블로그 — 1M Context GA 발표 (https://claude.com/blog/1m-context-ga)
Anthropic 공식 가격 문서 (https://platform.claude.com/docs/en/about-claude/pricing)
Claude Code 공식 모델 설정 문서 (code.claude.com/docs/en/model-config)

본 포스팅은 2026년 3월 13일 GA 기준으로 작성되었습니다. Claude Code 서비스 정책·요금·UI·기능은 Anthropic의 업데이트로 변경될 수 있습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있으며, 최신 정보는 Anthropic 공식 문서에서 확인해 주세요.

Claude Code 1M 컨텍스트, 구독료에 포함된 게 아닙니다

“GA = 포함”이 아닌 이유, 공식 문서에 딱 이렇게 나옵니다

200K 초과 시 실제로 얼마가 나오는가 — 직접 계산했습니다

컨텍스트를 키울수록 토큰이 줄어드는 경우가 있습니다

플랜별 1M 접근 조건, 한눈에 정리했습니다

1M을 실제로 쓸 만한 작업과 그렇지 않은 작업

쓸 만한 경우

굳이 쓰지 않아도 되는 경우

비용을 줄이려면 순서가 있습니다

Q&A — 실제로 많이 묻는 것들

마치며

댓글 남기기응답 취소

최신 글

카테고리

Tags

Claude Code 1M 컨텍스트, 구독료에 포함된 게 아닙니다

Claude Code 1M 컨텍스트, 구독료에 포함된 게 아닙니다

“GA = 포함”이 아닌 이유, 공식 문서에 딱 이렇게 나옵니다

200K 초과 시 실제로 얼마가 나오는가 — 직접 계산했습니다

컨텍스트를 키울수록 토큰이 줄어드는 경우가 있습니다

플랜별 1M 접근 조건, 한눈에 정리했습니다

1M을 실제로 쓸 만한 작업과 그렇지 않은 작업

쓸 만한 경우

굳이 쓰지 않아도 되는 경우

비용을 줄이려면 순서가 있습니다

Q&A — 실제로 많이 묻는 것들

마치며

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기