Claude Code 1M 컨텍스트, 넓어졌는데 왜 더 싸질까요?

Published on

2026년 3월 19일

2026.03.13 GA 기준
Claude Code / Opus 4.6 · Sonnet 4.6

Claude Code 1M 컨텍스트, 넓어졌는데 왜 더 싸질까요?

2026년 3월 13일, Anthropic이 Claude Code의 1M 토큰 컨텍스트 창을 정식(GA)으로 전환했습니다. 흥미로운 건 단순히 창이 넓어진 게 아니라 기존 200K 초과 구간에 붙던 프리미엄 요금이 사라졌다는 점입니다. 창을 넓혔는데 비용 구조가 오히려 유리해지는 상황이 어떻게 가능한지, 그리고 한국어를 쓰는 경우에 숨은 변수가 하나 더 있다는 것까지 공식 수치로 확인해 봤습니다.

78.3%

MRCR v2 1M 구간 정확도
(Opus 4.6 / 업계 1위)

15%↓

Compaction 이벤트 감소
(공식 사용자 실측)

2.4×

한국어 토큰 소모 배수
(영어 대비 실측)

GA 전후로 요금 구조가 이렇게 달라졌습니다

2026년 2월 5일 Opus 4.6이 처음 출시됐을 때, 1M 컨텍스트는 베타로만 제공됐고 200K 토큰을 초과하는 순간부터 프리미엄 단가가 적용됐습니다. 입력 기준 $5/MTok이 $10/MTok으로 뛰었고, 출력도 $25/MTok이 $37.50/MTok으로 올랐습니다. (출처: Anthropic 공식 출시 노트, 2026.02.05)

그러다 2026년 3월 13일, GA 전환과 함께 이 프리미엄 구간이 사라졌습니다. Opus 4.6과 Sonnet 4.6 모두 1M 전체 구간을 동일 단가로 이용할 수 있게 된 겁니다.

구분	GA 전 (베타)	GA 이후 (현재)
Opus 4.6 입력 (0~200K)	$5/MTok	$5/MTok
Opus 4.6 입력 (200K 초과)	$10/MTok (2배 프리미엄)	$5/MTok (동일)
Opus 4.6 출력 (200K 초과)	$37.50/MTok (1.5배 프리미엄)	$25/MTok (동일)
Sonnet 4.6 (전 구간)	확인 필요	$3/$15 (동일 단가)

(출처: Anthropic 공식 블로그 1M Context GA 발표, 2026.03.13)

이게 의미하는 건 단순합니다. 900K 토큰짜리 요청을 처리할 때 GA 전에는 700K 구간에 2배 단가가 붙었지만, 지금은 전체를 $5 기준으로 계산하면 됩니다. 같은 작업을 해도 장문 요청일수록 실제 청구 금액이 낮아지는 구조로 바뀐 겁니다.

▲ 목차로 돌아가기

Gemini는 2M인데, 왜 Claude가 더 잘 쓸까요?

컨텍스트 창 크기만 보면 Gemini는 이미 2M을 지원합니다. 표면적으로 Claude의 두 배죠. 그런데 여기서 중요한 게 빠집니다. 창이 크다고 해서 그 안에 있는 내용을 모두 정확하게 참조할 수 있는 건 아니라는 점입니다.

💡 공식 발표문과 벤치마크 수치를 같이 놓고 보니 이런 차이가 보였습니다

MRCR v2는 1M 토큰 분량의 텍스트 안에서 정보를 정확하게 찾아내는 벤치마크입니다. Anthropic 공식 발표 기준(2026.03.13) Opus 4.6은 78.3%를 기록했고, Gemini는 26.3%, Sonnet 4.5는 18.5%에 머물렀습니다. 창의 크기는 Gemini가 2배인데, 실제로 쓸 수 있는 맥락 활용 능력은 Claude가 약 3배 앞서는 셈입니다.

(출처: Anthropic 1M Context GA 공식 블로그, 2026.03.13 / MRCR v2, HuggingFace 공개 데이터셋)

즉, Gemini의 2M 창에 넣어봤자 뒷부분의 정보를 모델이 제대로 참조하지 못하면 결과 품질이 떨어집니다. 반면 Claude Code에서는 1M 내내 정확도가 유지됩니다. 코드베이스 전체를 한 세션에 올려놓고 디버깅할 때 체감 차이가 나는 이유가 바로 이겁니다.

▲ 목차로 돌아가기

창이 넓어지면 오히려 토큰이 줄어드는 이유

직관적으로 보면 컨텍스트 창이 넓어질수록 토큰 사용량이 늘어야 합니다. 그런데 실제 사용 데이터는 반대를 가리킵니다.

GA 공식 발표에서 한 AI 리서치 팀의 책임자가 이렇게 밝혔습니다. “Opus 컨텍스트 창을 200K에서 500K로 올렸더니 에이전트가 더 효율적으로 작동하기 시작했습니다. 실제로 총 토큰 소모가 줄어들었고 오버헤드가 감소했습니다.” (출처: Anthropic 공식 블로그 사용자 인터뷰, Izzy Miller / AI Research Lead, 2026.03.13)

💡 창이 좁을수록 Claude Code가 더 많은 토큰을 쓰는 메커니즘

컨텍스트 창이 꽉 차면 Claude Code는 자동으로 compaction(맥락 압축)을 실행합니다. 이 과정 자체가 별도의 토큰을 소모합니다. 창이 넓으면 compaction 이벤트 자체가 줄어들고, 그만큼 압축에 쓰이던 토큰도 아낄 수 있습니다.

실제 수치로도 확인됩니다. GA 발표에서 한 CPO는 “Compaction 이벤트가 15% 감소했다”고 밝혔습니다. (출처: Jon Bell, CPO / Anthropic 1M Context GA 공식 블로그, 2026.03.13)

즉, 1M 창을 켜놓으면 compaction 토큰 소모가 줄어들고, 프리미엄 요금 구간도 없어졌으니 — 장문 작업에서는 이전보다 비용이 실질적으로 낮아질 수 있습니다. 다만, 단순 작업을 짧은 세션으로만 처리한다면 차이가 거의 없습니다.

▲ 목차로 돌아가기

한국어로 작업하면 이 부분이 달라집니다

이 부분이 국내 사용자에게 특히 중요합니다. Claude의 토크나이저는 한국어를 처리할 때 영어보다 훨씬 많은 토큰을 배정합니다. 실측 기준으로 동일한 내용을 한국어로 쓰면 영어 대비 약 2.4배 더 많은 토큰을 소모합니다. (출처: threads.com/@seol.cc, 실측 공유, 2026.01.09)

⚠️ 한국어 1M 창 실제 체감 용량 계산

영어 기준 1M 토큰 = 약 75만 영단어 수준
한국어 기준 동일 텍스트 양 = 약 31만 자 수준 (1M ÷ 2.4배 ≈ 약 416K 토큰 분량의 텍스트)
→ 한국어 주석이 많은 코드베이스라면 실질 컨텍스트 용량은 영어 전용 대비 절반에도 못 미칠 수 있습니다.

이 2.4배 배수는 GA 이후에도 달라지지 않았습니다. 요금 단가는 같아졌지만, 같은 작업을 한국어로 하면 2.4배 더 많은 토큰이 쓰이고 — 그만큼 비용도 비례해서 올라갑니다. 한국어 주석을 영어로 바꾸거나, 핵심 코드 외 불필요한 한글 텍스트를 컨텍스트에서 빼는 것만으로 비용을 30~50%까지 줄일 수 있습니다. (추정, 2.4배 배수 기반 역산)

▲ 목차로 돌아가기

Max·Team·Enterprise만 자동 적용, Free·Pro는 여기서 막힙니다

GA가 됐다고 해서 모든 Claude Code 사용자에게 자동으로 1M이 적용되는 건 아닙니다. 공식 발표 기준 조건은 명확합니다.

플랜	1M 자동 적용	사용 모델
Max (5x / 20x)	✅ 자동 적용	Opus 4.6
Team	✅ 자동 적용	Opus 4.6
Enterprise	✅ 자동 적용	Opus 4.6
Pro ($20/월)	❌ 미적용	Sonnet 4.6 기본
Free	❌ 미적용	–
API (직접)	✅ 표준 요금 적용	Opus 4.6 / Sonnet 4.6

(출처: Anthropic 1M Context GA 공식 블로그, 2026.03.13)

중요한 건 API 직접 접근 방식도 해당된다는 점입니다. Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry를 통해서도 동일하게 1M을 표준 요금으로 이용할 수 있습니다. 기존에 beta 헤더를 붙여 요청했다면, 이제 그 헤더를 자동으로 무시하니 코드 변경 없이 GA 요금이 적용됩니다.

▲ 목차로 돌아가기

실제로 비용이 줄어드는 경우, 늘어나는 경우

솔직히 말하면, 1M GA가 모든 사람에게 무조건 유리한 변화는 아닙니다. 어떤 경우에 실질적 이득이 있고 어떤 경우에는 주의가 필요한지 짚어보겠습니다.

💚 비용이 줄어드는 경우

200K 이상 장문 세션을 자주 사용하는 경우 — GA 전에는 200K 초과분에 2배 단가가 붙었으므로, 기존 사용자라면 같은 작업에 요금이 낮아집니다.
대규모 코드베이스를 한 세션에 유지하는 경우 — Compaction 빈도가 줄어 compaction 토큰 오버헤드가 감소합니다. 15% compaction 감소 실측 기준 적용 시 100K 세션 대비 약 15K 토큰 절약 가능합니다. (추정, 공식 발표 비율 적용)
PDF·이미지 대용량 자료를 함께 처리하는 경우 — 미디어 한도가 100장에서 600장으로 늘었고 같은 단가이므로, 한 번에 처리할 수 있는 양이 6배 늘었습니다.

🔴 비용이 사실상 늘 수 있는 경우

한국어 텍스트 비중이 높은 경우 — 동일한 컨텍스트도 한국어면 2.4배 토큰을 소모합니다. 1M 창에 한국어 문서를 채우면 실질 청구 금액이 영어 대비 2.4배 높습니다.
Pro 플랜에서 억지로 Opus를 사용하려는 경우 — Pro는 1M 자동 적용 대상이 아닙니다. API로 별도 접근해야 하고, 이 경우 구독 외 별도 API 비용이 발생합니다.
Effort 레벨을 High(기본값)로 유지하는 경우 — Opus 4.6의 기본 Effort는 High로 설정되어 있고 이 상태에서는 extended thinking이 더 자주 활성화됩니다. 간단한 작업에도 고비용 추론이 붙을 수 있으니, 단순 쿼리에는 `/effort medium` 또는 `/effort low`로 조정하는 게 낫습니다. (출처: Anthropic 공식 Opus 4.6 출시 노트, 2026.02.05)

▲ 목차로 돌아가기

Q&A

Q. GA 전에 beta 헤더를 코드에 넣어뒀는데 지금도 써도 되나요?

네, 문제 없습니다. Anthropic 공식 발표 기준으로 beta 헤더는 현재 자동으로 무시되도록 처리됐습니다. 코드 변경 없이 기존 요청 그대로 GA 요금이 적용됩니다. (출처: Anthropic 1M Context GA 공식 블로그, 2026.03.13)

Q. Sonnet 4.6도 1M이 되나요? Opus만 해당인가요?

Sonnet 4.6도 동일하게 1M 전체 구간을 표준 단가($3/$15 MTok)로 이용할 수 있습니다. Claude Code에서 기본 모델이 Sonnet 4.6이라면 해당 모델에도 1M이 적용됩니다. (출처: Anthropic 1M Context GA 공식 블로그, 2026.03.13)

Q. 한국어 토큰 2.4배 문제는 GA 이후 개선됐나요?

현재(2026.03.19 기준) Anthropic이 토크나이저 자체를 변경했다는 공식 발표는 확인되지 않습니다. 한국어 2.4배 배수는 여전히 유효한 것으로 보입니다. 요금 단가가 낮아졌어도 한국어 비용 구조는 기존과 동일하게 계산해야 합니다.

Q. Pro 플랜에서 1M을 쓰려면 어떻게 해야 하나요?

Pro 구독만으로는 자동 적용이 안 됩니다. API를 별도로 연결해 claude-opus-4-6 모델에 직접 요청하면 1M을 표준 API 요금으로 사용할 수 있습니다. 다만 이 경우 API 비용은 구독 한도와 별개로 청구됩니다. (확인 필요: Pro+API 조합 시 중복 청구 여부는 공식 지원 문의 권장)

Q. Effort를 낮추면 품질이 떨어지나요?

Anthropic 공식 출시 노트에 따르면, 단순 작업에서는 High 기본값이 오히려 과도한 추론(overthinking)을 일으킬 수 있다고 명시하고 있습니다. 쿼리 복잡도에 맞게 Effort를 조정하면 비용은 줄이면서 품질 저하는 최소화할 수 있습니다. 단, 복잡한 디버깅·에이전트 작업에는 High 또는 Max를 유지하는 것이 권장됩니다. (출처: Anthropic Opus 4.6 공식 출시 노트, 2026.02.05)

▲ 목차로 돌아가기

마치며

결론부터 말씀드리면, Claude Code 1M GA는 단순히 창이 커진 게 아니라 비용 구조가 바뀐 사건입니다. 200K 초과 프리미엄이 사라졌고, compaction 빈도 감소로 일부 작업에서는 총 토큰이 오히려 줄어드는 효과까지 나옵니다.

단, 한국어 사용자는 2.4배 토큰 배수를 반드시 고려해야 합니다. 이 변수 하나만 놓쳐도 비용 계산이 완전히 달라집니다. Max·Team·Enterprise 사용자라면 지금 당장 설정을 확인해볼 만하고, Pro 이하 플랜은 API 직접 연동 여부를 점검해 보시는 게 맞습니다.

막상 써보면 Gemini의 2M보다 Claude의 1M이 실무에서 더 넓게 느껴지는 이유, 이제 숫자로 설명이 됩니다.

▲ 목차로 돌아가기

📚 본 포스팅 참고 자료

※ 본 포스팅은 2026년 3월 19일 기준으로 작성됐습니다. Claude Code, Anthropic API, 요금 정책 및 플랜 조건은 이후 업데이트로 변경될 수 있습니다. 정확한 최신 정보는 claude.com 및 공식 API 문서에서 확인하시기 바랍니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다.

AI 컨텍스트 윈도우, Anthropic Academy, Claude 1M 컨텍스트, Claude Code Desktop, 클로드 코드 비용

Claude Code 1M 컨텍스트, 넓어졌는데 왜 더 싸질까요?

Claude Code 1M 컨텍스트, 넓어졌는데 왜 더 싸질까요?

GA 전후로 요금 구조가 이렇게 달라졌습니다

Gemini는 2M인데, 왜 Claude가 더 잘 쓸까요?

창이 넓어지면 오히려 토큰이 줄어드는 이유

한국어로 작업하면 이 부분이 달라집니다

Max·Team·Enterprise만 자동 적용, Free·Pro는 여기서 막힙니다

실제로 비용이 줄어드는 경우, 늘어나는 경우

💚 비용이 줄어드는 경우

🔴 비용이 사실상 늘 수 있는 경우

Q&A

마치며

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

Claude Code 1M 컨텍스트, 넓어졌는데 왜 더 싸질까요?

Claude Code 1M 컨텍스트, 넓어졌는데 왜 더 싸질까요?

GA 전후로 요금 구조가 이렇게 달라졌습니다

Gemini는 2M인데, 왜 Claude가 더 잘 쓸까요?

창이 넓어지면 오히려 토큰이 줄어드는 이유

한국어로 작업하면 이 부분이 달라집니다

Max·Team·Enterprise만 자동 적용, Free·Pro는 여기서 막힙니다

실제로 비용이 줄어드는 경우, 늘어나는 경우

💚 비용이 줄어드는 경우

🔴 비용이 사실상 늘 수 있는 경우

Q&A

마치며

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기