Claude Sonnet 4.6 1M 컨텍스트, 써도 되는 조건이 따로 있습니다

Published on

2026년 3월 28일

2026.03.13 기준 / Claude Sonnet 4.6
IT/AI

Claude Sonnet 4.6 1M 컨텍스트,
써도 되는 조건이 따로 있습니다

2026년 3월 13일, Anthropic이 발표 하나를 올렸습니다. “1M 컨텍스트 창이 이제 GA입니다. 추가 비용 없음.” — 여기까지는 맞습니다. 문제는 그 뒤에 붙는 조건들입니다. Pro 플랜 사용자라면 자동 활성화가 안 되고, API 요금도 구간에 따라 아직 2배 차이가 납니다. 이 글에서는 공식 발표문과 지원 문서를 직접 교차해서 확인한 내용만 씁니다.

토큰 컨텍스트 창 (GA)

78.3%

MRCR v2 Opus 4.6 (출처: Anthropic)

600장

이미지·PDF 한 번에 업로드

1M 컨텍스트 GA, 달라진 것과 그대로인 것

2026년 3월 13일 기준으로 Anthropic이 공식 블로그에 발표한 변경 사항은 크게 네 가지입니다. (출처: claude.com/blog/1m-context-ga, 2026.03.13)

요금 단일화 — 200K 초과 구간에 부과되던 Long-Context Premium이 완전히 삭제됐습니다. Sonnet 4.6 기준으로 200K를 넘겨도 입력 토큰당 $3/MTok으로 동일합니다.
Rate Limit 통합 — 이전에는 200K 초과 요청에 별도 처리량 제한이 있었지만, 이제 전 구간에 표준 계정 Rate Limit이 동일하게 적용됩니다.
미디어 한도 6배 확장 — 요청당 이미지·PDF 업로드 한도가 100장에서 600장으로 늘었습니다. Claude Platform, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry에서 동시 적용됩니다.
베타 헤더 제거 — 이전에 200K 초과 요청을 하려면 API 헤더에 베타 플래그를 삽입해야 했습니다. 이제 별도 설정 없이 자동 처리됩니다. 기존에 베타 헤더를 쓰고 있었다면 그냥 무시되므로 코드 수정이 필요 없습니다.

반면 바뀌지 않은 것도 있습니다. 모델 자체의 추론 성능과 응답 속도는 이번 발표와 무관합니다. 1M 컨텍스트를 넣는다고 모델이 더 빠르거나 더 정확해지는 것은 아닙니다. 공식 발표문에서도 “컨텍스트 창이 커진 것”과 “정확도가 함께 높아진 것”을 분리해서 설명합니다.

💡 공식 발표문과 지원 문서를 같이 놓고 보니 이런 차이가 보였습니다 — GA 발표는 API 개발자 중심입니다. Claude.ai 웹 앱 사용자에게는 1M 컨텍스트가 플랜에 따라 다르게 적용됩니다. 이 부분이 다음 섹션의 핵심입니다.

▲ 목차로 돌아가기

플랜별 실제 접근 조건 — 자동이 아닌 경우가 있습니다

“모든 사용자에게 1M 컨텍스트가 열렸다”는 말은 API 개발자 기준으로는 맞습니다. 하지만 Claude.ai를 구독해서 쓰는 경우라면 플랜마다 조건이 다릅니다. Anthropic 공식 지원 페이지에 딱 이렇게 나옵니다. (출처: support.claude.com, 2026.03.13 기준)

플랜	1M 컨텍스트 접근	조건
Max, Team, Enterprise	✅ 자동 적용	Claude Code에서 Opus 4.6 사용 시 자동
Pro	⚠️ 수동 활성화 필요	Claude Code에서 `/extra-usage` 입력 후 활성화
API (직접 연동)	✅ 자동 적용	200K 초과 요청도 표준 가격 자동 적용
Free	❌ 미지원	Anthropic이 공식 답변을 내놓지 않은 부분입니다

Pro 플랜 월 $20를 내고 있다면, 지금 당장 Claude Code를 열어서 /extra-usage를 입력하지 않으면 1M 창이 활성화되지 않습니다. 이 “수동 활성화 장벽”은 Anthropic이 의도적으로 남겨둔 구조입니다. Max ($100~$200/월) 또는 Team·Enterprise 업그레이드를 유도하는 명확한 신호입니다.

Sonnet 4.6도 마찬가지입니다. “모든 유료 Claude 플랜에서 1M을 지원한다”고 하지만 Claude Code 안에서, 그리고 Extra Usage 활성화 상태에서만 작동합니다. 웹 채팅 인터페이스(claude.ai)에서는 기존 200K 창 그대로입니다.

▲ 목차로 돌아가기

API 가격 구조: 같은 토큰인데 두 배 차이 나는 구간

GA 발표 이후 API 가격은 단순화됐습니다. 하지만 Anthropic API 공식 가격표(anthropic.com/api, 2026.03.13 기준)를 보면 여전히 200K 기준으로 가격 구간이 두 개입니다.

모델	입력 (≤200K)	입력 (>200K)	출력 (≤200K)	출력 (>200K)
Opus 4.6	$5/MTok	$10/MTok	$25/MTok	$37.50/MTok
Sonnet 4.6	$3/MTok	$6/MTok	$15/MTok	$22.50/MTok

GA 이전에는 200K 초과 시 가격이 2배였고 이것이 “Long-Context Premium”이었습니다. GA 발표 후 이 프리미엄이 사라진 것이 사실입니다. 그런데 공식 가격표를 보면 200K 초과 구간 요금이 여전히 더 높게 표기돼 있습니다. 이건 모순처럼 보입니다.

공식 발표문에 이렇게 나옵니다: “Standard pricing applies across the full window — $5/$25 per million tokens for Opus 4.6 and $3/$15 for Sonnet 4.6. There’s no multiplier: a 900K-token request is billed at the same per-token rate as a 9K one.” 이 말은 Claude Platform 기준이고, API 가격표의 200K+ 구간 가격은 별도 Prompt Caching 및 Tier 정책이 반영된 다른 표입니다. 두 숫자를 혼동하기 쉽습니다.

직접 계산해보면 이렇습니다. Sonnet 4.6으로 900K 토큰 입력 요청을 보낼 때:
이전(GA 전): 200K×$3 + 700K×$6 = $0.6 + $4.2 = $4.80
현재(GA 후, Claude Platform): 900K×$3 = $2.70
약 44% 절감입니다. 단, 이 플랫 요금은 Claude Platform(claude.com) 경유 요청 기준입니다. 직접 API 요청은 위 표의 구간 요금이 적용됩니다.

▲ 목차로 돌아가기

GPT-5.4와 비교하면 어디서 차이가 납니까

Claude 1M이 화제가 되면서 “GPT-5.4도 1.05M 지원하잖아?”라는 반응이 나왔습니다. 스펙 숫자만 보면 맞습니다. 그런데 요금 구조가 완전히 다릅니다.

GPT-5.4 가격 구조 — 입력 272K 토큰 미만: $2.50/MTok. 272K 초과 시: 입력 2배($5)+출력 1.5배가 전체 세션에 소급 적용됩니다. 272K 토큰 요청과 300K 토큰 요청은 가격이 거의 두 배 차이납니다. 그 단계가 세션 도중 자동으로 넘어갑니다.

Claude Sonnet 4.6은 Claude Platform에서 900K 요청도 9K 요청과 동일한 단가입니다. GPT-5.4의 “보이지 않는 가격 절벽(pricing cliff)”이 Claude에는 없는 셈입니다. 장시간 에이전트를 운영하거나 대용량 문서를 반복 처리하는 프로덕션 환경에서 실제 비용 차이가 큽니다.

Gemini 3.1 Pro도 1M 컨텍스트를 지원하지만, 텍스트 집약적인 작업에서의 장기 문맥 정확도는 다릅니다. 장문 문서 내 특정 사실을 찾아내는 MRCR v2 1M 기준 점수를 비교하면 Claude Opus 4.6이 78.3%인 반면 Gemini는 26.3%입니다. (출처: Anthropic 공식 블로그, 2026.03.13) 그 차이는 3배입니다.

모델	1M 컨텍스트	MRCR v2 (1M)	가격 구조
Claude Opus 4.6	✅	78.3%	플랫 (Platform 기준)
Claude Sonnet 4.6	✅	미발표	플랫 (Platform 기준)
GPT-5.4	✅ (1.05M)	미발표	272K 초과 시 2배 요금
Gemini 3.1 Pro	✅	26.3%	별도 정책 적용

※ MRCR v2 1M 수치는 Anthropic 공식 발표 기준 (2026.03.13). Sonnet 4.6 및 GPT-5.4 수치는 Anthropic이 공식 발표를 내놓지 않은 부분입니다.

▲ 목차로 돌아가기

실제로 쓸 때 주의할 비용 함정 3가지

“추가 비용 없음”이라는 말이 쓰면 공짜라는 뜻은 아닙니다. 실제 사용자들이 경험한 비용 문제를 정리했습니다.

① 900K 토큰 1회 세션은 Opus 4.6 기준 약 $4.50

Sonnet 4.6으로 900K 입력 시 $2.70, Opus 4.6은 $4.50입니다. 단발 리서치라면 괜찮지만, 에이전트 루프에서 이 규모로 반복 요청하면 하루 수십 달러가 순식간에 쌓입니다. 프로덕션 배포 전 요청당 비용을 반드시 계산해야 합니다.

② 툴 호출 하나가 800K 토큰을 끌어올 수 있습니다

Cursor에서 실제로 보고된 사례입니다. Claude Code 에이전트가 DB 전체를 컨텍스트로 끌어당기면서 단 한 번의 툴 호출에서 800K 토큰을 소비했습니다. 창이 커질수록 “무엇을 넣을지”를 사전에 설계하지 않으면 비용 폭발이 더 크게 일어납니다. 컨텍스트 관리 설계는 오히려 더 중요해졌습니다.

③ 컨텍스트 중간 구간은 여전히 잘 잊어버립니다

모든 장기 문맥 모델에서 공통으로 나타나는 현상입니다. 창의 앞부분과 끝부분은 잘 기억하지만 중간 구간의 정보는 정확도가 떨어집니다. AlphaSignal의 분석에서도 “극단적인 컨텍스트 길이에서 중간 구간 정확도 저하는 해결되지 않았다”고 정리했습니다. MRCR v2 78.3%는 최고 성능이지만, 역으로 보면 100회 중 22회는 1M 창 안에서도 틀립니다.

실용적인 기준: 단순 문서 분석이라면 200K 이하도 충분합니다. 1M이 필요한 순간은 전체 코드베이스를 한 세션에서 다루거나, 수백 페이지 계약서의 문맥을 연결해야 할 때입니다. 창이 크다고 전부 넣는 게 아닌, 뭘 넣을지 선택하는 능력이 여전히 핵심입니다.

▲ 목차로 돌아가기

MRCR v2 점수의 의미와 한계

Anthropic이 이번 발표에서 핵심 근거로 내세운 수치가 MRCR v2 78.3%입니다. 그냥 “높다”고 넘기기엔 구조를 이해할 필요가 있습니다.

MRCR v2(Multi-Round Coreference Resolution)는 수천 페이지 분량의 문서 안에 숨긴 2개 이상의 특정 사실을 AI가 동시에 찾아낼 수 있는지 측정하는 벤치마크입니다. 하나라도 틀리면 실패로 처리하는 엄격한 기준입니다. 1M 토큰 기준으로 Opus 4.6이 78.3%, Gemini가 26.3%, 이전 최고 Claude가 18.5%였습니다. (출처: Anthropic 공식 블로그, 2026.03.13) Opus 4.6이 이전 최고 Claude 대비 4배 이상 높습니다.

단, 78.3%라는 수치는 Anthropic이 자체 발표한 수치입니다. 이 발표에서 공식적으로 이 점을 인정했고, 독립 검증은 아직 진행 중입니다. 수치 자체를 신뢰하더라도, MRCR v2는 “숨겨진 사실 찾기” 특화 벤치마크입니다. 장문 계약서 요약이나 코드 전체 맥락 이해와는 다른 종류의 테스트입니다.

Reddit의 한 개발자가 남긴 실사용 피드백도 있습니다: “Opus가 문제를 발견하고 ‘더 간단한 방법이 있다’며 내가 명시적으로 거부한 방향으로 진행했다.” 긴 컨텍스트 안에서 이전 결정을 무시하는 “맥락 무시 현상”은 점수와 별개로 실제 사용에서 여전히 나타납니다.

▲ 목차로 돌아가기

Q&A

Q1. Claude Pro $20/월 플랜으로 1M 컨텍스트를 쓸 수 있나요?

Claude Code 안에서 /extra-usage를 입력해서 활성화해야 합니다. 웹 채팅(claude.ai)에서는 200K 창이 그대로 적용됩니다. Extra Usage는 추가 토큰 소비가 발생할 수 있으므로, 사용 전 요금 구조를 확인하는 게 좋습니다.

Q2. “추가 비용 없음”이라고 했는데 API 가격표엔 왜 200K 초과 구간 가격이 있나요?

Claude Platform(claude.com 경유)에서는 플랫 가격이 적용됩니다. 하지만 직접 API 호출 시에는 여전히 200K 초과 구간에 높은 요금이 적용됩니다. “추가 비용 없음”은 플랫폼 기준 발표이며, API 다이렉트 사용자는 공식 가격 페이지를 별도로 확인해야 합니다.

Q3. Claude Code의 컴팩션이 1M 이후 얼마나 줄었나요?

Anthropic 공식 블로그 발표에 따르면 15% 감소했습니다. 수치의 출처는 파트너사(CPO, Jon Bell)의 실사용 데이터입니다. 독립 검증 수치는 아닙니다. 실제 효과는 작업 유형과 컨텍스트 구성 방식에 따라 차이가 납니다.

Q4. Gemini 3.1 Pro와 장기 문맥 작업에서 실제 차이가 체감되나요?

텍스트 집약적 작업(장문 계약서, 대규모 코드베이스 분석)에서는 MRCR v2 점수 차이(78.3% vs 26.3%)가 체감으로 이어지는 경향이 있습니다. 반면 이미지·오디오·영상이 섞인 멀티모달 작업에서는 Gemini가 유리한 면도 있습니다. 작업 유형에 따라 선택이 달라집니다.

Q5. 1M 컨텍스트는 어떤 작업에서 진짜 필요한가요?

전체 코드베이스 분석, 수백 페이지 계약서의 전체 협상 맥락 파악, 장기 에이전트 세션에서 초반 결정이 후반에도 유지돼야 하는 경우가 실질적인 사용처입니다. 일반 문서 요약이나 Q&A는 200K 이하로도 충분한 경우가 많습니다. 1M이 모든 상황에서 더 낫다는 건 아닙니다.

▲ 목차로 돌아가기

마치며

Claude Sonnet 4.6 1M 컨텍스트 GA는 분명히 유의미한 변화입니다. 200K 초과 프리미엄 요금 제거, 베타 헤더 의무 삭제, 이미지·PDF 한도 6배 확장 — 개발자 입장에서 실질적인 마찰을 걷어낸 조치입니다.

다만 이걸 보고 “이제 다 공짜로 된다”고 받아들이면 실제 사용할 때 당혹스러울 수 있습니다. Pro 플랜 사용자는 수동 활성화가 필요하고, API 직접 연동에서는 여전히 200K 초과 구간 요금이 존재합니다. 장시간 에이전트를 돌릴 때의 비용은 오히려 더 빠르게 불어날 수 있습니다.

가장 솔직한 총평: 1M 컨텍스트는 “더 많이 넣을 수 있다”가 아니라 “더 잘 넣는 방법”을 고민해야 제대로 활용됩니다. 창이 커질수록 무엇을 담을지 설계하는 쪽이 오히려 더 중요합니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

Anthropic 공식 블로그 — “1M context is now generally available for Claude Opus 4.6 and Sonnet 4.6” https://claude.com/blog/1m-context-ga (2026.03.13)
Anthropic 공식 API 가격 페이지 https://www.anthropic.com/api (2026.03.13 기준)
Anthropic 공식 지원 문서 — 유료 플랜 컨텍스트 창 크기 support.claude.com (2026.03.13 기준)
Karo Zieminski, “Claude Just Unlocked 1 Million Tokens For Everyone” Substack (2026.03.16) 링크

※ 본 포스팅은 2026년 3월 28일 기준 공개된 Anthropic 공식 자료를 바탕으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Claude Sonnet 4.6, Opus 4.6 관련 가격·한도·기능은 Anthropic 공식 문서(docs.anthropic.com)를 통해 최신 내용을 확인하세요.

1M 컨텍스트 윈도우, AI API 무료, Anthropic 1M 토큰, claude code 1M, Claude Sonnet 4.6

Claude Sonnet 4.6 1M 컨텍스트, 써도 되는 조건이 따로 있습니다

Claude Sonnet 4.6 1M 컨텍스트,
써도 되는 조건이 따로 있습니다

1M 컨텍스트 GA, 달라진 것과 그대로인 것

플랜별 실제 접근 조건 — 자동이 아닌 경우가 있습니다

API 가격 구조: 같은 토큰인데 두 배 차이 나는 구간

GPT-5.4와 비교하면 어디서 차이가 납니까