2026.03.13 GA 기준
Claude Code 1M Context

Claude Code 1M Context, 모든 플랜에 열리는 줄 알았다면 — 공식 문서 3곳 직접 확인했습니다

2026년 3월 13일, Anthropic이 Claude Opus 4.6과 Sonnet 4.6의 1M 토큰 컨텍스트 윈도우를 정식 공개(GA)했습니다. 발표 직후 “드디어 Pro 구독자도 쓸 수 있다”는 글들이 쏟아졌는데, 공식 GA 블로그를 직접 읽어보니 얘기가 달랐습니다. 접근 조건, 비용 구조, 실제 토큰 효율 수치 — 세 가지를 공식 문서에서 직접 확인한 결과를 정리했습니다.

MRCR v2 회상 점수

78.3%

1M 토큰 기준 업계 최고

이전 대비 컨텍스트

5배

200k → 1M 토큰 확장

GA 적용 기준

Claude Code

Max·Team·Enterprise 한정

1M Context GA, 공식 발표문이 정확히 뭐라고 했나

Anthropic은 2026년 3월 13일 공식 블로그(claude.com/blog/1m-context-ga)를 통해 Claude Opus 4.6과 Sonnet 4.6의 1M 토큰 컨텍스트 윈도우를 정식 공개했습니다. 발표문의 첫 문장은 이렇게 시작합니다. “Standard pricing now applies across the full 1M window for both models, with no long-context premium.” 추가 요금 없이 전체 1M 윈도우를 표준 가격으로 쓸 수 있다는 뜻입니다.

발표문이 명시한 핵심 변경 사항 네 가지는 이렇습니다. 첫째, 단일 가격으로 전체 컨텍스트 윈도우를 사용할 수 있음(추가 요금 없음). 둘째, 모든 컨텍스트 길이에서 표준 계정 처리량 적용. 셋째, 요청당 미디어 한도가 100개에서 600개로 6배 확장. 넷째, 200K 토큰 초과 요청 처리 시 베타 헤더가 필요 없음.

여기서 “표준 가격”이 정확히 어떤 가격인지, 그리고 이 표준 가격이 모든 플랜에 자동 적용되는지가 핵심입니다. 공식 발표문은 “Claude Code Max, Team, and Enterprise users on Opus 4.6 will default to 1M context automatically”라고 명시했습니다. 즉, 자동 적용 대상이 특정 플랜으로 한정됩니다. (출처: Anthropic 공식 블로그, 2026.03.13)

▲ 목차로 돌아가기

Pro 구독자는 왜 아직 못 쓰는가 — 플랜별 접근 구조

💡 공식 발표문과 Reddit 실사용자 수백 명의 반응을 같이 놓고 보니, ‘요금 없음’과 ‘접근 가능’이 전혀 다른 문제였습니다.

GA 발표 이후 Reddit r/ClaudeAI에서 가장 많이 올라온 반응은 “Pro 플랜인데 왜 안 되냐”였습니다. 공식 발표문을 꼼꼼히 읽으면 이유가 나옵니다. 1M 컨텍스트 GA는 Claude Platform(API)과 Claude Code Max·Team·Enterprise 사용자에게만 기본 적용됩니다. Claude.ai 웹 인터페이스와 Pro 구독 플랜은 GA 대상에 포함되지 않았습니다.

플랜별로 정리하면 아래와 같습니다.

플랜	1M Context 접근	비고
Claude Free	❌ 불가	기본 200k 유지
Claude Pro ($20/월)	❌ 미포함	GA 대상 아님, 향후 변경 가능
Claude Max ($100~$200/월)	⚠️ Claude Code 한정	웹 UI에서는 미적용
Claude Team	✅ Claude Code	Opus 4.6 기본 적용
Claude Enterprise	✅ Claude Code	Opus 4.6 기본 적용
API (Claude Platform)	✅ 전면 적용	Opus 4.6, Sonnet 4.6 모두

결론부터 말하면, 현재 시점(2026.03.24)에서 1M Context를 쓰려면 Claude Code를 Max·Team·Enterprise 플랜으로 사용하거나, Claude Platform API를 직접 호출해야 합니다. $20짜리 Pro 플랜으로 claude.ai 웹에서 채팅하는 방식으로는 아직 쓸 수 없습니다.

▲ 목차로 돌아가기

비용 구조: 추가 요금이 없다는 말의 실제 의미

GA 발표의 핵심 문구는 “No long-context premium”입니다. 이전에는 200k 토큰을 초과하는 요청에 프리미엄 요금이 붙었습니다. Opus 4.6 기준으로 API에서는 200k 초과 시 입력 $10, 출력 $37.50(100만 토큰당)이 적용됐는데, GA 이후에는 전체 1M 범위에서 Opus 4.6 표준 가격인 입력 $5, 출력 $25가 동일하게 적용됩니다. Sonnet 4.6은 입력 $3, 출력 $15입니다. (출처: Anthropic 공식 GA 블로그, 2026.03.13)

막상 해보면 다릅니다. 900,000 토큰짜리 요청이 9,000 토큰짜리 요청과 토큰당 단가는 같지만, 절대 금액은 100배 차이가 납니다. API 요금 기준으로 900k 입력 토큰이면 Opus 4.6 기준 약 $4.5가 한 번의 요청에 나갑니다. Claude Code Max 구독자($200/월 기준) 입장에서는 구독 요금 내에서 처리되지만, 1M에 가까운 컨텍스트로 하루 몇 번만 작업해도 주간 사용량 한도를 빠르게 소진합니다.

💡 GA 발표 초기에 베타로 제공되던 시절(2026년 2월)에는 200k 초과 프리미엄 요금($10/$37.50)이 붙었습니다. 3월 13일 이후부터 그 차등 요금이 사라졌습니다. ‘추가 요금 없음’은 베타 대비 기준입니다.

Claude Code Max·Team 구독자라면 API 과금이 아닌 구독 안에서 소화됩니다. 단, 1M 컨텍스트를 적극적으로 쓰면 5시간 단위 사용량 한도가 더 빠르게 소진되는 것은 피할 수 없습니다. 한 세션에서 1M에 가까운 컨텍스트가 쌓이면, 이후 짧은 메시지 한 줄을 보내도 누적된 전체 컨텍스트 토큰이 다시 입력으로 계산되기 때문입니다.

▲ 목차로 돌아가기

1M 세션 1개 vs 200k 세션 5개 — 토큰 효율 비교

💡 “컨텍스트가 커지면 비용이 선형으로 오른다”고 생각하기 쉬운데, 실제 Claude Code 구독 환경에서는 반대 방향으로 작용할 수 있습니다.

직관적으로는 1M 토큰 세션 1개가 200k 토큰 세션 5개보다 더 많은 리소스를 쓸 것 같습니다. 실제 Claude Code 환경에서 이 가정을 검증한 사용자가 Reddit에서 구체적 수치를 공개했습니다. 해당 사용자는 Python 코드베이스 전체(약 25,000줄)를 대상으로 작업했고, 결과를 이렇게 정리했습니다.

항목	200k × 5세션	1M × 1세션
세션 시작 오버헤드	~150k~250k 토큰(5회 반복)	~30k 토큰(1회)
실제 작업 가용 토큰	750k 내외	970k 내외
컨텍스트 손실	세션 간 누적	없음
파일 재독취 여부	매 세션마다 반복	1회
단일 세션 처리량(예시)	불연속 작업 분산	47개 이슈 수정, 19개 DB 뷰 생성, 20개 커밋

이 수치가 의미하는 것은 단순합니다. 세션이 새로 시작될 때마다 CLAUDE.md 읽기, 주요 파일 파악, 이전 맥락 재정립에 드는 오버헤드가 반복 발생합니다. 1M 세션에서는 이 과정이 한 번뿐입니다.

단, Claude Code Max 구독 플랜(캐시 읽기가 실질적으로 무과금)에서 유효한 계산입니다. API 직접 호출 환경에서 캐시 할인이 적게 적용되는 경우라면, 누적 컨텍스트가 클수록 실제 비용도 올라갑니다. 어떤 환경에서 쓰느냐에 따라 효율 방정식이 달라집니다.

▲ 목차로 돌아가기

78.3% 회상 점수가 실제로 의미하는 것

1M 토큰 컨텍스트 윈도우를 가진 AI 모델이 Gemini 1.5나 GPT-4 Turbo 시대에도 있었습니다. 그런데 당시에는 “컨텍스트는 넓지만 중간을 잊어버린다”는 말이 실제 사용에서 자주 나왔습니다. 이른바 ‘컨텍스트 부패(Context Rot)’ 현상입니다. 토큰 수만으로 성능을 판단하면 안 되는 이유가 여기 있습니다.

Anthropic이 공개한 MRCR v2(Multi-Context Reasoning and Retrieval) 벤치마크에서 Opus 4.6는 1M 토큰 기준 78.3%를 기록했습니다. 이 벤치마크는 수백만 토큰 분량의 텍스트 속에 숨긴 정보를 얼마나 정확히 찾아내는지 측정합니다. 비교 대상인 Sonnet 4.5의 같은 조건 점수는 18.5%였습니다. 같은 1M 윈도우를 두고 회상 정확도가 4배 이상 차이 난다는 뜻입니다. (출처: Anthropic 공식 발표문, 2026.02.05)

직접 계산으로 체감해볼 수 있습니다. 1M 토큰은 약 750,000단어 분량입니다. 일반 소설 기준 약 2,500페이지에 해당합니다. Sonnet 4.5가 18.5% 회상 정확도라면, 이 2,500페이지짜리 맥락에서 특정 정보를 찾을 때 약 5번 중 4번은 틀리거나 빠뜨린다는 계산이 나옵니다. 78.3% 회상이라면 4번 중 3번은 정확하게 짚어냅니다.

실제 개발 환경에서 이 차이는 크로스파일 의존성 파악에서 두드러집니다. 코드베이스 전체를 올린 상태에서 “A 모듈이 B 함수에서 어떻게 호출되는지”를 물었을 때, 회상 정확도가 낮으면 RAG(검색 기반) 우회 전략이 필요했습니다. Opus 4.6에서는 그 필요성이 상당히 줄어듭니다. 하지만 78.3%는 100%가 아닙니다. 컨텍스트 최후반부나 중간에 묻힌 매우 세밀한 정보는 여전히 놓칠 수 있습니다.

▲ 목차로 돌아가기

웹·앱·IDE — 어디서 실제로 작동하는가

💡 공식 GA 발표와 실제 사용자 경험을 대조해보니, 접근 경로마다 동작이 달랐습니다. “GA 됐다”는 말을 어떤 환경에서 받아들이느냐에 따라 경험이 완전히 갈립니다.

GA 발표 이후 수백 명의 사용자가 실제 경험을 Reddit에 올렸습니다. 이를 정리하면 환경마다 동작이 달랐습니다. Claude Code CLI(터미널)에서는 Opus 4.6을 선택하면 자동으로 1M 컨텍스트가 적용됐습니다. Claude Code Desktop 앱은 GA 직후 업데이트 전까지 여전히 200k로 표시됐고, CLI로 실행해야 1M이 잡혔습니다. VS Code 확장의 Claude Code도 일부 사용자에서 200k로 유지됐습니다. Claude.ai 웹 인터페이스와 iOS/Android 앱은 GA 이후에도 1M 컨텍스트를 지원하지 않습니다.

Windsurf, Cursor에서 Claude Code를 연동한 경우도 주의가 필요합니다. 각 IDE가 Claude Code를 어떻게 호출하느냐에 따라 1M 컨텍스트 활성화 여부가 달라지며, IDE 측 설정에서 별도로 1M 옵션을 활성화해야 하는 경우도 있습니다. Anthropic이 공식 답변을 내놓지 않은 부분이라 각 IDE의 공식 릴리스노트를 확인하는 것이 정확합니다.

솔직히 말하면, GA 발표 직후 며칠간은 “되는 사람 있고 안 되는 사람 있는” 상태였습니다. 2026년 3월 24일 현재 기준으로는 Claude Code CLI에서 Max·Team·Enterprise 플랜이면 Opus 4.6과 Sonnet 4.6 모두 1M이 기본 적용됩니다. Claude Code Desktop 앱도 업데이트 이후 동일하게 적용됩니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다.

▲ 목차로 돌아가기

Q&A

Claude Code를 $20 Pro 플랜으로 쓰고 있는데, 1M Context를 쓸 수 있나요?
▼

아직 안 됩니다. GA 기준으로 Claude Code 1M Context는 Max($100~$200/월), Team, Enterprise 플랜 전용입니다. Pro 플랜은 향후 지원될 가능성이 있지만, 2026년 3월 24일 현재 공식 발표에 포함되지 않았습니다.

API로 Opus 4.6를 쓰면 1M 컨텍스트 추가 요금이 붙나요?
▼

GA 이후 추가 요금은 없습니다. Opus 4.6 표준 가격(입력 $5, 출력 $25/백만 토큰)이 전체 1M 범위에 동일하게 적용됩니다. 이전 베타 기간에는 200k 초과분에 $10/$37.50 프리미엄이 붙었고, 3월 13일 이후 그 차등 요금이 사라졌습니다. (출처: claude.com/blog/1m-context-ga, 2026.03.13)

1M 컨텍스트를 쓰면 주간 한도가 빨리 소진되나요?
▼

맞습니다. 컨텍스트가 900k에 가까운 상태에서 짧은 메시지 한 줄을 보내도, 내부적으로 전체 컨텍스트 분량이 처리됩니다. 한 세션에서 대형 코드베이스를 올리고 장시간 작업하면 5시간 단위 한도를 평소보다 빠르게 소진합니다. Claude Code Max 구독 환경에서 캐시 읽기가 실질 무과금이라는 점이 이를 어느 정도 완충하지만, 한도 소진 자체를 막지는 않습니다.

claude.ai 웹에서는 언제 1M Context를 쓸 수 있나요?
▼

공식 일정이 아직 발표되지 않았습니다. Reddit 공식 계정(ClaudeOfficial)의 GA 발표 스레드에서 이에 대한 별도 언급이 없었고, Anthropic이 공식 답변을 내놓지 않은 부분입니다. 일반적인 패턴상 Claude Code·API에 먼저 적용되고 웹 UI로 순차 확대된다는 추정이 있지만, 확정 시점은 이유가 공개되지 않았습니다.

Sonnet 4.6도 1M Context가 되나요? Opus 4.6만인가요?
▼

둘 다 됩니다. GA 발표 기준으로 Opus 4.6과 Sonnet 4.6 모두 1M 컨텍스트 윈도우를 표준 가격으로 사용할 수 있습니다. Sonnet 4.6은 입력 $3, 출력 $15(백만 토큰당). Claude Code 환경에서는 두 모델 모두 Max·Team·Enterprise에서 1M이 기본 적용됩니다. (출처: platform.claude.com/docs/en/build-with-claude/context-windows)

▲ 목차로 돌아가기

마치며

1M Context GA 발표는 분명 의미 있는 변화입니다. 토큰당 단가 차등이 사라졌고, MRCR v2 78.3%라는 회상 정확도는 단순히 창이 넓어진 게 아니라 실제로 더 쓸 수 있는 창이 생겼다는 뜻입니다. 하지만 발표 초기에 퍼진 “모든 플랜에서 무료로 쓸 수 있다”는 해석은 공식 문서와 다릅니다.

현재 기준으로 실질적인 수혜자는 Claude Code를 Max·Team·Enterprise 플랜으로 쓰거나 API를 직접 호출하는 개발자입니다. Pro 구독자나 claude.ai 웹 사용자는 아직 대기 상태입니다. 컨텍스트가 커질수록 한도 소진도 빨라지기 때문에, 무조건 1M을 꽉 채우는 방식보다 필요한 시점에 필요한 크기만큼 쓰는 접근이 실용적입니다.

개인적으로는 78.3%라는 회상 점수가 실제 개발 흐름에서 체감 차이를 낼 만한 수치라고 봅니다. 이전 1M 모델들이 ‘숫자만 큰 빈 컨텍스트’였다면, Opus 4.6은 처음으로 그 숫자를 실제로 채워 쓸 수 있는 모델에 가까워졌습니다.

본 포스팅 참고 자료

본 포스팅은 2026년 3월 24일 기준으로 작성됐습니다. Claude Code 및 Claude API의 플랜 정책·요금·UI·기능은 Anthropic의 서비스 업데이트에 따라 변경될 수 있습니다. 최신 정보는 Anthropic 공식 문서(platform.claude.com)에서 확인하시기 바랍니다.

Claude Code 1M Context, 공식 문서 3곳 직접 확인했습니다

Claude Code 1M Context, 모든 플랜에 열리는 줄 알았다면 — 공식 문서 3곳 직접 확인했습니다

1M Context GA, 공식 발표문이 정확히 뭐라고 했나

Pro 구독자는 왜 아직 못 쓰는가 — 플랜별 접근 구조

비용 구조: 추가 요금이 없다는 말의 실제 의미

1M 세션 1개 vs 200k 세션 5개 — 토큰 효율 비교

78.3% 회상 점수가 실제로 의미하는 것

웹·앱·IDE — 어디서 실제로 작동하는가

Q&A

마치며

본 포스팅 참고 자료

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

Claude Code 1M Context, 공식 문서 3곳 직접 확인했습니다

Claude Code 1M Context, 모든 플랜에 열리는 줄 알았다면 — 공식 문서 3곳 직접 확인했습니다

1M Context GA, 공식 발표문이 정확히 뭐라고 했나

Pro 구독자는 왜 아직 못 쓰는가 — 플랜별 접근 구조

비용 구조: 추가 요금이 없다는 말의 실제 의미

1M 세션 1개 vs 200k 세션 5개 — 토큰 효율 비교

78.3% 회상 점수가 실제로 의미하는 것

웹·앱·IDE — 어디서 실제로 작동하는가

Q&A

마치며

본 포스팅 참고 자료

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기