Claude Code 1M 컨텍스트, 직접 켜봤습니다

Published on

in

Claude Code 1M 컨텍스트, 직접 켜봤습니다

2026.03.13 GA 기준
Opus 4.6 / Sonnet 4.6 기준
Claude Code v2.1.76+

Claude Code 1M 컨텍스트,
직접 켜봤습니다

3월 13일 정식 GA 소식이 올라오자마자 Claude Code 터미널을 바로 열었습니다. 결론부터 말씀드리면, 켜지는 플랜과 아닌 플랜이 명확히 구분됩니다. “이제 1M 됐다”고 다들 말하는데, 정작 Pro 플랜이라면 체감이 달라질 수 있습니다.

1,000,000
GA 컨텍스트 토큰 수
78.3%
MRCR v2 리콜 정확도
-15%
compaction 발생 감소율

3월 13일에 실제로 바뀐 것

Claude Code 1M 컨텍스트는 2026년 3월 13일에 GA(General Availability), 즉 정식 출시됐습니다. 공식 블로그 발표에 따르면 Opus 4.6과 Sonnet 4.6에서 표준 요금 그대로 최대 100만 토큰 컨텍스트 창을 쓸 수 있게 됐고, 이전에 필요했던 베타 헤더도 더 이상 코드에 붙이지 않아도 됩니다. (출처: Anthropic 공식 블로그 claude.com/blog/1m-context-ga, 2026.03.13)

변경 사항을 항목별로 정리하면 다음과 같습니다.

항목 GA 이전 GA 이후 (3.13~)
컨텍스트 창 200K (기본), 1M (베타) 1M 기본 적용 (Opus 4.6)
베타 헤더 200K 초과 시 필수 불필요 (기존 헤더 있어도 무시)
장문 컨텍스트 요금 200K 초과 시 2배 프리미엄 단일 단가 전 구간 동일
미디어 첨부 한도 요청당 최대 100개 요청당 최대 600개
적용 플랜 API 한정 Max, Team, Enterprise 자동 적용

가장 눈에 띄는 변화는 요금 구조입니다. 900K 토큰 요청도 9K 요청과 완전히 동일한 토큰당 단가로 청구됩니다. “길게 쓰면 더 비싸지는 거 아니냐”는 걱정이 이번에 공식적으로 해소됐습니다.

▲ 목차로 돌아가기

Pro 플랜에서 1M이 안 켜지는 이유

공식 발표가 나오자마자 Reddit r/ClaudeAI에서 가장 많이 올라온 질문이 바로 이겁니다. “Pro 플랜인데 왜 아직 200K야?” 발표 직후 자동 생성된 요약 댓글을 보면 커뮤니티 합의는 명확합니다. “1M context는 Claude Code(Max, Team, Enterprise 플랜)와 API에 한정된다. 일반 claude.ai 웹 채팅이나 Pro 플랜에서는 아직 안 된다.” (출처: r/ClaudeAI 커뮤니티 요약, 2026.03.13)

💡 공식 발표문과 실제 접근 조건을 함께 놓고 보니 이런 차이가 보였습니다

Anthropic 공식 블로그는 “all plans”라고 표현했지만, 실제로는 Claude Code Max, Team, Enterprise에서 Opus 4.6을 사용할 때만 자동 적용됩니다. Pro 플랜의 Claude Code는 기본 모델이 Sonnet이고, Opus 접근 자체가 Max 이상에서만 열립니다. “all plans”는 API 접근 플랜 전체를 의미하는 것으로 해석하는 게 맞습니다.

요금제별 1M 컨텍스트 적용 현황을 정확히 정리하면 다음과 같습니다.

플랜 월 요금 1M 컨텍스트 조건
Free $0 Claude Code 접근 불가
Pro $20/월 Sonnet 기본, Opus 접근 불가
Max 5x $100/월 ✅ 자동 적용 Opus 4.6 기본, CLI 터미널
Max 20x $200/월 ✅ 자동 적용 Opus 4.6 기본, CLI 터미널
Team Premium $100~150/월 ✅ 자동 적용 Claude Code 포함 시트만
API 종량제 ✅ 표준 단가 Opus 4.6, Sonnet 4.6 동일

핵심은 Claude Code 터미널(CLI)에서 Max 플랜 이상이어야 한다는 겁니다. VSCode 확장이나 데스크톱 앱에서는 아직 1M 컨텍스트가 기본 적용되지 않는다는 커뮤니티 보고도 확인됩니다.

▲ 목차로 돌아가기

900K 토큰 써도 단가가 동일한 이유

이번 GA의 가장 의미 있는 변화는 가격 구조입니다. 공식 발표문에 따르면 Opus 4.6의 경우 100만 입력 토큰당 $5, 출력 토큰당 $25가 전체 1M 창에 동일하게 적용됩니다. 900K 토큰짜리 요청이 들어와도 9K 요청과 토큰당 단가가 같습니다. (출처: Anthropic 공식 블로그 claude.com/blog/1m-context-ga, 2026.03.13)

💡 Sonnet 4.5·4와 비교하면 숫자가 달라집니다

같은 Claude Code여도 모델에 따라 장문 컨텍스트 요금이 다릅니다. Sonnet 4.5와 Sonnet 4는 200K 초과 요청에 대해 표준 단가의 2배가 붙습니다. Sonnet 4.6 기준으로 100만 입력 토큰이 $3인데, 200K를 넘는 구간에서 Sonnet 4.5를 쓰면 $6입니다. 같은 작업도 어떤 모델을 선택하느냐에 따라 비용이 두 배 차이 납니다.

이걸 숫자로 직접 계산해 보면 이렇습니다.

모델 입력 (200K 이하) 입력 (200K 초과) 500K 입력 시 예상 비용
Opus 4.6 $5/MTok $5/MTok (동일) $2.50
Sonnet 4.6 $3/MTok $3/MTok (동일) $1.50
Sonnet 4.5 $3/MTok $6/MTok (2배) $2.40
Sonnet 4 $3/MTok $6/MTok (2배) $2.40

500K 입력 기준으로 Sonnet 4.5 대비 Sonnet 4.6이 38% 저렴합니다. 모델 버전 하나 차이가 요금 구조를 완전히 바꿉니다. 큰 코드베이스를 자주 다루는 환경이라면 모델 선택이 비용에 직결됩니다.

▲ 목차로 돌아가기

실제로 뭐가 달라지냐면

Anthropic 공식 블로그에 실린 실제 사용자 사례들을 보면 공통점이 있습니다. 모두 “compaction 없이 한 세션에서 끝낼 수 있게 됐다”는 얘기입니다. 그 중 Jon Bell(CPO)의 증언이 수치로 가장 명확합니다. 1M 컨텍스트 도입 후 compaction 발생 이벤트가 15% 감소했다고 밝혔습니다. (출처: Anthropic 공식 블로그, 2026.03.13)

Reddit 커뮤니티에서는 1M 세션 1회와 200K 세션 5회를 비교한 실사용 보고도 눈에 띕니다. 200K 세션 5번 합산 시 각 세션 시작마다 컨텍스트 재로딩에 쓰이는 “워밍업 토큰”이 세션당 약 30~50K씩 낭비됩니다. 반면 1M 단일 세션은 워밍업 1회로 끝납니다.

5 × 200K 세션 vs 1 × 1M 세션 토큰 효율 비교

5×200K 구조: 세션 시작마다 CLAUDE.md + 주요 파일 재읽기로 30~50K 토큰 소비. 5회 기준 약 150~250K 토큰이 워밍업에 낭비됨. 실효 작업 토큰 약 750K.

1M 단일 세션: 워밍업 1회(약 30K), 이후 전체 컨텍스트 누적 활용. 실효 작업 토큰 약 970K. 같은 비용으로 약 29% 더 많은 작업 처리 가능.

이 수치가 의미하는 것은 단순히 “컨텍스트가 길어졌다”는 게 아닙니다. 동일한 토큰 예산 안에서 실질적으로 더 많은 코드를 처리할 수 있다는 뜻입니다. 특히 수십 개 파일에 걸쳐 의존성이 연결된 리팩토링 작업에서 차이가 분명히 납니다.

▲ 목차로 돌아가기

그냥 쓰면 토큰이 순식간에 빠져나갑니다

막상 1M 컨텍스트가 열렸다고 생각 없이 쓰면 쿼터가 빠르게 소진됩니다. 커뮤니티에서 가장 많이 언급된 함정이 바로 이겁니다. Max 플랜 사용자라도 500K+ 컨텍스트 상태에서 “감사해요”같은 짧은 메시지 하나를 보내면, 그 메시지와 함께 500K 전체 컨텍스트가 재전송됩니다. 이게 곧 Pro 한도 소진으로 이어진다는 보고도 있습니다.

Anthropic 공식 비용 관리 문서에 따르면 평균 Claude Code 개발자는 하루 약 $6을 소비하며, 90%의 사용자가 하루 $12 미만을 유지합니다. (출처: code.claude.com/docs/en/costs) 이 수치는 컨텍스트를 효율적으로 관리할 때의 평균입니다.

💡 1M 컨텍스트를 쓸수록 오히려 더 적은 토큰이 들 수 있습니다

일반적으로 “컨텍스트가 커지면 토큰이 더 든다”고 생각합니다. 그런데 실제로는 반대가 될 수 있습니다. Opus 4.6으로 컨텍스트를 200K에서 500K로 늘렸을 때 오히려 에이전트 실행 효율이 높아져 전체 토큰 사용량이 줄었다는 실사용 보고가 있습니다. 세션 재시작에 드는 반복 비용이 사라지기 때문입니다. (출처: r/ClaudeAI, Izzy Miller 보고)

그럼에도 주의해야 할 상황이 있습니다.

  • MCP 서버를 여러 개 켜두면 도구 정의가 컨텍스트에 쌓입니다. 쓰지 않는 MCP는 /mcp로 비활성화하세요.
  • 무관한 작업으로 넘어갈 때 /clear를 습관화하세요. 과거 대화가 계속 쌓이면 메시지당 토큰이 30~50% 늘어납니다.
  • 확장 사고(extended thinking) 토큰은 출력 토큰으로 청구됩니다. 기본 31,999 토큰 예산으로 Opus 4.6 기준 요청당 최대 $0.80가 사고 토큰에만 쓰일 수 있습니다.
  • VSCode 확장과 CLI의 동작이 아직 다릅니다. CLI에서는 1M이 자동 활성화됐지만 VSCode 확장은 추가 업데이트를 기다려야 합니다.

/cost 명령으로 현재 세션의 토큰 사용량을 실시간 확인할 수 있습니다. API 과금 사용자라면 이 숫자가 곧 청구 금액이고, 구독 사용자라면 플랜 한도 소진 속도를 가늠하는 지표입니다.

▲ 목차로 돌아가기

Claude.ai 웹에서는 아직 안 됩니다

1M 컨텍스트가 GA됐다는 소식을 보고 브라우저에서 claude.ai를 열어 기대했다면, 아직은 맞지 않습니다. 이번 GA는 명확하게 Claude Code(터미널 CLI), Claude Platform API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry에 한정됩니다. (출처: Anthropic 공식 블로그, 2026.03.13)

커뮤니티에서는 “claude.ai에도 언제 오냐”는 질문이 꾸준히 올라오고 있지만, 공식 타임라인은 확인 필요 상태입니다. Anthropic이 코딩 툴링 쪽 업데이트에 집중하는 흐름을 봤을 때, 일반 채팅 웹 UI 적용은 시차가 있을 것으로 보입니다.

가용 환경 정리:

환경 1M 컨텍스트 비고
Claude Code CLI (터미널) Max/Team/Enterprise 자동 적용
Claude Platform API 표준 단가 적용
Amazon Bedrock 리전 엔드포인트 +10% 요금 주의
Google Vertex AI 동일
Microsoft Foundry 동일
Claude Code VSCode 확장 ⚠️ 미확인 CLI보다 업데이트 지연 보고
Claude.ai 웹 / 앱 미적용, 공식 일정 미공개

MRCR v2 기준 Opus 4.6의 1M 토큰 리콜 정확도는 78.3%로 프론티어 모델 중 최고 수치입니다. 숫자만 보면 “78%밖에 안 되는 거 아니냐”는 생각이 들 수 있는데, 이전 세대 모델들이 긴 컨텍스트에서 중간 내용을 통째로 잃어버리는 “lost in the middle” 문제를 겪었던 걸 감안하면 상당한 수준입니다.

▲ 목차로 돌아가기

Q&A

Q. Pro 플랜으로 Claude Code를 쓰는데 1M 컨텍스트를 사용하려면 어떻게 해야 하나요?
Pro 플랜의 Claude Code는 Sonnet을 기본 모델로 사용하고, Opus 4.6 접근은 Max 플랜 이상에서만 열립니다. Sonnet 4.6도 1M 컨텍스트가 적용되지만, Pro 플랜에서 Sonnet 1M이 자동으로 활성화되는지는 현재 시점(2026.03.18)에서 확인 필요입니다. 정확한 접근 권한은 Anthropic 공식 지원 문서(support.claude.com)를 직접 확인하세요.
Q. API로 Claude를 사용 중입니다. 지금 당장 비용이 달라지나요?
Opus 4.6과 Sonnet 4.6을 사용한다면 이미 표준 단가가 전 구간에 적용됩니다. 기존에 베타 헤더를 추가했다면 그냥 유지해도 되고, 삭제해도 됩니다. Sonnet 4.5나 Sonnet 4를 쓰고 있다면 200K 초과 구간에서 여전히 2배 요금이 적용됩니다. 장문 컨텍스트 작업이 많다면 Sonnet 4.6으로 업그레이드하면 비용 절감 효과가 있습니다.
Q. 1M 컨텍스트를 쓰면 응답 속도가 느려지지 않나요?
컨텍스트가 커질수록 처리 시간이 늘어나는 건 사실입니다. 단, 이전처럼 세션 중간에 compaction이 발생하며 끊기는 것보다, 처음부터 큰 컨텍스트로 한 번에 처리하는 게 전체 작업 흐름에서 더 빠른 경우가 많다는 게 실사용자들의 공통된 반응입니다.
Q. Claude.ai 웹 버전은 언제 1M 컨텍스트를 지원할 예정인가요?
2026년 3월 18일 현재 공식 일정이 공개되지 않았습니다. Anthropic은 이번 GA 발표에서 claude.ai 웹 지원 시점을 언급하지 않았습니다. 최신 일정은 Anthropic 공식 블로그(claude.com/blog)를 확인하세요.
Q. 미디어 한도가 600개로 늘었다는데, 이미지나 PDF를 어떻게 활용하나요?
이전에는 요청당 최대 100개의 이미지 또는 PDF 페이지를 첨부할 수 있었는데, 이번 GA로 600개로 확대됐습니다. 대형 PDF 문서 분석, 스크린샷 다수 포함 코드 리뷰, 방대한 디자인 시안 검토 등의 작업에서 한도 오류 없이 처리 가능합니다. Claude Platform, Microsoft Foundry, Google Vertex AI에서 오늘부터 바로 사용 가능합니다.

▲ 목차로 돌아가기

마치며

Claude Code 1M 컨텍스트 GA는 분명히 의미 있는 업데이트입니다. “긴 컨텍스트엔 추가 요금”이라는 구조가 깨진 게 핵심이고, compaction이 줄면서 실질적인 작업 효율이 높아지는 건 수치로도 확인됩니다.

솔직히 말하면, Max 플랜 이상이 아니라면 이번 업데이트를 바로 체감하기가 쉽지 않습니다. Pro 플랜 사용자라면 Sonnet 4.6에서 어떤 조건으로 1M이 적용되는지 직접 확인하고 쓰는 게 맞습니다. 그리고 1M 컨텍스트가 열렸다고 무턱대고 쌓다 보면 한도가 빠르게 소진될 수 있으니, /cost/clear를 습관처럼 쓰는 게 중요합니다.

78.3% MRCR 정확도는 “컨텍스트가 늘었으니 모델이 다 기억하겠지”라는 기대를 어느 정도 뒷받침해 줍니다. 하지만 완벽한 기억력은 아닙니다. 중요한 내용은 여전히 CLAUDE.md에 명시적으로 정리해 두는 게 안전합니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. Anthropic 공식 블로그 — 1M Context GA 발표 (2026.03.13)
  2. Anthropic 공식 지원 — Pro·Max 플랜으로 Claude Code 사용하기
  3. Anthropic 공식 API 가격 문서 (2026.03 기준)
  4. Claude Code 요금 가이드 2026 (Anthropic 공식 데이터 인용)
  5. r/ClaudeAI — GA 발표 커뮤니티 실사용 반응 (2026.03.13)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 본문의 요금·기능 정보는 2026년 3월 18일 기준으로 작성됐습니다. 최신 정보는 Anthropic 공식 채널에서 확인하세요.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기