Claude Code 1M Context, Max·Team에서만 공짜입니다

Published on

in

Claude Code 1M Context, Max·Team에서만 공짜입니다

2026.03.29 기준
Claude Code / Opus 4.6 기준
TECH

Claude Code 1M Context, Max·Team에서만 공짜입니다

2026년 3월 13일 Anthropic이 Claude Code의 1M Context를 정식 출시했습니다. Pro 플랜으로 쓰려면 별도 활성화가 필요하고, 200K를 넘는 순간 전체 토큰 요금이 2배로 바뀝니다. 공식 문서와 실측 데이터로 직접 확인했습니다.

1M
토큰 컨텍스트 창
2배
200K 초과 시 전체 입력 토큰 요금
76.0%
Opus 4.6 MRCR v2 점수
60~90초
1M 콜드 스타트 예상 지연

1M Context란 무엇이고 왜 지금인가

Claude Code 1M Context가 2026년 3월 13일 정식 출시(GA)됐습니다. Anthropic 공식 블로그에 따르면 Opus 4.6과 Sonnet 4.6이 표준 요금으로 100만 토큰 컨텍스트 창을 전면 지원하기 시작했습니다. (출처: Anthropic 공식 블로그, 2026.03.13)

100만 토큰은 대략 750,000 단어, 중간 규모의 코드베이스 전체, 또는 약 200턴 분량의 대화에 해당합니다. 이전까지 Claude Code는 긴 세션에서 컨텍스트가 200K 한계에 닿으면 자동으로 ‘요약(compaction)’을 실행했고, 그 과정에서 이미 작업한 파일 내용이나 디버깅 맥락이 사라지는 문제가 있었습니다.

실제로 한 기업(Amplitude)의 CPO는 공식 후기에서 “1M Context 도입 이후 compaction 이벤트가 15% 줄었다”고 밝혔습니다. (출처: Anthropic 공식 블로그, 2026.03.13) 압축이 줄었다는 건 세션 중간에 정보가 소실되는 빈도가 그만큼 낮아졌다는 뜻입니다.

💡 공식 발표문에 나온 숫자와 실제 사용 흐름을 같이 보면, 1M Context가 진짜 효과를 발휘하는 구간이 “대형 코드베이스를 한 번에 읽어야 할 때”로 좁혀집니다. 대부분의 일반 대화 세션은 이 상황에 해당하지 않습니다.

그렇다면 어떤 플랜에서, 어떤 조건으로 이 기능을 쓸 수 있을까요. 공식 문서를 뜯어보면 “모두에게 무료”라는 말이 절반만 맞는다는 게 보입니다.

▲ 목차로 돌아가기

Pro 플랜에서 쓰면 어떻게 과금되는가

공식 발표 제목만 보면 “전 플랜 무료 지원”처럼 보입니다. 실제로는 조건이 붙습니다. Anthropic 지원 문서에 이렇게 나옵니다: “Pro 사용자는 Claude Code에서 Opus 4.6을 쓰려면 추가 사용량(extra usage)을 활성화해야 합니다.” (출처: Anthropic 지원 문서 #8606394, 2026.03.29 기준)

반면 Max, Team, Enterprise 플랜 사용자는 Claude Code에서 Opus 4.6의 1M Context를 자동으로 사용합니다. 추가 활성화 없이 됩니다. 즉, 무료 공짜는 Max 플랜(월 $100~)부터의 이야기입니다.

플랜 월 요금 1M Context 조건 Opus 4.6 접근
Free $0 ❌ 불가
Pro $20/월 ⚠️ extra usage 활성화 필수 + API 요금 과금 조건부
Max 5x $100/월 ✅ 자동 포함
Max 20x $200/월 ✅ 자동 포함
Team $25/좌석·월 ✅ 자동 포함

(출처: Anthropic 공식 지원 문서 #8606394 / 공식 요금 페이지, 2026.03.29 기준)

Pro 플랜에서 extra usage를 켜면 Claude Code에서 Opus 4.6을 쓸 수는 있습니다. 그런데 이때부터는 표준 API 요금이 그대로 과금됩니다. Opus 4.6 기준 입력 토큰 1M당 $5, 출력 1M당 $25입니다. 세션 하나에서 200K 토큰을 쓰면 이미 입력만 $1입니다.

💡 “Pro도 됩니다”는 기술적으로 사실입니다. 다만 그 순간 월정액 플랜이 아닌 API 종량제 요금으로 전환됩니다. 구독료 $20 위에 추가 비용이 쌓입니다.

▲ 목차로 돌아가기

200K 경계를 넘는 순간 달라지는 것

1M Context의 요금 구조에서 가장 중요한 포인트가 여기 있습니다. “200K를 넘으면 그 초과분만 더 낸다”고 생각하기 쉬운데, 실제로는 다릅니다. 200K를 1토큰이라도 넘는 순간 전체 입력 토큰 요금이 2배로 바뀝니다.

실측 수치로 바로 보면 이렇습니다.

입력 토큰 수 요금 (Opus 4.6) 적용 단가
199,000 토큰 $0.995 $5.00/M (표준)
201,000 토큰 (+2K) $2.010 $10.00/M (장문 컨텍스트)

(출처: claudecodecamp.com 실측, 2026.03.13 업데이트 기준)

2,000토큰을 더 쓰는데 비용 차이는 $1.015입니다. 그 2K 토큰의 실효 단가는 무려 $507.50/M입니다. 경계를 살짝 넘는 것이 얼마나 비싼지 보여주는 숫자입니다.

캐시도 마찬가지입니다. 200K를 넘으면 캐시 읽기(cache read) 요금도 Opus 4.6 기준 $0.50/M에서 $1.00/M으로 2배가 됩니다. 90% 캐시 할인은 그대로 적용되지만, 기준 가격이 높아진 상태에서의 할인입니다.

단, 예외가 하나 있습니다. Fast Mode를 쓰면 이 2배 장문 프리미엄이 추가로 붙지 않습니다. Fast Mode는 컨텍스트 전체에 걸쳐 균일한 단가($30/$150 per MTok)를 적용합니다. 다만 Fast Mode는 Max 구독에서도 추가 사용량(extra usage)으로 별도 과금됩니다. (출처: claudecodecamp.com, 2026.03.13)

💡 200K를 의도적으로 넘을 생각이라면 넘기는 게 맞습니다. 하지만 “어쩌다 조금 넘을 것 같은” 상황이라면 200K 이하에서 세션을 정리하는 편이 훨씬 쌉니다.

▲ 목차로 돌아가기

Sonnet 4.6으로 1M Context를 쓰면 안 되는 이유

공식 발표에서 “Sonnet 4.6도 1M Context를 지원한다”고 나와 있습니다. Opus보다 가격이 저렴하니 Sonnet을 쓰면 되지 않을까 생각하기 쉽습니다. 이 부분이 좀 아쉬웠습니다.

공식 블로그에서 Anthropic이 공개한 MRCR v2(Multi-Range Context Recall) 벤치마크 점수를 보면 이렇습니다. Opus 4.6은 1M 컨텍스트 길이에서 78.3%를 기록해 프런티어 모델 중 최고입니다. 그런데 같은 벤치마크에서 Sonnet 4.5는 18.5%를 기록했습니다. (출처: Anthropic 공식 블로그 1m-context-ga, 2026.03.13 / claudecodecamp.com 실측 데이터, 2026.03.13)

Sonnet 4.6의 1M MRCR 점수는 아직 공개되지 않은 상태입니다. Anthropic이 공식 답변을 내놓지 않은 부분입니다. 전작인 Sonnet 4.5가 18.5%였으니, 4.6이 크게 개선됐을 수도 있습니다. 하지만 공식 수치가 나오기 전까지 1M 컨텍스트에서 Sonnet을 대형 코드베이스 분석에 쓰는 건 도박에 가깝습니다.

모델 MRCR v2 @ 1M 입력 표준 단가 장문(200K+) 단가
Opus 4.6 78.3% $5.00/M $10.00/M
Sonnet 4.6 미발표 $3.00/M $6.00/M
Sonnet 4.5 (참고) 18.5%
Gemini 3 Pro (참고) 26.3%

(출처: Anthropic 공식 블로그 1m-context-ga / claudecodecamp.com 실측, 2026.03.13 기준)

600K 컨텍스트 기준으로 Sonnet 4.6을 투입하면 대화 75% 지점 이후부터 정보 손실이 시작됩니다. 2배 요금을 내면서 맥락을 절반도 못 쓰는 상황이 만들어질 수 있습니다. 긴 코드베이스 분석에는 Opus 4.6을 쓰는 게 맞습니다.

▲ 목차로 돌아가기

실제로 쓸 만한 상황과 그렇지 않은 상황

실측 실험 데이터를 바탕으로 정리해보면, 1M Context가 진짜 효과를 발휘하는 상황은 생각보다 좁습니다.

✅ 1M Context가 실제로 효과 있는 경우

  • 대형 코드베이스 또는 계약서 전체를 단발성(single-shot)으로 분석할 때
  • 15개 이상의 파일과 스택 트레이스, 재현 단계, 실패 가설이 모두 필요한 심층 디버깅
  • 여러 에이전트가 파일을 읽고 결과를 공유하며 쌓아나가는 멀티에이전트 작업
  • 300페이지짜리 정책 문서나 계약서에서 정확한 인용이 필요한 감사·컴플라이언스 작업

⚠️ 오히려 손해인 경우

  • 일반적인 Claude Code 세션 — 실측 데이터에 따르면 대부분의 세션은 compaction 전에 80~120K를 넘지 않습니다
  • 자주 자리를 비우는 세션 — 캐시 유효시간이 5분이라, 캐시가 만료된 상태에서 500K 콜드 스타트 시 응답까지 35초 지연이 발생합니다
  • Sonnet 4.6을 400K 이상 컨텍스트에서 사용할 때
  • “/clear 후 새 세션”이 오히려 더 나은 상황 — 80턴 이상 쌓인 초기 탐색 맥락은 오히려 노이즈가 되기도 합니다

특히 콜드 스타트 지연 문제는 실측에서 명확하게 드러납니다. 500K 토큰 상태에서 캐시가 만료된 경우(6분 이상 자리 비움) 첫 응답까지 약 35초가 걸렸습니다. 1M 토큰에서는 이 수치가 약 60~90초로 늘어날 것으로 추정됩니다. (출처: claudecodecamp.com 실측 데이터, 2026.03.13 / 1M 수치는 지수 함수적 추정값)

한 가지 더 주목할 만한 발견이 있습니다. 실제로 컨텍스트 창을 200K에서 500K로 늘렸더니 에이전트가 전체적으로 더 적은 토큰을 사용하더라는 후기가 있습니다. 압축 없이 작업 흐름을 유지하니 반복 탐색이 줄어든 덕분입니다. (출처: Anthropic 공식 블로그, AI Research Lead 사례, 2026.03.13) 컨텍스트 창이 커진다고 무조건 토큰 비용이 늘어나는 게 아닐 수 있다는 점을 실제 사례로 보여주는 데이터입니다.

▲ 목차로 돌아가기

1M Context를 켜는 방법과 확인 포인트

Max, Team, Enterprise 사용자라면 Claude Code에서 모델 선택 명령어로 바로 1M Context를 사용할 수 있습니다. 베타 헤더 없이 자동으로 작동합니다.

/model opus[1m]
/model sonnet[1m]
/model claude-opus-4-6[1m]
/model claude-sonnet-4-6[1m]

중요한 점: opus[1m]을 선택했다고 해서 바로 프리미엄 요금이 붙는 건 아닙니다. 컨텍스트가 200K 미만이면 표준 요금이 그대로 적용됩니다. 1M 모델을 선택해두는 것 자체는 공짜입니다. (출처: claudecodecamp.com, 2026.03.13)

Pro 플랜에서 시도하면 Claude Code 화면에 “Billed as extra usage”라는 표시가 뜹니다. 이 표시가 보인다면 지금부터 API 요금이 과금되고 있다는 신호입니다. 설정 → 사용량(Settings → Usage) 메뉴에서 extra usage 활성화 여부와 소비량을 확인할 수 있습니다. (출처: Anthropic 지원 문서 #12429409)

매체 한도도 달라졌습니다. 기존에는 요청당 이미지 또는 PDF 페이지를 최대 100개까지 넣을 수 있었는데, 이번 업데이트로 600개로 늘어났습니다. (출처: Anthropic 공식 블로그 1m-context-ga, 2026.03.13) 대규모 문서 패키지를 한 번에 처리하는 워크플로우라면 이 변화가 실질적인 차이를 만듭니다.

▲ 목차로 돌아가기

Q&A

Q. Pro 플랜에서 1M Context를 쓰면 청구서에 얼마나 뜰 수 있나요?

Opus 4.6 기준, 200K 토큰을 초과한 시점부터 전체 입력 토큰에 $10.00/M이 적용됩니다. 예를 들어 300K 토큰짜리 요청 한 번이면 입력만 $3입니다. 세션을 여러 번 반복하면 월 청구액이 빠르게 늘어납니다. extra usage 한도를 설정해두는 걸 권장합니다.

Q. Max 플랜이면 1M Context를 무한정 쓸 수 있나요?

아닙니다. Max 플랜에도 주간 사용량 한도가 있습니다. 1M 컨텍스트를 사용하면 200K 세션보다 훨씬 빠르게 한도에 도달합니다. 한도에 닿으면 extra usage(API 요금 과금)로 전환되거나 사용이 중단됩니다. Fast Mode를 쓰면 2배 프리미엄은 피할 수 있지만, 이것도 추가 사용량으로 과금됩니다.

Q. 베타 헤더를 이미 쓰고 있었다면 코드 수정이 필요한가요?

필요 없습니다. 공식 발표에서 “기존에 베타 헤더를 보내고 있었다면 무시됩니다”라고 명시됐습니다. 200K 이상의 요청은 자동으로 처리됩니다. 코드를 그대로 두셔도 됩니다. (출처: Anthropic 공식 블로그, 2026.03.13)

Q. Sonnet 4.6으로 1M Context를 쓸 수 있는 괜찮은 상황이 있나요?

있습니다. 단, 정확한 정보 검색이 아닌 구조적 패턴 파악이나 일반적인 코드 생성이 목적인 경우라면 비교적 안전합니다. 400K 이하 컨텍스트에서는 Sonnet 4.6이 Opus보다 훨씬 저렴하기 때문에 단가를 고려하면 합리적인 선택입니다. 단, 600K 이상에서 특정 문서 구절을 정확히 인용해야 한다면 Opus 4.6을 써야 합니다.

Q. Claude.ai 앱(웹·모바일)에서도 1M Context를 쓸 수 있나요?

Max, Team, Enterprise 사용자는 Claude Code뿐 아니라 Claude 앱에서도 1M 창을 쓸 수 있습니다. 단, Sonnet 4.6의 1M 지원은 Claude Code에서 extra usage를 활성화한 모든 유료 플랜에서 가능하며, 조건이 약간 다릅니다. 공식 지원 문서 #8606394에서 플랜별 조건을 직접 확인하시길 권장합니다.

▲ 목차로 돌아가기

마치며

Claude Code 1M Context는 분명히 유용한 업데이트입니다. Opus 4.6의 MRCR 78.3%는 같은 조건의 경쟁 모델 중 가장 높고, compaction 이벤트가 15% 감소했다는 실사용 데이터도 있습니다. 대형 코드베이스 분석이나 수백 페이지짜리 문서 작업에서 체감 차이가 납니다.

다만 이 기능이 모든 상황에서 모든 플랜에게 “공짜”는 아닙니다. Pro 플랜은 extra usage 활성화가 필수고, 200K를 1토큰만 넘어도 전체 요금이 2배로 바뀝니다. Sonnet 4.6의 1M 성능 수치는 아직 공개되지 않았고, 1M 콜드 스타트는 60~90초 지연이 예상됩니다.

결론부터 말씀드리면, 1M Context는 “일상적인 세션 도구”가 아니라 “특정 작업용 도구”에 가깝습니다. 대형 단발성 분석에는 켜두는 게 맞고, 보통 세션에서는 200K 이하로 관리하면서 필요할 때만 꺼내 쓰는 편이 비용과 성능 모두 유리합니다.

📌 핵심 체크리스트

  • Pro 플랜 → extra usage 활성화 없이는 Opus 4.6 자체를 못 씀
  • 200K 초과 시 전체 토큰 요금 2배 (초과분만이 아님)
  • Sonnet 4.6 1M 성능 공식 수치 아직 미발표 → 대형 검색은 Opus 4.6 권장
  • 1M 콜드 스타트 예상 60~90초 (캐시 TTL 5분 주의)
  • 매체 한도 100개 → 600개 확대 (2026.03.13 기준)
  • 기존 베타 헤더 코드는 수정 불필요 — 자동 무시됨

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. Anthropic 공식 블로그 — 1M Context GA 발표 (2026.03.13) claude.com/blog/1m-context-ga
  2. Anthropic 공식 지원 문서 — 유료 플랜 컨텍스트 창 크기 안내 support.claude.com/articles/8606394
  3. Anthropic 공식 지원 문서 — 추가 사용량(extra usage) 안내 support.claude.com/articles/12429409
  4. Claude Code Camp — 1M Context 실측 분석 (요금·레이턴시·검색 정확도) claudecodecamp.com

본 포스팅은 2026년 3월 29일 기준으로 작성됐습니다. Anthropic의 서비스 정책·UI·기능·요금은 업데이트로 인해 변경될 수 있습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있으므로 최신 정보는 공식 문서를 직접 확인하시기 바랍니다. 본 글은 특정 플랜 또는 서비스 구매를 권유하지 않습니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기