Claude 1M Context, 비용 폭탄 맞는 조건이 있습니다

Published on

in

Claude 1M Context, 비용 폭탄 맞는 조건이 있습니다

2026.03.13 기준 / Opus 4.6·Sonnet 4.6
TECH

Claude 1M Context, 비용 폭탄 맞는 조건이 있습니다

“이제 100만 토큰까지 추가 요금 없이 쓸 수 있다”는 말이 퍼지고 있습니다. 그 말은 절반만 맞습니다. 2026년 3월 13일, Anthropic이 Claude 1M Context를 정식 출시하면서 공개한 공식 요금 문서를 직접 뜯어보면, 200K 토큰 경계를 넘는 순간 청구 구조가 완전히 바뀝니다. 어떤 조건에서 쓰면 괜찮고 어떤 조건에서 돈이 새는지, 실측 수치와 공식 벤치마크로 정리했습니다.

1,000,000
토큰 컨텍스트 윈도우
78.3%
Opus 4.6 MRCR v2 점수
15%
Claude Code 컴팩션 감소
600장
요청당 이미지·PDF 한도

정식 출시에서 실제로 바뀐 것 3가지

2026년 3월 13일 전까지 Claude 1M Context는 베타였습니다. 베타 시절에는 API 요청 헤더에 별도 플래그를 넣어야 했고, 200K 토큰을 초과하면 입력 단가에 2배 할증이 붙었습니다. Sonnet 4.6은 1M 창 자체가 없었고요.

정식 출시(GA, General Availability) 이후 바뀐 내용을 Anthropic 공식 블로그에서 직접 확인했습니다. 첫째, Opus 4.6과 Sonnet 4.6 모두 1M 창이 열렸습니다. 둘째, 베타 헤더가 필요 없어졌습니다. 기존 코드 그대로 보내도 자동 적용됩니다. 셋째, 요청당 이미지·PDF 한도가 100장에서 600장으로 6배 늘었습니다. (출처: Anthropic 공식 블로그, 2026.03.13)

여기까지는 좋은 소식입니다. 그런데 여기서 많은 사람이 멈추고 “이제 비용 걱정 없이 무한정 넣으면 되겠다”고 넘어가버립니다. 요금 문서를 좀 더 읽으면 그렇지 않다는 사실이 드러납니다.

💡 공식 발표문 원문을 실제 요금 구조 문서와 나란히 놓고 보면, “추가 요금 없음”이라는 표현이 어느 범위에 한정된 말인지 선명하게 보입니다.

정식 출시 발표의 핵심 문장은 이겁니다: “Standard pricing now applies across the full 1M window for both models, with no long-context premium.” 여기서 “standard pricing”이 가리키는 게 뭔지가 관건입니다. 다음 섹션에서 그 구조를 뜯어봅니다.

▲ 목차로 돌아가기

200K 경계에서 벌어지는 요금 계단 현상

“추가 요금 없음”이라는 말은 베타 시절의 2배 할증이 사라졌다는 의미입니다. GA 이후 공식 요금표를 보면, Opus 4.6 기준 입력 토큰 단가는 $5/MTok, 출력은 $25/MTok입니다. 그리고 이 단가는 9K 요청이든 900K 요청이든 동일하게 적용됩니다. (출처: Anthropic 공식 블로그, 2026.03.13) 이 부분만 보면 진짜로 추가 요금이 없어 보입니다.

그런데 이건 API 직접 사용자 기준입니다. Claude Code Camp가 실제 API 호출을 통해 측정한 데이터를 보면, 200K 토큰 경계를 넘는 순간 요금 구조가 계단식으로 바뀌는 현상이 여전히 존재합니다. 공식 문서에 버전이나 별도 이유를 밝히지 않은 부분이기도 합니다. 실측치를 보면 이렇습니다.

컨텍스트 크기 입력 단가 출력 단가 구간
200K 이하 $5/MTok $25/MTok 표준
200K 초과 (전체 토큰) $10/MTok $37.50/MTok 장문맥 요금

(출처: claudecodecamp.com 실측 데이터, 2026.03.13 기준)

여기서 핵심은 “200K를 초과하면 초과분만 비싸지는 게 아니다”라는 점입니다. 실측 계산을 따라가면 이렇게 됩니다.

⚠️ 200K 경계 실제 계산

199,000 토큰 요청: 199K × $5/MTok = $0.995
201,000 토큰 요청: 201K × $10/MTok = $2.010

경계 통과 비용: $1.015 (토큰 2,000개 추가에 해당)
실질 단가: $507.50/MTok

토큰 2,000개를 더 넣었는데 비용이 두 배로 뛴다는 얘기입니다. 프롬프트 캐시 사용 시에도 같은 원리가 적용됩니다. Opus 기준 캐시 읽기는 표준 구간 $0.50/MTok에서 장문맥 구간 $1.00/MTok으로 올라갑니다. 90% 할인이 적용되기는 하지만, 기준이 되는 단가 자체가 높아지기 때문에 절약 폭이 줄어듭니다.

💡 GA 발표문에 “추가 요금 없음”이라고 나왔지만, 이건 베타 시절의 2배 할증이 사라졌다는 뜻입니다. 200K 초과 시 장문맥 요금이 붙는 구조 자체는 그대로입니다.

▲ 목차로 돌아가기

Sonnet 4.6으로 1M 쓰면 생기는 문제

“1M Context GA”라는 말에는 두 모델이 함께 묶여 있습니다. Opus 4.6과 Sonnet 4.6. 요금이 저렴한 Sonnet 4.6으로 대용량을 처리하면 되겠다는 생각이 자연스럽게 드는데, 실제 성능 수치를 보면 조심할 필요가 있습니다.

Anthropic이 공개한 MRCR v2(Multi-Round Coreference Resolution) 벤치마크에서 Opus 4.6은 1M 토큰 기준 78.3%를 기록했습니다. (출처: Anthropic 공식 블로그, 2026.03.13) 이 벤치마크는 100만 토큰짜리 컨텍스트 안에서 사람 이름, 수치, 개체들의 관계를 끝까지 추적하는 능력을 측정합니다.

반면 이전 세대인 Sonnet 4.5의 같은 조건 점수는 18.5%였습니다. (출처: claudecodecamp.com 실측 데이터, 2026.03.13) Anthropic이 아직 Sonnet 4.6의 1M 기준 MRCR 점수를 별도 공개하지 않은 상태이기 때문에, 4.6이 4.5보다 나아졌을 가능성은 있지만 확인된 수치는 없습니다.

모델 1M 토큰 MRCR 점수 실측 400K 정확도
Claude Opus 4.6 78.3% 정확 (4곳 모두)
Claude Sonnet 4.5 18.5% 부분 오류 발생
Claude Sonnet 4.6 미공개 측정치 없음

(출처: Anthropic 공식 블로그, claudecodecamp.com 실측, 2026.03.13 기준)

결론적으로, 1M 창이 열렸다고 해서 Sonnet 4.6으로 무조건 넣어도 된다고 보기는 어렵습니다. 장문맥 작업에서 Sonnet을 쓰면 장문맥 요금은 그대로 내면서 정확도는 보장받지 못하는 상황이 될 수 있습니다. 지금 단계에서는 1M 구간 작업은 Opus 4.6 기준으로 계획을 세우는 편이 현실적입니다.

▲ 목차로 돌아가기

1M이 진짜 필요한 상황과 오히려 독이 되는 상황

1M 창 자체가 나쁜 게 아닙니다. 써야 하는 상황과 쓰지 말아야 하는 상황이 꽤 명확하게 나뉩니다.

써야 하는 상황

① 단발 대용량 문서 분석: 계약서 전체 묶음, 대형 코드베이스, 수백 쪽 리포트를 한 번에 넣고 한 번에 답을 받는 경우입니다. 여러 문서가 서로 참조하는 관계일 때 진가가 나옵니다. 30개 문서를 따로 돌려서 결과를 끼워 맞추는 작업 자체가 사라집니다.

② Claude Code의 대형 디버깅 세션: 실 사용자들의 증언에 따르면 Opus 4.6 1M 창 도입 후 Claude Code에서의 컴팩션(대화 압축) 이벤트가 15% 줄었습니다. (출처: Anthropic 공식 블로그, 2026.03.13) 15개 파일에 걸친 버그를 추적할 때, 중간에 압축이 걸려 초반 발견 내용을 잊어버리던 문제가 크게 줄어드는 효과입니다.

③ 에이전트 팀이 공유 상태를 쌓는 작업: 여러 에이전트가 파일을 읽고 결과를 공유하며 컨텍스트가 빠르게 불어나는 구조에서 중간 정리 없이 전체 흐름을 유지할 수 있습니다.

쓰지 말아야 하는 상황

① 일반적인 Claude Code 세션: 실측 데이터 기준 대부분의 일상 세션은 컴팩션 이전에 80~120K 토큰 수준에서 머뭅니다. 200K에 가까이도 가지 않으니, 1M 모델을 선택해도 실제 비용은 표준 단가로 그대로입니다. 다만 1M 모델을 굳이 켜놓는 것은 의미가 없습니다.

② 긴 대화 세션: 80턴을 넘어가는 대화는 오히려 초반의 낡은 맥락이 집중력을 분산시킵니다. 이 경우엔 /clear로 초기화하는 게 1M 창을 버티는 것보다 낫습니다.

③ 중간에 자리를 비우는 세션: 캐시 TTL은 5분입니다. 500K 컨텍스트 상태에서 6분 자리를 비우면 캐시가 만료되고, 다음 메시지 처음 토큰까지 30초 이상 기다려야 합니다. 1M 기준으로는 60~90초 대기가 발생합니다. (출처: claudecodecamp.com 실측 데이터, 2026.03.13)

💡 “더 큰 창 = 더 좋은 결과”가 아닌 경우가 있습니다. 오래된 맥락이 쌓일수록 모델 집중도가 분산되는 패턴은 실측에서 명확하게 확인됩니다.

▲ 목차로 돌아가기

Claude Code Max·Team·Enterprise — 플랜별 차이

API 직접 사용자가 아니라 Claude 구독 플랜을 쓰는 경우, 1M Context가 어느 플랜부터 포함되는지가 핵심입니다. 공식 발표문에 따르면 Claude Code에서 1M 창이 기본 활성화되는 대상은 Max, Team, Enterprise 플랜의 Opus 4.6 사용자입니다. (출처: Anthropic 공식 블로그, 2026.03.13)

베타 시절에는 1M 컨텍스트가 추가 사용량을 소모했습니다. GA 이후에는 Max, Team, Enterprise 사용자라면 Opus 4.6 세션에서 자동으로 1M이 열리고, 별도 추가 비용 없이 세션이 진행됩니다. 이 차이가 체감 면에서 가장 큽니다.

Pro 플랜 사용자는 Claude.ai 앱 및 Claude Platform에서 1M 창을 쓸 수 있지만, Claude Code에서의 기본 활성화 대상에는 포함되지 않습니다. API를 직접 쓰는 경우엔 플랜 무관하게 요청당 토큰 수치에 따라 표준·장문맥 요금이 청구됩니다.

플랜 Claude Code 1M 자동 활성화 추가 비용
Max ($100/$200/월) ✅ Opus 4.6 기준 없음
Team ($30/유저/월) ✅ Opus 4.6 기준 없음
Enterprise ✅ Opus 4.6 기준 없음
Pro ($20/월) Claude.ai 앱은 가능
API 직접 사용 ✅ 요청 즉시 사용 가능 200K 초과 시 장문맥 요금 적용

(출처: Anthropic 공식 블로그, 2026.03.13 기준)

구독 플랜 기준으로는 Max·Team·Enterprise가 가장 혜택이 크고, API 직접 사용 시엔 200K 경계 관리가 비용 절감의 핵심입니다.

▲ 목차로 돌아가기

GPT-5·Gemini 3 Pro와 비교하면 어떤가

경쟁 모델과 단순히 수치를 나열하는 대신, 실제로 중요한 차이 두 가지를 짚어봅니다.

첫째, 컨텍스트 창 크기: GPT-5의 최대 컨텍스트 창은 256K 토큰입니다. Claude Opus 4.6 기준 1M에 비해 4분의 1 수준입니다. (출처: aitoolranked.com, 2026.03.13) 대형 코드베이스나 수백 쪽 계약서 전체를 단발에 처리하는 작업에서 차이가 납니다.

둘째, 장문맥 요금 구조: Gemini 3 Pro도 1M 토큰 창을 지원합니다. 그런데 Google Cloud Vertex AI 기준 Gemini 3 Pro는 컨텍스트 길이에 따라 단계적으로 단가가 올라가는 구조를 유지하고 있습니다. Claude GA 이후 단가 구조와 어느 쪽이 유리한지는 사용 패턴에 따라 다르지만, Claude 쪽이 200K 이하 구간에서는 단일 요금제로 더 단순합니다.

중요한 차이 하나: Gemini 1.5 Pro는 처음부터 1M 컨텍스트를 염두에 두고 사전 학습(pretraining)을 설계한 모델이었고, 구글 자체 테스트에서 거의 완벽한 재현율을 기록했습니다. Gemini 3 Pro는 그 다음 세대이지만, MRCR 기준 점수는 26.3%로 Opus 4.6의 78.3%에 크게 못 미칩니다. (출처: claudecodecamp.com 실측, 2026.03.13) 긴 컨텍스트 창을 갖췄다고 같은 성능이 나오는 게 아닙니다. 100만 토큰짜리 창을 열어두는 것과 그 안에서 실제로 제대로 추론하는 것은 다른 문제입니다.

💡 같은 1M 창이라도 Gemini 3 Pro와 Opus 4.6의 장문맥 정확도 점수 차이는 3배 수준입니다. 창의 크기가 아니라 그 안에서 얼마나 정확하게 작동하느냐가 실용적 기준이 됩니다.

▲ 목차로 돌아가기

Q&A

Q1. Claude 1M Context GA는 모든 플랜에 적용되나요?
API 직접 사용 시에는 모든 플랜에서 1M 창을 쓸 수 있습니다. Claude Code에서 Opus 4.6으로 1M이 기본 활성화되는 대상은 Max, Team, Enterprise 플랜입니다. Pro는 Claude.ai 앱 기준으로는 사용 가능하지만 Claude Code 기본 활성화 대상에는 포함되지 않습니다. (출처: Anthropic 공식 블로그, 2026.03.13)
Q2. 200K 이하로만 써도 1M 모델을 켜두면 요금이 더 나오나요?
아닙니다. 1M 모델을 선택해도 실제 토큰 사용이 200K 아래에 머무르는 한 표준 단가가 그대로 적용됩니다. 비용이 추가로 나오지 않습니다. 다만 클라이언트 측에서 콜드 스타트 지연이 다소 길어질 수 있습니다. (출처: claudecodecamp.com 실측, 2026.03.13)
Q3. Sonnet 4.6도 1M 창에서 정확도가 높아졌나요?
Anthropic이 Sonnet 4.6의 1M 기준 MRCR 점수를 아직 공개하지 않았습니다. 이전 세대인 Sonnet 4.5 기준 점수는 18.5%였고, 4.6이 개선됐을 가능성은 있지만 공식 수치가 없습니다. 장문맥 정확도가 중요한 작업이라면 현 시점 Opus 4.6을 쓰는 게 안전합니다.
Q4. 2배 사용 프로모션과 1M Context GA는 별개인가요?
네, 별개입니다. 2배 사용 프로모션은 2026년 3월 13일~28일까지 비성수 시간대(ET 오전 8시~오후 2시 제외) 사용 한도를 두 배로 늘려주는 기간 한정 이벤트입니다. Enterprise 플랜은 제외됩니다. 1M Context GA는 영구적인 기능 변경입니다. 두 가지가 같은 날 시작됐지만 성격이 다릅니다. (출처: Anthropic 공식 지원 문서, 2026.03.13)
Q5. 컨텍스트 중간에 있는 정보는 정말 잘 못 찾나요?
Opus 4.6 기준 실측에서, 600K 컨텍스트 내 75% 지점(중간-후반부)에 심어둔 정보를 찾을 때 이름은 맞히지만 수치를 틀리는 경우가 발생했습니다. (출처: claudecodecamp.com 실측, 2026.03.13) “Lost in the Middle”이라 불리는 이 현상은 Opus 4.6이 이전 모델 대비 크게 개선됐지만 완전히 사라지진 않았습니다. 반드시 정확하게 참조해야 하는 정보는 컨텍스트 앞이나 뒤에 배치하는 게 안전합니다.

▲ 목차로 돌아가기

마치며

Claude 1M Context GA는 실제로 의미 있는 변화입니다. 베타 시절의 2배 할증이 사라졌고, 600장 미디어 처리가 가능해졌으며, Claude Code에서 Max·Team·Enterprise 사용자라면 추가 비용 없이 쓸 수 있습니다.

단, 이걸 “이제 무한정 넣어도 된다”로 읽으면 낭패를 볼 수 있습니다. 200K 경계를 넘는 순간 청구 방식이 달라지는 구조는 GA 이후에도 그대로입니다. Sonnet 4.6의 1M 정확도는 공식 수치가 없습니다. 긴 대화에서 무조건 1M을 유지하는 게 질 좋은 결과를 보장하지도 않습니다.

개인적으로 이번 업데이트에서 가장 실용적인 변화는 단발 대용량 문서 분석 쪽입니다. 계약서 묶음 전체를 한 번에 넣거나 대형 코드베이스를 통째로 읽히는 작업 — 이 경우엔 1M이 없을 때와 있을 때의 차이가 명확합니다. 반복적인 일상 세션에서 굳이 1M을 유지할 필요는 크지 않습니다.

기능 자체가 열린 것과 그 기능을 비용 효율적으로 쓰는 것은 다른 문제입니다. 공식 요금 문서와 실측 데이터를 함께 보고 판단하는 게 맞습니다.

▲ 목차로 돌아가기

📎 본 포스팅 참고 자료

  1. Anthropic 공식 블로그 — 1M Context GA 발표 (https://claude.com/blog/1m-context-ga)
  2. Anthropic 공식 지원 문서 — 3월 2026 사용 프로모션 (https://support.claude.com/en/articles/14063676)
  3. Claude Code Camp — 1M 컨텍스트 실측 분석 (https://www.claudecodecamp.com/p/claude-code-1m-context-window)
  4. AI Tool Ranked — GA 요금 구조 분석 (https://aitoolranked.com/blog/claude-1m-context-ga-2026)
  5. Junia AI — 1M 컨텍스트 실전 가이드 (https://www.junia.ai/blog/claude-1m-context-generally-available)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 본 포스팅은 2026년 3월 25일 기준으로 작성됐으며, Anthropic의 공식 발표 및 실측 데이터를 바탕으로 합니다. 최신 요금 및 기능 변경 사항은 Anthropic 공식 사이트에서 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기