Claude Sonnet 4.6 / Opus 4.6
IT/AI
Claude 1M 토큰, 이 조건에서만 공짜입니다
“이제 1M 토큰 무료로 쓸 수 있다”는 말이 SNS를 도배했습니다. 그런데 Anthropic 공식 발표문과 실제 사용 흐름을 같이 놓고 보면, 이 말이 절반만 맞다는 게 바로 보입니다. Claude 1M 컨텍스트가 정식 출시된 정확한 날짜, 달라진 요금 구조, 그리고 지금도 구독 플랜으로는 쓸 수 없는 경우까지 정리합니다.
3월 13일 전과 후 — 요금 구조가 어떻게 바뀌었나
Claude 1M 컨텍스트 창은 2026년 3월 13일을 기점으로 완전히 다른 제품이 됐습니다. 이날 Anthropic이 공식 블로그에서 밝힌 핵심은 “긴 컨텍스트 할증료 폐지”입니다.
베타 기간 동안 200K 토큰을 초과하는 요청에는 최대 100%의 할증료가 붙었습니다. 9K짜리 요청과 900K짜리 요청의 토큰당 단가가 달랐다는 뜻입니다. 그 구조가 3월 13일부로 사라졌습니다. 이제 Sonnet 4.6은 입력 $3, 출력 $15 (100만 토큰당), Opus 4.6은 입력 $5, 출력 $25로 길이와 무관하게 동일한 단가가 적용됩니다. (출처: Anthropic 공식 블로그, 2026.03.13)
베타 헤더도 더 이상 필요 없습니다. 200K를 초과하는 요청이 들어오면 자동으로 처리됩니다. 별도 코드 수정 없이 기존 API 호출이 그대로 동작합니다.
💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다 — 베타 기간에도 ‘1M 지원’이라고 홍보했지만 표준 가격이 아니었다는 게 핵심입니다. 3월 13일 이전과 이후의 진짜 차이는 “기능 추가”가 아니라 “요금 구조 변경”입니다.
| 구분 | 베타 (2026.03.13 이전) | GA (2026.03.13 이후) |
|---|---|---|
| 200K 초과 단가 | 최대 2배 할증 | 표준 단가 동일 |
| 베타 헤더 | 필요 | 불필요 (자동 처리) |
| 미디어 업로드 한도 | 100개 | 600개 (6배) |
| 구독 플랜 접근성 | API 전용, 구독 불가 | Max·Team·Enterprise 일부 |
출처: Anthropic 공식 블로그 (2026.03.13)
$200 구독자도 못 썼던 이유, 공식 문서에 그대로 나와 있습니다
2026년 2월 초, Reddit의 r/ClaudeCode에는 상당히 적나라한 글이 올라왔습니다. 한 달에 $200를 내는 Claude Max 구독자가 “웹 UI에서도, Claude Code에서도 1M 컨텍스트에 근접한 적조차 없다”고 쓴 내용이었습니다. 게시 점수 135점, 찬성 비율 89%. 결코 소수의 의견이 아니었습니다. (출처: Reddit r/ClaudeCode, 2026.02.06)
당시 Claude Code 공식 문서를 확인해보면 이유가 명확합니다. 1M 컨텍스트는 “API 및 종량제 사용자에게는 전체 접근 가능”이었지만, “Pro·Max·Team·Enterprise 구독자는 추가 사용료(extra usage)를 활성화해야” 쓸 수 있었습니다. 구독 요금 안에 포함된 기능이 아니었던 겁니다.
💡 여기서 자주 혼동이 생깁니다 — “1M 컨텍스트 지원”과 “1M 컨텍스트 무료 포함”은 완전히 다른 말입니다. 베타 기간에 Anthropic이 홍보한 건 전자였고, 대부분의 사용자가 기대한 건 후자였습니다.
3월 13일 GA 이후 구조가 바뀌었습니다. Claude Code Max·Team·Enterprise 플랜에서 Opus 4.6 세션은 이제 1M 컨텍스트가 기본으로 활성화됩니다. 단, Sonnet 4.6 구독 플랜 사용자의 접근 조건은 현재 Anthropic이 공식 답변을 내놓지 않은 부분입니다.
지금 1M 컨텍스트를 쓸 수 있는 조건 3가지
2026년 3월 23일 기준, 아래 세 가지 경로로만 1M 컨텍스트를 실제로 사용할 수 있습니다.
Claude API 직접 호출 (종량제)
Claude Platform 네이티브, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry에서 표준 단가로 전체 창에 접근 가능. 베타 헤더 불필요. 200K 초과 요청도 자동 처리됩니다.
Claude Code (Max·Team·Enterprise + Opus 4.6)
Opus 4.6 세션에서 1M 컨텍스트가 자동으로 기본 활성화됩니다. 이전에는 별도 extra usage 활성화가 필요했지만, GA 이후 자동 적용으로 바뀌었습니다.
Claude Code에서 모델 직접 지정 (`/model sonnet[1m]`)
Claude Code 최신 버전에서 `/model opus[1m]` 또는 `/model claude-sonnet-4-6[1m]` 명령으로 명시적으로 지정할 수 있습니다. 단, 200K 초과 구간부터는 extra usage로 청구됩니다.
⚠️ 무료 플랜 및 Pro 플랜: 현재 웹 UI(claude.ai) 채팅 창에서 1M 컨텍스트를 사용하는 경로는 아직 공개되지 않았습니다. 일반 대화 중에는 200K 초과 자동 전환이 적용되지 않습니다.
성능은 실제로 받쳐주나 — MRCR v2 78.3%의 의미
컨텍스트 창이 크다는 것과, 그 안에서 제대로 작동한다는 것은 다른 문제입니다. 학계에서 오래전부터 지적해온 “lost in the middle” 현상, 즉 긴 문서 중간에 있는 정보는 처음과 끝에 비해 모델이 잘 찾아내지 못하는 문제가 여전히 업계 전반의 과제입니다.
Anthropic의 공식 발표에 따르면, Opus 4.6은 MRCR v2(Multi Round Coreference Resolution v2) 벤치마크에서 78.3%를 기록했으며, 동급 프론티어 모델 중 가장 높은 수치입니다. (출처: Anthropic 공식 블로그, 2026.03.13) 100만 토큰 전 구간에서 정보를 얼마나 정확하게 끌어낼 수 있는지를 측정하는 지표입니다.
💡 78.3%라는 수치를 거꾸로 읽으면 — 1,000건의 정밀 추출 작업 중 약 217건은 오답이 나올 수 있다는 의미입니다. 비율은 높지만, 대규모 배치 처리에서는 반드시 검증 단계를 별도로 설계해야 합니다.
System Card에 따르면 Sonnet 4.6도 동일한 1M 컨텍스트 창을 지원하지만, MRCR v2 기준으로는 Opus 4.6이 더 높은 정밀도를 보입니다. 정밀 추출이 중요한 법률·금융 문서 처리라면 Sonnet보다 Opus를 선택하는 게 실용적입니다. (출처: Claude Sonnet 4.6 System Card, 2026.02.17)
컨텍스트를 늘렸더니 토큰이 오히려 줄었다
직관과 반대되는 결과가 공식 발표에 포함되어 있습니다. Anthropic 블로그에 인용된 실제 사례입니다. 한 팀이 Opus 4.6 세션의 컨텍스트를 200K에서 500K로 늘렸더니, 전체 토큰 사용량이 오히려 줄었습니다. (출처: Anthropic 공식 블로그, 2026.03.13)
이유는 간단합니다. 컨텍스트가 짧으면 모델이 앞의 내용을 요약(compaction)하거나, 파일을 여러 번 청킹해서 여러 번 호출해야 합니다. 그 과정에서 생기는 반복·요약·재주입 토큰이 오히려 더 많은 비용을 만들어냅니다. 컨텍스트를 길게 유지하면 그 오버헤드가 없어집니다.
💡 “컨텍스트 창이 크면 비용이 당연히 늘어난다”는 예상이 항상 맞지 않는 이유가 여기 있습니다. 에이전트 파이프라인에서 반복 호출이 많다면, 컨텍스트를 키우는 것이 전체 토큰 비용을 오히려 낮출 수 있습니다.
또 다른 실측 사례도 있습니다. 한 CPO는 1M 컨텍스트 도입 후 에이전트 세션의 compaction 이벤트가 15% 감소했다고 밝혔습니다. compaction이 줄었다는 것은 중간에 중요 정보가 증발하는 빈도도 줄었다는 뜻입니다. (출처: Anthropic 공식 블로그, 2026.03.13 — Jon Bell, CPO)
1M 토큰이 실제로 필요한 작업과 오버스펙인 작업
솔직히 말하면, 1M 컨텍스트가 필요한 작업은 아직 한정적입니다. 아래 기준으로 판단하면 대부분의 경우가 정리됩니다.
1M이 실제로 의미 있는 경우
- 대형 코드베이스 전체 분석: 일반적인 프로덕션 코드베이스는 50만~수백만 토큰. Claude Code에서 파일 간 의존성이 끊기지 않게 전체 diff를 한 번에 넣으면 크로스파일 버그 추적이 가능합니다.
- 계약서·법률 문서 협상 이력 추적: 100페이지 계약서 5회차 협상 이력 전체를 한 세션에 올리면 변경 흐름을 버전 간 비교 없이 파악할 수 있습니다.
- 멀티스텝 에이전트 실행 기록: 에이전트가 Datadog, 데이터베이스, 소스코드를 검색하면서 100K+ 토큰을 소비할 때, compaction 없이 전체 흐름을 유지할 수 있습니다.
- 대규모 이미지·PDF 배치: 한 번의 요청에 이미지·PDF 페이지를 최대 600개까지 넣을 수 있습니다. 기존 100개 한도에서 6배 확대됩니다.
1M이 오버스펙인 경우
- 일반 챗봇·고객 응대: 대화 길이가 수백~수천 토큰 수준이면 200K도 남습니다. 비용과 레이턴시만 올라갑니다.
- 단건 문서 요약·번역: 수십 페이지 문서는 200K 이내입니다. 1M 창을 열 이유가 없습니다.
- 실시간 응답이 필요한 서비스: 1M 토큰을 처리하는 요청은 레이턴시가 상당합니다. 사용자가 대기 화면을 보는 실시간 인터페이스에는 적합하지 않습니다.
비용 계산 — 900K 요청 실제로 얼마인가
직접 계산해보겠습니다. Sonnet 4.6 기준, 900K 토큰 입력에 10K 토큰 출력을 받는 요청 한 건의 비용입니다. (출처: Anthropic 공식 가격 문서, 2026.03.13 기준)
Sonnet 4.6 — 900K 입력 + 10K 출력 1회
입력: 900,000 토큰 × $3 / 1,000,000 = $2.70
출력: 10,000 토큰 × $15 / 1,000,000 = $0.15
1회 합계: $2.85 (약 4,000원)
베타 기간 같은 요청이었다면 200K 초과분에 최대 2배 할증 적용 → 약 $4.85 이상
이 수치가 의미하는 바는 명확합니다. 요청당 $2.85는 작지 않습니다. 하루 100건 처리하면 $285(약 40만 원)입니다. 배치 작업이나 에이전트 파이프라인처럼 “한 번의 긴 요청이 여러 번의 짧은 요청을 대체하는” 구조에서는 경제성이 성립하지만, 그렇지 않으면 단순히 큰 창을 열어두는 것만으로 비용이 선형으로 늘어납니다.
| 모델 | 입력 단가 | 출력 단가 | 900K 입력 비용 |
|---|---|---|---|
| Claude Sonnet 4.6 | $3 / 1M | $15 / 1M | $2.70 |
| Claude Opus 4.6 | $5 / 1M | $25 / 1M | $4.50 |
출처: Anthropic 공식 가격 문서 (platform.claude.com/docs/en/about-claude/pricing, 2026.03.13 기준)
Q&A — 자주 나오는 질문 5가지
마치며 — 총평
Claude 1M 컨텍스트는 2026년 3월 13일부로 제대로 된 제품이 됐습니다. 베타 기간의 불투명한 요금 구조, $200 구독자조차 접근하기 어려웠던 현실이 사라지고, 이제 API 호출 한 번으로 표준 가격에 전체 창을 쓸 수 있게 됐습니다.
막상 써보면 두 가지를 기억해야 합니다. 첫째, 컨텍스트를 늘렸을 때 오히려 토큰 총량이 줄어드는 케이스가 실제로 존재합니다. 에이전트 파이프라인처럼 반복 호출이 많은 구조라면 1M 컨텍스트가 비용 절감 수단이 될 수 있습니다. 둘째, MRCR v2 78.3%라는 수치는 높지만 100%가 아닙니다. 대규모 배치에서 정밀도가 중요하다면 검증 단계를 파이프라인에 반드시 끼워 넣어야 합니다.
“1M 토큰이 생겼다”는 것과 “1M 토큰을 내가 쓸 수 있다”는 건 여전히 다릅니다. 웹 채팅 위주로 사용하는 경우라면 당분간은 체감 변화가 거의 없을 겁니다. API 개발자와 Claude Code 헤비 유저에게 먼저 체감이 오는 변화입니다.
본 포스팅 참고 자료
본 포스팅은 2026년 3월 23일 기준으로 작성되었습니다. Anthropic의 서비스 정책·UI·기능·가격은 업데이트로 변경될 수 있습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있으며, 최신 정보는 Anthropic 공식 문서(platform.claude.com/docs)에서 확인하세요.


댓글 남기기