IT/AI
Claude Opus 4.6, 지금도 200k 넘으면 비쌀까요?
2026년 2월에 Claude Opus 4.6을 써봤다면 기억할 겁니다. 20만 토큰을 넘는 순간 요금이 두 배로 치솟았고, 클리앙·Reddit에서 “한도가 두 배 빨리 닳는다”는 글이 쏟아졌죠. 그런데 그 구조가 지난 3월 13일에 조용히 바뀌었습니다. 1M 컨텍스트가 추가 요금 없이 표준 요금으로 전환됐습니다. 경쟁사인 Gemini 3 Pro와 GPT-5.4가 여전히 장문에 할증을 부과하는 상황에서 이 변경이 실제로 어떤 의미인지 계산해봤습니다.
(입력/출력 per 1M)
(2026.03.13 기준)
(frontier 모델 최고치)
200k 초과 요금은 언제부터 사라졌나
Claude Opus 4.6은 2026년 2월 5일에 출시됐습니다. 당시 공식 발표문에는 “200k 토큰을 초과하는 프롬프트에는 프리미엄 요금($10/$37.50 per million tokens)이 적용된다”고 명시되어 있었습니다. (출처: Anthropic 공식 블로그, anthropic.com/news/claude-opus-4-6, 2026.02.05)
이 구조에서 실제로 어떤 일이 벌어졌는지는 클리앙 사용자 글에서 잘 드러납니다. “100달러 요금제에서 평소보다 2배 빠르게 한도가 소진된다”, “1분에 1%씩 소진되는 속도가 4.6 적용 후 체감상 두 배 빨라졌다”는 증언들이 출시 당일부터 쌓였습니다. 200k 토큰이 어디서 넘어가는지 알 수 없다는 것도 문제였습니다. 코드베이스 작업을 하다 보면 히스토리가 쌓이면서 어느 순간 임계치를 넘어 요금이 2배로 뛰었고, 사용자 입장에서는 예측이 불가능했습니다.
그 구조가 2026년 3월 13일부로 공식 폐지됐습니다. Anthropic은 이날 공식 블로그에서 “표준 요금이 전체 1M 컨텍스트 구간에 적용되며, 장문 프리미엄 요금은 없다”고 발표했습니다. 900k 토큰 요청과 9k 토큰 요청이 동일한 per-token 단가로 청구된다는 뜻입니다. (출처: Anthropic 공식 블로그, claude.com/blog/1m-context-ga, 2026.03.13)
💡 공식 발표문과 실제 사용자 경험을 같이 놓고 보면, 2월 출시 당시 요금 구조가 실사용에서 어떻게 작동했는지가 더 명확하게 보입니다. 출시 직후 많은 사용자가 예상치 못한 초과 요금을 경험했고, Anthropic이 50달러 크레딧을 보상으로 지급했던 것도 이 맥락입니다.
변경 전·후 요금 구조, 직접 계산해봤습니다
숫자로 확인하는 것이 가장 빠릅니다. 500k 토큰 입력 + 50k 토큰 출력 요청 하나를 기준으로 두 구조를 비교합니다.
변경 전 (2026.02.05 ~ 03.12, 200k 초과 할증 적용)
| 구간 | 토큰 수 | 단가 (입력 기준) | 비용 |
|---|---|---|---|
| 0~200k (표준) | 200,000 | $5 / 1M | $1.00 |
| 200k~500k (프리미엄) | 300,000 | $10 / 1M | $3.00 |
| 출력 50k (표준) | 50,000 | $25 / 1M | $1.25 |
| 합계 | $5.25 |
변경 후 (2026.03.13~, 표준 요금 통일)
| 구간 | 토큰 수 | 단가 | 비용 |
|---|---|---|---|
| 입력 전체 (500k) | 500,000 | $5 / 1M | $2.50 |
| 출력 50k | 50,000 | $25 / 1M | $1.25 |
| 합계 | $3.75 |
동일한 요청 하나에서 $5.25 → $3.75, 약 29% 절감입니다. 이 계산식은 Anthropic 공식 요금 페이지 수치를 기반으로 직접 산출했습니다. (출처: platform.claude.com/docs/en/about-claude/pricing) 500k 토큰은 일반적인 한국어 소설 1~2권 분량 텍스트에 해당하므로, 대용량 문서 분석이나 대규모 코드 리뷰 작업에서 매달 수십에서 수백 달러의 차이를 만들 수 있습니다.
GPT-5.4·Gemini 3 Pro는 지금도 장문에 돈이 더 나옵니다
Claude가 장문 할증을 없앤 반면, 경쟁사들은 여전히 컨텍스트 구간에 따른 이중 요금 구조를 유지하고 있습니다. Simon Willison은 3월 13일 분석에서 “OpenAI와 Gemini 모두 일정 토큰 수를 초과하면 더 많이 청구한다”며 이 차이를 명확히 지적했습니다. (출처: simonwillison.net/2026/Mar/13/1m-context/)
경쟁 모델 장문 요금 구조 비교 (2026.03.20 기준)
| 모델 | 할증 시작 구간 | 표준 입력 단가 | 장문 입력 단가 | 할증 배율 |
|---|---|---|---|---|
| Claude Opus 4.6 | 없음 (1M 전체 표준) | $5 / 1M | $5 / 1M | ×1.0 |
| GPT-5.4 | 272k 토큰 초과 | $2.50 / 1M | 할증 적용 | 초과 시 증가 |
| Gemini 3 Pro | 200k 토큰 초과 | $2 / 1M | $4 / 1M | ×2.0 |
| Claude Sonnet 4.6 | 없음 (1M 전체 표준) | $3 / 1M | $3 / 1M | ×1.0 |
※ GPT-5.4 장문 단가는 공식 llm-prices.com 링크 기준 확인 필요. Gemini 3 Pro 장문 단가: $4/$18 (200k 초과) — 출처: metacto.com Gemini 요금 가이드 2026
💡 Gemini 3 Pro의 표준 입력 단가($2)는 Claude Opus 4.6($5)보다 싸지만, 300k 토큰 이상 장문 작업에서는 Gemini의 할증이 붙어 실제 청구 단가가 $4로 올라갑니다. 이 시점부터 Opus 4.6이 더 예측 가능한 비용 구조를 가집니다. 단순 단가만 보고 “Gemini가 싸다”고 판단하면 장문 작업에서 예상보다 높은 청구서를 받을 수 있습니다.
1M이 진짜 쓸 만한지는 성능이 결정합니다
요금 구조가 바뀌어도 성능이 뒷받침되지 않으면 의미가 없습니다. 많은 AI 모델이 컨텍스트 창을 길게 지원한다고 발표하면서도 실제로는 중간 정보를 잊거나 앞부분 지시를 무시하는 ‘컨텍스트 로트(context rot)’ 현상을 보입니다.
Anthropic이 공개한 MRCR v2 벤치마크 결과는 이 부분에서 주목할 만합니다. 1M 토큰 범위에서 8개의 바늘(needle)을 숨겨놓고 정확히 찾는 테스트인데, Claude Opus 4.6은 78.3%를 기록했습니다. 비교 대상인 Claude Sonnet 4.5는 같은 조건에서 18.5%에 그쳤습니다. (출처: Anthropic 공식 블로그 claude.com/blog/1m-context-ga, 2026.03.13) 이 수치는 단순한 성능 개선이 아니라, 1M 컨텍스트가 실제 작동하는 방식 자체가 바뀌었음을 보여줍니다.
실사용 측면에서도 비슷한 결과가 보고되고 있습니다. 법률 AI 팀의 경우 “400페이지 진술서 전체를 한 번에 불러와 핵심 연결 고리를 찾을 수 있다”고 했고, 코드 리뷰 에이전트에서는 “대용량 diff 전체를 1M 컨텍스트에 넣자 청킹 없이 크로스파일 의존성 분석이 가능해졌다”는 사례도 나왔습니다. 두 케이스 모두 컨텍스트 압축(compaction) 횟수가 줄고 결과 품질이 올라간 것을 직접 측정한 사례입니다.
Claude Code 구독자는 설정 없이 자동 적용됩니다
API를 직접 호출하는 개발자뿐 아니라 Claude Code를 쓰는 구독자도 이번 변경의 영향을 받습니다. 공식 발표에 따르면 Claude Code Max, Team, Enterprise 플랜 사용자는 Opus 4.6에서 1M 컨텍스트가 자동으로 기본값으로 설정됩니다. 별도의 beta 헤더나 플래그 변경이 필요 없습니다. (출처: claude.com/blog/1m-context-ga, 2026.03.13)
이 부분이 실제로 체감되는 이유는 compaction(컨텍스트 압축) 동작과 관련이 있습니다. 기존에는 Opus 4.6을 Claude Code에서 쓸 때 대용량 파일을 불러오면 200k 한도에 가까워지면서 자동 compaction이 자주 발생했습니다. Compaction이 되면 이전 대화의 세부 사항이 요약되면서 손실이 생겼고, 이 때문에 에이전트가 “처음에 뭘 읽었더라?”를 잊는 현상이 발생했습니다. 1M 기본 적용 이후 한 팀은 “컨텍스트 압축 이벤트가 15% 감소했다”고 밝혔습니다.
💡 Claude Code Pro($20/월) 플랜은 이번 1M 자동 적용에 포함되지 않습니다. Max 플랜($100/월 또는 $200/월)부터 해당됩니다. 이 부분은 Anthropic 공식 문서에서 별도로 확인이 필요합니다. (출처: platform.claude.com/docs/en/build-with-claude/context-windows)
표준 요금이라고 무조건 저렴한 건 아닙니다
할증이 없어진 것과 비용이 낮아진 것은 다른 이야기입니다. 공식 발표문에도 “표준 요금이 ‘저렴’을 의미하지 않는다. ‘일관됨’을 의미한다”는 표현이 명시되어 있습니다. 500k 토큰 요청 하나에 입력만 $2.50이 나오는 구조입니다. 월 수백 건의 대용량 요청을 처리하는 워크플로라면 청구 총액이 여전히 상당합니다.
특히 주의할 점이 있습니다. 미디어 한도가 기존 100개에서 600개(이미지 또는 PDF 페이지)로 6배 확대됐습니다. 이 덕분에 대형 계약서 묶음이나 이미지가 포함된 대용량 문서를 한 번에 넣을 수 있게 됐지만, 한 번에 넣는 이미지나 PDF 페이지가 많아질수록 입력 토큰이 빠르게 늘어납니다. 일반 텍스트보다 이미지·PDF는 토큰 소모가 크기 때문에, 이 기능을 활용할수록 요청당 비용도 함께 오릅니다. (출처: claude.com/blog/1m-context-ga)
아울러 “garbage in, garbage out”의 규모도 커졌습니다. 600페이지짜리 비정형 문서를 통째로 넣어도 AI는 자신 있게 답하지만, 그 답이 올바른지 여부는 사람이 검증해야 합니다. 컨텍스트 창이 넓어질수록 입력 품질 관리가 더 중요해지는 이유입니다. 규제 산업에서는 데이터 처리 규정 준수 여부도 따로 확인해야 합니다.
Q&A
Q1. 200k 초과 할증 폐지는 API 사용자에게만 해당되나요?
API 사용자와 Claude Code Max·Team·Enterprise 구독자 모두 해당됩니다. 다만 Claude.ai 채팅 플랜(Pro, Max)은 토큰 단가가 아닌 사용량 한도 방식으로 과금되기 때문에 이번 요금 변경의 직접 영향은 API 사용자 쪽이 더 명확합니다. (출처: claude.com/blog/1m-context-ga, 2026.03.13)
Q2. Claude Sonnet 4.6도 같은 조건인가요?
맞습니다. Sonnet 4.6도 이번 발표에서 동일하게 1M 전체 구간에 표준 요금이 적용됩니다. 단가는 Opus 4.6($5/$25)보다 낮은 $3/$15입니다. Sonnet은 성능·비용 균형을 원하는 팀에게 더 실용적인 선택지가 됩니다.
Q3. 기존에 200k 초과 할증을 피하기 위해 beta 헤더를 썼다면 코드 수정이 필요한가요?
코드 수정 없이 그대로 사용 가능합니다. 공식 발표에 따르면 기존 beta 헤더를 그대로 보내도 자동으로 무시(ignored)됩니다. 200k 초과 요청은 별도 설정 없이 자동으로 표준 요금으로 처리됩니다. (출처: claude.com/blog/1m-context-ga)
Q4. Gemini 3 Pro의 장문 할증이 있다면, 실제로 어떤 작업에서 차이가 납니까?
법률·금융 문서 분석, 대용량 코드베이스 리뷰, 다수 파일 비교 작업처럼 300k 토큰 이상이 필요한 워크플로에서 차이가 납니다. Gemini 3 Pro는 200k 초과 구간에서 입력 단가가 $2 → $4로 2배가 되기 때문에, 이런 작업이 반복될수록 월간 누적 비용 차이가 커집니다. (출처: metacto.com Gemini 요금 가이드)
Q5. 이 변경이 향후에도 유지될 보장이 있나요?
공식 발표 기준으로는 표준 요금으로 전환됐습니다. 다만 AI 서비스는 정책 변경이 빈번하게 발생하므로 중요한 예산 계획에는 항상 공식 요금 페이지를 최신 기준으로 확인하는 것이 안전합니다. (출처: platform.claude.com/docs/en/about-claude/pricing)
마치며
솔직히 말하면, 2월에 Claude Opus 4.6을 처음 써봤을 때 “200k 넘으면 돈이 두 배 나온다”는 구조는 꽤 불편했습니다. 어디서 임계치를 넘는지 알 수가 없어서 요금 예측 자체가 힘들었고, 그 불확실성이 대용량 작업을 망설이게 만들었습니다.
3월 13일 변경은 그 불확실성을 없앴습니다. 단가가 낮아진 게 아니라 “예측 가능해졌다”는 게 핵심입니다. 500k짜리 요청이 항상 $2.50이라는 사실을 알면, 예산 계획을 짤 수 있습니다. GPT-5.4나 Gemini 3 Pro가 표준 단가로는 저렴해 보이더라도 장문 작업에서는 할증이 붙는다는 점도 함께 고려할 필요가 있습니다.
다만 이 변경이 “Opus 4.6이 싸진다”는 의미는 아닙니다. 대용량 입력에는 여전히 상당한 비용이 들고, 미디어 한도 6배 확대로 한 번에 넣을 수 있는 양이 늘어난 만큼 자칫하면 더 많이 쓸 수도 있습니다. 요금 구조를 이해한 상태에서 쓰는 것과 모르고 쓰는 것의 차이가 꽤 클 수 있습니다.
본 포스팅 참고 자료
본 포스팅은 2026년 3월 20일 기준으로 작성되었습니다. Anthropic의 서비스 정책·요금·UI·기능은 업데이트에 따라 본 포스팅 작성 이후 변경될 수 있습니다. 중요한 결정 전에는 반드시 공식 문서(platform.claude.com)에서 최신 정보를 확인하시기 바랍니다.


댓글 남기기