Claude Code 1M, 비용 더 나온다고요? 이 구조 먼저 보세요

Published on

in

Claude Code 1M, 비용 더 나온다고요? 이 구조 먼저 보세요

2026.03.13 GA 기준
Claude Code · Opus 4.6 / Sonnet 4.6

Claude Code 1M, 비용 더 나온다고요?
이 구조 먼저 보세요

3월 13일부터 1M 컨텍스트가 추가 요금 없이 표준 단가로 바뀌었습니다. 그런데 이 변화가 반갑기만 한 건 아닙니다. Compacting을 끄면 비용이 선형이 아니라 지수적으로 오르는 구조가 그대로 남아 있어서입니다.

78.3%
MRCR v2 1M 구간
Opus 4.6 정확도
$5/$25
Opus 4.6 단일 단가
(입력/출력 per 1M)
15%↓
Compaction 이벤트
감소율(공식 사례)

3월 13일, 뭐가 달라졌나

Claude Code 1M 컨텍스트가 2026년 3월 13일부터 정식(GA)으로 전환됐습니다. 그냥 “정식 출시”가 아닙니다. 이전에는 200K 토큰을 넘으면 프리미엄 요금이 붙었고, 베타 헤더를 요청에 직접 포함해야 했습니다. 3월 13일 이후로는 둘 다 없어졌습니다. 200K 넘는 요청도 표준 단가($5/$25 per 1M, Opus 4.6 기준)로 처리되고, 베타 헤더를 이미 넣고 있어도 자동으로 무시되니 코드 수정도 필요 없습니다. (출처: Anthropic 공식 블로그, 2026.03.13)

미디어 처리 한도도 같이 늘었습니다. 기존에는 한 번에 이미지나 PDF를 100장까지 넣을 수 있었는데, 이번 업데이트로 600장까지 가능해졌습니다. 정확히 6배 확장된 수치입니다. Claude Platform 네이티브는 물론 Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry에서도 동시에 적용됩니다.

Claude Code에서는 Max, Team, Enterprise 플랜 Opus 4.6 세션에 자동 적용됩니다. 별도로 설정할 게 없습니다.

▲ 목차로 돌아가기


출시 때와 지금의 요금이 다른 이유

💡 공식 발표문과 3월 13일 업데이트 내용을 같이 놓고 보니 요금 구조가 완전히 바뀐 게 보였습니다.

Opus 4.6가 처음 발표된 건 2026년 2월 5일입니다. 당시 공식 발표문에는 “1M 토큰 컨텍스트는 베타로 제공되며, 200K 초과 구간에는 프리미엄 요금($10/$37.50 per 1M)이 적용된다”고 명시돼 있었습니다. (출처: Anthropic 공식 발표, 2026.02.05) 다시 말해 200K를 한 줄이라도 넘으면 입력 단가가 $5에서 $10으로, 출력 단가는 $25에서 $37.50으로 올랐습니다. 2배 인상입니다.

기준 입력 (per 1M) 출력 (per 1M) 적용 범위
2월 5일 출시 당시 $10 (200K 초과 시) $37.50 (200K 초과 시) Claude Platform 베타만
3월 13일 GA 이후 $5 (전 구간 동일) $25 (전 구간 동일) Bedrock·Vertex·Foundry 포함
Sonnet 4.6 (참고) $3 (전 구간 동일) $15 (전 구간 동일) Bedrock·Vertex·Foundry 포함

2월 5일 이후 1M을 써본 사람이라면 당연히 “비싸다”는 인식이 박혔을 겁니다. 그 인식이 틀린 건 아닌데, 3월 13일부터는 상황이 달라졌습니다.

▲ 목차로 돌아가기


1M이 오히려 더 싸게 먹힐 수 있는 상황이 있습니다

💡 “컨텍스트가 클수록 당연히 비용도 크다”는 생각, 실제 사례를 보면 그렇지 않은 경우가 있습니다.

Izzy Miller(AI Research Lead)가 공식 블로그에 남긴 사례가 있습니다. 컨텍스트 창을 200K에서 500K로 늘렸더니 “에이전트가 오히려 더 효율적으로 작동했다 — 토큰 전체 사용량이 줄었다”는 내용입니다. (출처: Anthropic 공식 블로그 1M GA 발표, 2026.03.13) 처음엔 역설처럼 들리지만 이유가 있습니다. 컨텍스트 창이 좁으면 Claude가 중간중간 같은 정보를 재확인하거나, 이전에 읽은 파일을 다시 읽는 요청을 보내야 합니다. 이 반복 요청 자체가 토큰을 잡아먹습니다. 창이 넓으면 한 번 읽은 걸 그대로 유지하니 반복 요청이 줄어드는 겁니다.

더 구체적인 수치도 있습니다. Jon Bell(CPO)은 1M 전환 후 compaction 이벤트가 15% 줄었다고 밝혔습니다. 그 줄어든 15%의 compaction이 매번 불필요한 요약 토큰을 소비하던 작업이었다고 보면, 단순히 “창이 커서 토큰 더 들어간다”는 계산이 항상 맞지는 않습니다.

물론 이건 특정 상황에서의 사례입니다. 대화를 한 세션에서 매우 길게 이어가는 방식이라면 아래에서 설명할 비용 지수 증가 문제에 부딪힙니다. 용도가 명확할 때 얘기입니다.

▲ 목차로 돌아가기


그런데 $50이 3시간 만에 사라진 이유

실사용 후기를 보면 무료 크레딧 $50을 받아서 1M 모델로 3~4시간 작업했더니 전액이 소진됐다는 경험이 나옵니다. 처음 1시간 동안은 $10도 안 썼는데, 마지막 1시간에 $20 넘게 빠졌다는 내용입니다. 이게 왜 일어나는지 구조를 보면 이렇습니다.

비용 누적 구조 (같은 세션 내)
작업 초반 (0~1시간): 컨텍스트 작음 → 쿼리당 수십 센트 → 쾌적
작업 중반 (1~2시간): 컨텍스트 누적 → 쿼리당 약 $1 전후 → 슬슬 체감
작업 후반 (2~3시간): 컨텍스트 폭발 → 쿼리당 $2~3 → 실제 체감 가능

원인은 명확합니다. 1M 컨텍스트는 대화 내용을 버리지 않는 게 핵심 특징입니다. Compacting을 하지 않는 대신 이전 대화 전체가 매 쿼리마다 토큰으로 포함됩니다. 대화가 길어질수록 한 번 쿼리에 들어가는 토큰이 눈덩이처럼 불어납니다. 비용 증가가 선형이 아니라 지수적이 되는 이유입니다.

공식 비용 문서에 나오는 수치를 보면, Claude Code의 평균 비용은 개발자당 하루 $6, 90th percentile은 하루 $12입니다. (출처: Claude Code 공식 비용 문서, 2026.03 기준) 이게 “평균”이라는 게 중요합니다. 짧은 세션을 여러 번 나눠 쓰는 사람은 하루 $6 안에 충분히 들어오는데, 한 세션을 몇 시간 길게 이어가면 후반부 쿼리 비용 폭증으로 이 평균을 훌쩍 넘어갑니다.

Reddit의 “1M context window는 99%의 유저에게 마케팅”이라는 글도 이 맥락에서 나온 얘기입니다. API 직접 호출 개발자가 아니라, Claude Code 세션을 길게 돌리는 사람한테는 실제 1M 구간까지 쌓이기 전에 비용이 먼저 문제가 됩니다.

▲ 목차로 돌아가기


Max·Team·Enterprise 구독자라면 이미 기본값입니다

💡 구독 플랜을 쓰는 사람과 API 과금제를 쓰는 사람, 체감이 다를 수밖에 없는 이유가 여기 있습니다.

Claude Code Max, Team, Enterprise 플랜 구독자는 이미 Opus 4.6 세션에서 1M 컨텍스트가 기본값으로 켜져 있습니다. (출처: Anthropic 공식 블로그 1M GA 발표, 2026.03.13) “이전에는 추가 사용료가 붙었던 기능”이라는 설명도 공식적으로 명시됐습니다. 구독제는 세션 비용이 아니라 플랜 요금만 내는 구조이기 때문에, 1M을 쓴다고 추가 청구되지 않습니다. 그냥 쓰면 됩니다.

반면 API를 토큰 단위로 과금하는 경우에는 위에서 설명한 지수 증가 구조가 그대로 적용됩니다. 같은 1M 기능이지만 쓰는 방식에 따라 체감이 완전히 다릅니다. 구독자한테는 compaction이 줄어서 편해지는 얘기고, API 과금 사용자한테는 세션 관리를 어떻게 하느냐가 비용 결정의 핵심이 됩니다.

Claude Code 공식 비용 문서에서도 Sonnet 4.6 플랜($100~200)을 기준으로 하루 평균 사용 비용을 제시하고 있습니다. API 직접 호출 기준이 아닙니다. 공식 문서의 “평균 $6/일”이라는 수치는 구독 플랜 사용자를 중심으로 집계된 수치입니다.

▲ 목차로 돌아가기


실제로 얼마나 버티는지 직접 계산해봤습니다

1M 컨텍스트를 API 과금으로 쓴다면 예산을 어떻게 잡아야 할까. 실측에 기반한 수치를 가지고 직접 계산해봤습니다.

Opus 4.6 기준 단가: 입력 $5/1M 토큰, 출력 $25/1M 토큰. 대화 초반 쿼리 평균 토큰이 약 10K라고 하면 쿼리 1회 비용은 입력만 대략 $0.05입니다. 세션이 진행되면서 누적 컨텍스트가 100K에 달하면 같은 쿼리 1회 비용은 입력만 $0.50으로 10배가 됩니다. 500K가 되면 $2.50, 900K가 되면 $4.50에 달합니다. 출력 토큰까지 합산하면 여기에 5배를 더 얹습니다.

누적 컨텍스트 규모 입력 비용 (쿼리당) $50 기준 가능 쿼리 수 $50 소진 예상 시간
약 10K 토큰 (초반) 약 $0.05 1,000회 여유 있음
약 100K 토큰 (중반) 약 $0.50 100회 1~2시간대
약 500K 토큰 (후반) 약 $2.50 20회 급격히 소진

※ Opus 4.6 입력 단가 $5/1M 기준 추정치. 출력 토큰 포함 시 비용은 크게 증가. 작업 내용에 따라 실제 소모량은 달라집니다.

정리하면 한 세션을 오래 유지할수록 뒷부분 쿼리 하나의 비용이 점점 무거워집니다. 작업 목적이 끝나면 세션을 끊고 새로 시작하는 게 비용 면에서 유리합니다. 공식 문서에서도 “컨텍스트 창이 커질수록 특정 시점에 auto-compaction이 트리거된다”고 언급하고 있습니다. 1M이라고 compaction이 아예 없는 게 아니라, 그 시점이 크게 뒤로 미뤄지는 구조입니다. (출처: Claude Code 공식 비용 문서)

Opus 4.6의 MRCR v2 점수가 1M 구간에서 78.3%라는 수치도 이 맥락에서 실용적 의미가 있습니다. 같은 조건에서 Sonnet 4.5는 18.5%입니다. (출처: Anthropic 공식 발표 Opus 4.6 벤치마크, 2026.02.05) 4배 이상 차이가 나니, 1M 구간을 실제로 쓰려면 Opus 4.6이어야 회수 능력이 의미 있는 수준이 됩니다.

▲ 목차로 돌아가기


자주 묻는 것들

Q. Max 플랜 쓰면 1M 컨텍스트 쓴다고 추가 요금 나오나요?
A. 나오지 않습니다. Claude Code Max, Team, Enterprise 구독자는 Opus 4.6 세션에서 1M 컨텍스트가 기본 포함돼 있습니다. 공식 발표에 “이전에는 추가 사용이 필요했던 기능”이라고 직접 나와 있습니다. API 토큰 과금 방식을 쓰는 경우는 다릅니다. (출처: Anthropic 공식 블로그, 2026.03.13)
Q. Sonnet 4.6에서도 1M이 되나요?
A. 됩니다. 단가는 $3/$15 per 1M(입력/출력)으로 Opus 4.6보다 저렴합니다. 다만 MRCR v2 기준으로 1M 구간에서의 회수 정확도 차이가 존재합니다. Opus 4.6이 78.3%, Sonnet 4.5(비교 기준)가 18.5%이니 장거리 컨텍스트에서 중요한 정보를 잃지 않으려면 Opus 4.6 쪽이 실용적으로 더 신뢰할 수 있습니다.
Q. 3월 13일 이전에 베타 헤더를 쓰던 코드, 지금도 그대로 써도 되나요?
A. 그대로 써도 됩니다. 공식 발표에 “이미 베타 헤더를 포함하고 있으면 자동으로 무시된다”고 나와 있습니다. 코드 변경 없이 GA 혜택을 받을 수 있습니다. 헤더를 제거하고 싶으면 해도 되고, 그냥 놔둬도 기능상 차이는 없습니다.
Q. 이미지 600장 한 번에 넣는 게 실제로 가능한가요?
A. 공식 발표에 “up to 600 images or PDF pages per request”라고 나와 있습니다. 기존 100장에서 6배 확장된 수치입니다. Claude Platform 네이티브, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry에서 동시 적용됩니다. 다만 이미지 1장당 토큰 소모량이 상당하기 때문에, 대량 이미지 처리는 비용 계산을 사전에 해두는 게 좋습니다.
Q. Compaction을 완전히 끄는 게 좋은 건가요?
A. 작업 특성에 따라 다릅니다. 대용량 PDF 분석이나 이미지 수백 장 처리처럼 전체 맥락을 잃지 않아야 하는 작업은 1M + Compaction 최소화가 실질적 이득이 있습니다. 반면 일상적인 코드 작업을 길게 이어가는 용도라면 Sonnet 4.6으로 세션을 짧게 자르는 쪽이 비용면에서 유리합니다. 공식 문서에서도 Opus와 Sonnet을 작업 무게에 따라 전환하는 방식을 권장하고 있습니다.

▲ 목차로 돌아가기


마치며

Claude Code 1M 컨텍스트는 2월 5일 출시 당시와 3월 13일 GA 이후의 요금 구조가 다릅니다. 이 차이를 모르면 “1M은 비싸다”는 인식을 그대로 갖고 있을 수 있습니다. 지금은 추가 프리미엄 없이 표준 단가 그대로 씁니다.

단, 비용 구조는 여전히 세션 길이에 민감합니다. 한 세션을 길게 끌수록 후반부 쿼리 비용이 지수적으로 오릅니다. Max/Team/Enterprise 구독자라면 이 구조를 의식할 필요가 줄어들지만, API 과금 방식이라면 세션 분리 전략이 비용을 좌우합니다.

MRCR v2 1M 구간에서 Opus 4.6이 78.3%, Sonnet 4.5가 18.5%라는 수치는, “1M이 있어도 모델이 다 기억하는 게 아니다”라는 사실을 보여줍니다. 창이 크다는 것과 그 창을 실제로 잘 쓴다는 건 다른 얘기입니다. Opus 4.6 기준에서야 1M이 의미 있는 수치를 냅니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. Anthropic 공식 블로그 — 1M Context GA 발표 (claude.com/blog/1m-context-ga)
  2. Anthropic 공식 뉴스 — Claude Opus 4.6 출시 발표 (anthropic.com/news/claude-opus-4-6)
  3. Claude Code 공식 비용 관리 문서 (code.claude.com/docs/ko/costs)
  4. realcoding.blog — Claude Code 1M 실사용 비용 후기 (realcoding.blog)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 본문 내 요금 수치는 2026년 3월 13일 GA 기준이며, Anthropic의 공식 요금 정책은 사전 공지 없이 변경될 수 있습니다. 최신 요금은 공식 요금 페이지에서 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기