클로드 오퍼스 요금: $200 냈는데 Opus를 20%만 쓰는 진짜 이유

Published on

in

클로드 오퍼스 요금: 0 냈는데 Opus를 20%만 쓰는 진짜 이유

2026.03.15 기준 / Opus 4.6 · Sonnet 4.6 · Haiku 4.5
IT / AI

클로드 오퍼스 요금: $200 냈는데
Opus를 20%만 쓰는 진짜 이유

Max 플랜에 가입하면 오퍼스를 마음껏 쓸 수 있다고 생각하셨다면 — 지금 바로 확인하세요.

20%
Max 플랜 Opus 허용 비율
2배
200K 초과 시 입력 토큰 가격
$200
Max 20x 월 구독료

Opus 요금, 생각보다 훨씬 복잡한 구조

앤트로픽(Anthropic)의 클로드 오퍼스(Claude Opus)는 현재 최상위 모델로, 2026년 2월 기준 최신 버전인 Opus 4.6까지 출시된 상태입니다. 많은 분들이 클로드 요금을 단순히 “Pro $20, Max $100~$200″으로 이해하고 계시지만, 실제 Opus에 접근하는 방식은 구독 플랜과 API 과금이 완전히 다른 구조로 운영되고 있습니다.

공식 가격 체계를 정리하면 다음과 같습니다. 구독 플랜은 월정액으로 정해진 사용량(메시지 횟수 기준) 안에서 모델을 사용하는 방식이고, API 과금은 토큰 단위로 실제 사용량만큼 청구되는 방식입니다. 이 두 가지를 혼동하는 순간, 예상보다 훨씬 많은 비용이 나올 수 있습니다.

💡 이 분석은 Anthropic 공식 API 가격 페이지(anthropic.com/api)와 공식 지원 문서(support.claude.com)를 직접 크롤링하여 교차 검증한 결과입니다.

아래에서 다루는 Opus 20% 한도 규칙과 200K 토큰 이중 가격 구조는 대부분의 한국어 블로그에서 다루지 않은 내용입니다.

Opus 4.6 API 공식 가격표 (2026.03.15 기준)

항목 ≤ 200K 토큰 > 200K 토큰
입력(Input) $5 / MTok $10 / MTok
출력(Output) $25 / MTok $37.50 / MTok
프롬프트 캐싱 쓰기 $6.25 / MTok $12.50 / MTok
프롬프트 캐싱 읽기 $0.50 / MTok $1.00 / MTok

(출처: Anthropic 공식 API 가격 페이지, anthropic.com/api)

▲ 목차로 돌아가기

잠깐, 이게 사실입니다 — Max $200도 Opus는 20%뿐

많은 분들이 Max 20x($200/월) 플랜에 가입하면 Opus를 무제한에 가깝게 쓸 수 있다고 기대합니다. 그러나 실제 정책은 다릅니다. Anthropic 공식 지원 문서와 Reddit 사용자 검증 사례에 따르면, Claude Code 에이전트 모드에서 Opus는 5시간 세션 한도의 20%까지만 허용되고, 이후에는 자동으로 Sonnet으로 전환됩니다.

⚠️ 실제 사용자 보고 (Reddit r/ClaudeAI, 2025.06)

“Opus 4를 Max 플랜에서 사용했더니 1~2시간 만에 Opus 한도가 소진됐고, 이후 Sonnet으로 자동 전환됐다. Sonnet 한도는 그 이후로도 몇 시간 더 유지됐다.” — Reddit 사용자 (Zealousideal-Ship215)

이것이 독자에게 의미하는 것은 명확합니다. $200를 내도 Opus는 세션 한도의 20%, 나머지 80%는 Sonnet이 처리한다는 뜻입니다. Opus의 토큰당 비용이 Sonnet의 약 5배인 점을 감안하면(API 기준 입력 $5 vs $3/MTok), 이 20% 규칙은 Anthropic이 비용을 통제하기 위한 의도적 설계임을 알 수 있습니다.

계산으로 직접 확인해보세요

$$\text{Opus 실사용 비율} = \frac{20\%}{100\%} = \frac{1}{5}$$

→ 결과 해석: $200 Max 20x 플랜에서도 Opus에 배정된 쿼터는 전체의 1/5에 불과합니다. 나머지 4/5 세션 시간은 Sonnet 4.6이 사용됩니다.

물론 claude.ai 웹 인터페이스에서 직접 모델을 선택해 Opus를 사용하는 방식은 별도 쿼터로 운영됩니다. 하지만 Claude Code나 에이전트 자동화를 주로 사용하는 개발자라면, 이 20% 규칙이 치명적인 제약이 될 수 있습니다.

▲ 목차로 돌아가기

200K 토큰을 넘으면 가격이 바뀐다

API 직접 사용자라면 반드시 알아야 할 구조가 있습니다. Opus 4.6는 최대 100만 토큰(1M) 컨텍스트 창을 지원하지만, 200K 토큰을 초과하는 순간 입력 가격이 $5에서 $10으로 2배 뛰어오릅니다. 출력도 $25에서 $37.50으로 1.5배 증가합니다.

Opus 4.6 출시 당시 “100만 토큰 컨텍스트”가 크게 화제가 됐습니다. 실사용 블로그 리뷰(brunch.co.kr/@teumlab/62, 2026.02)도 “100만 토큰이면 소설 750권 분량”이라고 소개했지만, 200K 초과 시 이중 요금이 적용된다는 사실은 거의 언급되지 않았습니다.

직접 계산해볼 수 있습니다 — 200K vs 500K 입력 비교

$$\text{200K 토큰 입력 비용} = 0.2 \times \$5 = \$1.00$$
$$\text{500K 토큰 입력 비용} = 0.2 \times \$5 + 0.3 \times \$10 = \$1.00 + \$3.00 = \$4.00$$

→ 결과 해석: 입력 토큰이 200K에서 500K로 2.5배 늘었는데 비용은 4배가 됩니다. 장문 문서 분석이나 대형 코드베이스를 반복 처리할 경우 API 비용이 예상을 크게 초과할 수 있다는 의미입니다.

이 이중 가격 구조는 Sonnet 4.6도 동일하게 적용됩니다(200K 초과 시 입력 $3 → $6/MTok). 반면 Haiku 4.5는 단일 요금($1/MTok 입력)으로 이 문제에서 자유롭습니다. 따라서 대용량 컨텍스트를 자주 사용한다면 모델 선택 자체를 재고할 필요가 있습니다.

(출처: Anthropic 공식 API 가격 페이지, anthropic.com/api — 2026.03.15 직접 크롤링 확인)

▲ 목차로 돌아가기

구독 vs API, 당신에게 유리한 쪽은?

구독 플랜($20~$200)과 API 직접 과금 중 어느 쪽이 유리한지는 사용 패턴에 따라 완전히 달라집니다. 핵심은 월 사용량이 구독료를 API 단가로 나눈 손익분기점을 넘는지를 먼저 계산하는 것입니다.

Pro $20 플랜의 손익분기점 (Opus 4.6 API 기준)

$$\text{손익분기 입력 토큰} = \frac{\$20}{\$5 / \text{MTok}} = 4\,\text{MTok} = 4,000,000\,\text{토큰}$$

→ 결과 해석: Opus 4.6 API 입력 기준으로 한 달에 400만 토큰 이상 사용해야 Pro $20 구독이 이득입니다. 일반 대화 기준 1회 약 2,000토큰이라면, 월 2,000번 이상의 대화가 그 기준입니다. 일상적인 사용자라면 API 직접 사용이 더 저렴할 수 있습니다.

반면 Claude Code처럼 한 번에 수만 토큰을 소비하는 코딩 에이전트 작업에서는 구독 플랜이 훨씬 유리합니다. 코드베이스를 한 번 분석하는 데 10만~30만 토큰이 소모된다고 가정하면, API로 10회 분석 시 약 $15~$45가 청구됩니다. Pro $20이 명확히 유리해지는 구간입니다.

또한 API는 배치 처리(Batch API) 시 최대 50% 비용 절감이 가능합니다(출처: Anthropic 공식 API 페이지). 실시간 응답이 필요 없는 대량 데이터 처리 작업이라면 배치 API가 월등히 경제적입니다.

▲ 목차로 돌아가기

플랜별 실사용 메시지 한도 비교

Anthropic은 플랜별 메시지 한도를 구체적인 숫자로 공개하지 않습니다. 그러나 IntuitionLabs의 2026년 2월 28일 검증 보고서와 Reddit 실사용 데이터를 교차 분석하면 다음과 같은 실측 수치가 도출됩니다. 이 수치는 독자가 직접 본인의 사용 패턴과 비교해볼 수 있습니다.

플랜 월 요금 5시간당 메시지 (실측) Opus 접근 한도 리셋
Free $0 제한 (일 20개 내외) 매일
Pro $20 약 40~45개 △ 제한적 5시간
Max 5x $100 약 225개 △ 세션 20% 5시간
Max 20x $200 약 900개 △ 세션 20% 5시간

(출처: IntuitionLabs 실측 보고서, 2026.02.28 / 원문 링크)

여기서 주목할 점은 5시간마다 한도가 리셋된다는 구조입니다. 하루 24시간 기준으로 이론상 최대 4번의 세션이 가능합니다. 즉, Max 20x 기준으로 하루 최대 약 3,600개의 메시지가 가능하다는 뜻이지만, 이는 이상적인 조건에서의 수치이며 실제 Opus 사용 가능 시간은 각 세션의 20%인 약 1시간 내외입니다.

▲ 목차로 돌아가기

알고 보면 반대입니다 — Opus가 항상 정답이 아닌 이유

“최고 모델 = 최선의 선택”이라는 공식은 AI에서 항상 성립하지 않습니다. 앤트로픽 자신도 공식 문서에서 “단순한 질문에는 Effort 파라미터를 ‘medium’으로 낮출 것을 권장”한다고 명시하고 있습니다(출처: Anthropic 공식 API 가이드). Opus 4.6은 적응형 사고(Adaptive Thinking) 기능으로 난이도에 따라 자동으로 사고 깊이를 조절하지만, 그만큼 토큰 소비가 많아집니다.

💡 실사용 비용 비교 (동일 작업 기준)

간단한 텍스트 요약 작업 (입력 10K + 출력 2K 토큰 기준):

$$\text{Opus 4.6 비용} = (10{,}000 \times \$5 + 2{,}000 \times \$25) \div 1{,}000{,}000 = \$0.05 + \$0.05 = \$0.10$$
$$\text{Haiku 4.5 비용} = (10{,}000 \times \$1 + 2{,}000 \times \$5) \div 1{,}000{,}000 = \$0.01 + \$0.01 = \$0.02$$

→ 결과 해석: 동일한 작업에서 Opus는 Haiku의 5배 비용이 발생합니다. 단순 분류·요약·번역처럼 정밀 추론이 불필요한 작업이라면, Haiku 4.5로도 충분하며 비용은 80% 줄어듭니다.

실제로 Anthropic의 코딩 에이전트 워크플로우 권장 전략은 “Plan Mode에서 Opus로 계획 수립 → 구현 단계에서 Sonnet으로 전환”입니다. 이는 Reddit 사용자들이 직접 검증한 실전 패턴이기도 합니다. Opus를 고부가가치 추론에만 선별적으로 사용하고, 반복적인 실행 작업은 Sonnet이나 Haiku에 넘기는 방식이 가장 비용 효율적입니다.

2026년 2월 기준, Opus 4.6의 ARC-AGI-2 벤치마크 점수는 68.8%로 전작(37.6%) 대비 거의 2배 향상됐습니다(출처: Anthropic 공식 발표, 2026.02). 하지만 SWE-bench Verified(코딩 평가)에서는 전작 대비 0.1% 소폭 후퇴(80.9% → 80.8%)했습니다. 즉, 복잡한 추론 및 법률·금융 분석에서는 Opus의 우위가 뚜렷하지만, 일반 코딩 작업에서는 더 저렴한 Sonnet 4.6이 실질적으로 동등한 성능을 보인다는 뜻입니다.

▲ 목차로 돌아가기

자주 묻는 질문 5가지

Q1. 클로드 Pro $20 플랜에서 Opus 4.6을 쓸 수 있나요?
Pro 플랜에서도 Opus 4.6에 접근할 수 있지만 사용량이 매우 제한됩니다. 5시간 세션 기준 약 40~45개의 메시지 한도 내에서, Opus는 그 일부만 허용됩니다. 일반적인 대화·문서 작업 위주라면 Pro로도 충분하지만, Claude Code를 통한 장시간 코딩 에이전트 작업이라면 한도에 빠르게 도달합니다.
Q2. Max $200 플랜을 써도 “한도 초과” 메시지가 뜨는 이유가 뭔가요?
앞서 설명한 20% Opus 규칙 때문입니다. Opus는 Sonnet의 약 5배 컴퓨팅 비용이 들기 때문에, 전체 세션 쿼터의 20%가 소진되면 Sonnet으로 자동 전환됩니다. 만약 Opus 대화가 집중적으로 이루어졌다면 Opus 전용 한도가 1~2시간 만에 소진될 수 있습니다. 이후 Sonnet으로 계속 작업하거나 5시간 후 리셋을 기다려야 합니다.
Q3. API로 Opus를 직접 사용하면 한도 제한이 없나요?
API는 토큰 사용량 기준으로 요금이 청구되므로 20% 규칙은 적용되지 않습니다. 대신 분당 요청 수(Rate Limit)와 월 최대 토큰 처리량 제한은 존재합니다. 개인 API 계정은 등급에 따라 점진적으로 한도가 올라가는 구조이며, 초기 계정은 낮은 한도에서 시작합니다. 비용만 감당된다면 구독 플랜보다 유연하게 사용할 수 있습니다.
Q4. 100만 토큰 컨텍스트를 풀로 활용하면 실제로 얼마가 나오나요?
Opus 4.6 API 기준으로, 입력 1M 토큰을 한 번에 처리하면 처음 200K는 $5/MTok, 나머지 800K는 $10/MTok이 적용됩니다. 계산하면 (0.2 × $5) + (0.8 × $10) = $1 + $8 = $9가 됩니다. 여기에 출력 토큰이 더해지면 한 번의 호출에 수십 달러가 나올 수 있습니다. 대용량 컨텍스트가 필요하다면 프롬프트 캐싱을 반드시 활용하세요.
Q5. Sonnet 4.6과 Opus 4.6 중 코딩 작업에 어느 쪽이 낫나요?
공식 벤치마크(SWE-bench Verified) 기준으로 Opus 4.6은 80.8%, Sonnet 4.6은 세부 수치가 달라집니다. 하지만 일반 코딩 작업에서 실측 차이는 미미하다는 실사용 후기가 많습니다. Anthropic 스스로도 “계획(Plan)은 Opus, 구현(Implement)은 Sonnet” 조합을 권장합니다. 비용 대비 성능 면에서 Sonnet이 더 합리적이며, 복잡한 아키텍처 설계나 법률·금융 분석처럼 정밀 추론이 필요한 경우에만 Opus를 선택적으로 사용하는 것이 최적입니다.

▲ 목차로 돌아가기

마치며 — 요금 구조를 알면 선택이 달라집니다

클로드 오퍼스 요금에 대해 핵심만 정리하자면 이렇습니다. 구독 플랜에서 Opus는 생각보다 제한적으로 제공되고, API에서는 200K 토큰을 기점으로 단가가 2배로 뛰는 이중 구조가 숨어 있습니다. 이 두 가지를 모르고 막연히 “최고 플랜 = 최고 경험”을 기대하면 기대와 다른 사용 경험을 하게 됩니다.

개인적인 의견을 솔직히 말씀드리면, 일반적인 AI 보조 작업이나 문서 작업에는 Pro $20 + Sonnet 4.6 조합이 가장 현실적입니다. Claude Code를 하루 종일 돌리는 전업 개발자라면 Max $100이 합리적이고, $200 플랜은 정말 Opus를 하루 종일 사용해야 하는 특수한 업무 환경이 아니면 과투자일 수 있습니다.

AI 서비스 요금은 빠르게 변합니다. 이 포스팅도 업데이트 시점에 따라 내용이 달라질 수 있으니, 결정 전 반드시 공식 페이지를 직접 확인하시기 바랍니다.

📚 본 포스팅 참고 자료

  1. Anthropic 공식 API 가격 페이지 — anthropic.com/api
  2. Anthropic 공식 플랜 가이드 — support.claude.com
  3. Anthropic 공식 가격 페이지 — anthropic.com/pricing
  4. IntuitionLabs Claude Max 플랜 상세 분석 (2026.02.28) — 원문 링크
  5. Reddit r/ClaudeAI — Opus 20% 한도 실사용 검증 — 원문 링크
  6. Brunch 실사용 리뷰 — Claude Opus 4.6 (2026.02) — 원문 링크

※ 본 포스팅 작성 이후 서비스 정책·UI·기능·가격이 변경될 수 있습니다. 모든 수치는 2026년 3월 15일 기준 Anthropic 공식 문서를 직접 확인하여 작성했으나, AI 서비스 특성상 업데이트로 내용이 달라질 수 있습니다. 최종 결정 전 반드시 공식 채널을 재확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기