Claude Sonnet 4.6, 싸다고 선택했다가 이게 더 납니다

Published on

in

Claude Sonnet 4.6, 싸다고 선택했다가 이게 더 납니다

📅 2026.03.25 기준 · Claude Sonnet 4.6 (2026.02.17 출시) · claude-sonnet-4-6

$3/$15
입력/출력 (백만 토큰당)
1M 토큰
컨텍스트 윈도우 (2026.03 GA)
59%
Claude Code 유저 선호도 (vs Opus 4.5)
OSWorld
Computer Use 벤치마크 역대 최고

Claude Sonnet 4.6, 뭐가 달라졌나요?

특히 Claude Code에서의 사용자 선호도 수치가 인상적입니다. Anthropic의 내부 테스트에서 사용자들은 Sonnet 4.6을 Sonnet 4.5 대비 70%의 확률로, 심지어 2025년 11월 기준 플래그십이었던 Opus 4.5 대비로도 59%의 확률로 선호했습니다. (출처: Anthropic 공식 블로그, 2026.02.17) 그러니까 Sonnet 4.6이 이전 세대 최상위 모델보다 실제 사용 만족도가 더 높다는 뜻입니다.

API 가격은 Sonnet 4.5와 동일하게 입력 토큰 1백만 개당 $3, 출력 1백만 개당 $15로 책정됐습니다. 추가로 2026년 3월 13일, 1M(100만) 토큰 컨텍스트 윈도우가 정식(GA) 출시됐는데, 이게 단순한 기능 확장이 아닌 이유는 아래에서 따로 짚겠습니다.

항목 Sonnet 4.6 Opus 4.6 Sonnet 4.5 (이전)
API 입력 가격 $3/백만 토큰 $5/백만 토큰 $3/백만 토큰
API 출력 가격 $15/백만 토큰 $25/백만 토큰 $15/백만 토큰
컨텍스트 윈도우 1M 토큰 (GA) 1M 토큰 (GA) 200K 토큰
기본 모델 (Free/Pro) ✅ 기본값 ❌ (Max/Team/Enterprise) 이전 기본값
Extended Thinking ✅ 지원 ✅ 지원 ✅ 지원

(출처: Anthropic 공식 가격 페이지 / 2026.03.25 기준)

▲ 목차로 돌아가기

가격은 5분의 1인데, 비용도 5분의 1일까요?

API 명세서상 Sonnet 4.6($3/$15)과 Opus 4.6($5/$25)의 가격 비율은 약 1.7배입니다. 그런데 “싸다”는 인식이 퍼지는 이유는 이전 세대 Opus 4.5($15/$75)와 비교하는 경우가 많기 때문입니다. 그 맥락에서 5분의 1이라는 말이 나오고 있습니다. 하지만 같은 세대 Opus 4.6과 비교하면 이야기가 좀 달라집니다.

💡 공식 발표와 실측 데이터를 같이 놓고 보니 이런 차이가 보였습니다

실제 코딩 작업(Python 에이전트 프로젝트 전체 빌드)을 Claude Code로 동일하게 돌린 실측 결과를 보면 이렇습니다. (출처: Tensorlake 개발팀 실측 테스트, dev.to, 2026.03.05)

항목 Sonnet 4.6 Opus 4.6
출력 토큰 사용량 52.9K + 5K (수정 실패) 33.2K + 4K (수정 성공)
작업 소요 시간 33분 48초 + 3분 18초 20분 6초 + 1분 40초
약 API 환산 비용 ~$0.87 ~$1.00
최종 완성도 CLI 작동, Tensorlake 통합 실패 전체 기능 정상 완성

출력 토큰 기준으로 Sonnet 4.6이 Opus 4.6보다 약 59% 더 많이 소비했습니다. 단가는 낮지만 소비량이 많아 최종 비용 차이가 거의 사라집니다. 그리고 작업이 완성되지 않았으니, 사람이 추가로 개입해야 합니다. 그 시간도 비용입니다.

이 현상이 생기는 이유가 있습니다. Sonnet 4.6은 복잡한 문제에 부딪혔을 때 더 많은 컨텍스트를 소비하며 디버깅을 시도합니다. Opus 4.6은 같은 에러를 더 빠르게 해결하고 토큰도 덜 씁니다. 그러니까 단순 반복 작업이나 짧은 쿼리에서는 Sonnet 4.6이 확실히 유리하지만, 복잡한 에이전트 작업일수록 비용 격차가 줄어들거나 역전될 수 있습니다. 어떤 작업에 쓰느냐가 핵심입니다.

그래도 Sonnet 4.6이 압도적으로 유리한 시나리오

반복적인 문서 처리, 짧은 코드 스니펫 생성, 데이터 정제처럼 작업당 토큰 소비가 일정하고 적은 경우라면 Sonnet 4.6의 단가 이점이 그대로 살아납니다. API로 대량 호출을 빌드하는 개발자라면 Sonnet 4.6을 기본으로 두고 특정 복잡한 단계에서만 Opus 4.6을 라우팅하는 하이브리드 전략이 비용 효율이 가장 높습니다. Anthropic 공식 문서에서도 이 접근법을 권장하고 있습니다. (출처: Anthropic Claude API Docs, 2026.03 기준)

▲ 목차로 돌아가기

1M 토큰 컨텍스트, 있다고 다 쓸 수 있는 건 아닙니다

2026년 3월 13일, Anthropic은 Opus 4.6과 Sonnet 4.6의 1M 토큰 컨텍스트 윈도우를 정식 출시(GA)했습니다. 가격은 기존과 동일하게 유지됩니다. 기존에는 200K를 초과할 경우 별도 베타 헤더가 필요했고 추가 과금이 붙었지만, 이제 그런 구분이 사라졌습니다. (출처: Anthropic 공식 발표, 2026.03.13)

근데 이게 “소설 열 권 분량을 한 번에 분석할 수 있다”는 의미로만 받아들이면 나중에 실망하게 됩니다. 컨텍스트 윈도우가 크다는 것과 그 공간을 충분히 활용할 수 있다는 건 다른 문제입니다.

💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다

여러 모델에서 롱 컨텍스트를 테스트한 개발자들의 보고에 따르면, 600K~700K 토큰 구간에서 일종의 성능 절벽이 나타납니다. 모델이 지시를 따르는 능력이 불안정해지고, 앞쪽에서 분명히 입력된 정보를 무시하기 시작하는 현상입니다. 이건 검색(retrieval) 실패가 아니라, 먼 거리의 컨텍스트에 적절한 가중치를 부여하지 못하는 문제입니다. Anthropic이 이 부분에 대한 상세 데이터를 아직 공개하지 않았습니다. (출처: Anthropic 1M Context GA 발표 커뮤니티 반응, 2026.03.13)

반면 Opus 4.6의 MRCR v2(Multi-document Reading Comprehension and Reasoning) 벤치마크 점수는 78.3%로 프론티어 모델 중 최고 수준입니다. (출처: Medium, 2026.02.08) 이건 긴 컨텍스트 내 정보 탐색 정확도가 이전 세대에 비해 실질적으로 개선됐다는 의미입니다. 다만 Sonnet 4.6 기준의 동일 수치는 공식 자료에서 별도로 공개되지 않았습니다.

1M이 실질적으로 차이를 만드는 영역

Claude Code 사용자 입장에서는 체감이 분명합니다. 기존 200K 한계에서는 대규모 코드베이스를 탐색하다 보면 compaction(이전 대화 요약·압축)이 자주 발동했고, 그때마다 디버깅 맥락이 사라지는 문제가 있었습니다. Claude Code 2.1.75부터는 1M이 기본 적용되면서 compaction 빈도가 약 15% 감소했다는 보고가 나오고 있습니다. 법률 문서 400페이지 교차 분석, 수백 편 논문 종합, 프로덕션 인시던트 전 과정 추적 같은 작업에서는 단순한 편의 수준을 넘어 결과 품질 자체가 달라집니다.

반면 코딩 작업의 80% 이상을 AI로 처리하는 개발자들 중 상당수는 실제 작업 시 컨텍스트를 30K~80K 수준에서 정밀하게 선별하는 방식이 1M을 통째로 쏟아붓는 것보다 결과가 낫다고 보고합니다. 100만 토큰을 한꺼번에 넣는 것보다, 필요한 30K 토큰을 정확히 골라 넣는 게 더 나은 출력을 줄 수 있습니다. 1M은 “최대 확장”이지, 기본 전략이 아닙니다.

▲ 목차로 돌아가기

Computer Use, 이번엔 실제로 써봤습니다

Sonnet 4.6이 이전 모델들과 가장 뚜렷하게 차별화되는 부분이 Computer Use입니다. Anthropic은 2024년 10월 처음 이 기능을 선보이면서 “아직 실험적”이라고 명시했는데, Sonnet 4.6에서는 OSWorld(Ordered Software World) 벤치마크 점수가 역대 Sonnet 모델 중 최고를 기록했습니다. (출처: Anthropic 공식 블로그, 2026.02.17)

OSWorld는 Chrome, LibreOffice, VS Code 등 실제 소프트웨어가 돌아가는 시뮬레이션 환경에서 수백 개의 작업을 평가합니다. 특별한 API나 커넥터 없이 모델이 마우스 클릭과 키보드 타이핑으로만 작동합니다. 보험사 Pace의 실제 테스트에서 Sonnet 4.6은 보험 관련 Computer Use 벤치마크에서 94%를 기록했습니다. 이건 이전에 테스트한 모델 중 가장 높은 점수라고 Pace 측이 밝혔습니다. (출처: Anthropic 공식 블로그, 2026.02.17)

아직 조심해야 할 한 가지

Computer Use에서 Sonnet 4.6이 실질적으로 개선한 부분이 있는데, 바로 프롬프트 인젝션 방어력입니다. 악의적인 내용이 웹사이트에 숨겨져 있을 때 모델이 그 지시를 따르는 ‘하이재킹’ 문제를 Sonnet 4.5보다 크게 줄였고, Opus 4.6과 유사한 수준으로 올라왔다고 Anthropic의 안전 평가에서 밝히고 있습니다. (출처: Anthropic System Card, 2026.02.17) 그럼에도 완전히 해소된 건 아닙니다. 민감한 기업 환경에서 Computer Use를 자동화로 연결할 때는 여전히 별도의 검증 레이어가 필요합니다.

▲ 목차로 돌아가기

구독 vs API — 같은 모델인데 경험이 다른 이유

API 가격과 구독 경험은 완전히 별개입니다. API로 Sonnet 4.6을 쓰면 토큰당 과금이지만, claude.ai에서 Pro 플랜($20/월 또는 연간 구독 시 $17/월)으로 쓰면 사용량 제한이 따로 붙습니다. 그런데 이 사용량 제한의 구체적인 숫자는 Anthropic이 공개적으로 명시하지 않습니다.

💡 요금제 구조를 같이 놓고 보니 이 부분이 눈에 걸렸습니다

Max 플랜($100/월~)은 Pro 대비 5배 또는 20배 사용량을 제공한다고 명시돼 있습니다. 그런데 이 ‘5배’는 볼륨 할인 없이 단순히 사용량만 늘어나는 구조입니다. Pro $20짜리를 5개 쓰는 게 Max $100 1개와 같다는 뜻입니다. 실제로 팀이나 API 대량 사용자 입장에서는 API 직접 접속이 구독 대비 단가가 훨씬 낮아질 수 있는 구조입니다. (출처: Anthropic 공식 가격 페이지, 2026.03.25 기준)

또한 2026년 3월, Anthropic은 한시적으로 오프피크 시간대(한국 시간 기준 밤 10시~새벽 4시 제외) 사용량을 2배로 제공하는 프로모션을 3월 28일까지 운영했습니다. 보너스 사용량은 주간 한도에서 차감되지 않습니다. 평소 사용량 제한이 아쉬웠다면 이런 이벤트를 활용하는 게 실질적입니다. (출처: Anthropic 지원 센터, 2026.03.13)

현재 클로드 구독 플랜을 요약하면 이렇습니다. Free는 기본 기능 + 제한된 사용량, Pro는 Claude Code·Research·무제한 프로젝트 포함($20/월 또는 $17/월 연간), Max는 5배·20배 추가 사용량 선택($100~), Team은 5명 이상 팀 협업 및 SSO 포함($20/seat 연간), Enterprise는 HIPAA·감사 로그·도메인 캡처 포함(API 요율 적용)입니다. Free 플랜도 이번 업데이트로 파일 생성·커넥터·Skills·Context Compaction이 포함됐습니다. (출처: Anthropic 공식 가격 페이지, 2026.03.25 기준)

▲ 목차로 돌아가기

Sonnet 4.6을 선택해야 하는 경우, 피해야 하는 경우

써보니까 Sonnet 4.6은 확실히 잘 만든 모델입니다. 문서 이해, 코드 스니펫, 시각적 결과물 퀄리티에서는 실제로 이전 세대 Opus급이 맞습니다. Databricks는 OfficeQA 평가에서 Sonnet 4.6이 Opus 4.6과 동등한 점수를 기록했다고 밝혔습니다. (출처: Anthropic 공식 블로그, 2026.02.17) 그 말인즉, 기업 문서 분석에선 굳이 Opus에 돈을 더 쓸 이유가 없다는 뜻입니다.

이 경우엔 Sonnet 4.6

반복적인 문서 처리·요약, 프론트엔드 코드 생성, 데이터 리포트 시각화, 중간 복잡도 이하의 에이전트 작업, 그리고 API 대량 호출 서비스 빌드에는 Sonnet 4.6이 비용과 성능 모두에서 합리적입니다. Free·Pro 플랜 구독자라면 이미 기본 모델이 Sonnet 4.6이니 별도 설정 없이 그대로 쓰면 됩니다.

이 경우엔 Opus 4.6을 고려해야 합니다

대규모 코드베이스 전체 리팩토링, 다중 에이전트 워크플로우 조율, 긴 세션에서 처음부터 끝까지 맥락을 유지해야 하는 복잡한 작업에는 Opus 4.6이 현실적으로 더 낫습니다. 토큰 단가는 더 비싸지만, 앞서 본 것처럼 작업 효율성과 완성도를 고려하면 총 비용이 역전될 수 있습니다. Max·Team·Enterprise 사용자라면 Opus 4.6이 기본 제공되니, 적극적으로 활용하는 게 맞습니다.

💡 실제 사용 흐름을 보면 선택 기준이 모델 성능이 아닌 작업 구조로 바뀝니다

가장 실용적인 접근은 작업을 분리하는 겁니다. 계획 수립·판단 단계는 Opus 4.6, 반복 실행·문서 처리 단계는 Sonnet 4.6으로 라우팅하면 비용과 품질을 동시에 잡을 수 있습니다. 이전에는 이 방식이 별도 코드를 짜야 하는 번거로움이 있었지만, Sonnet 4.6의 에이전트 플래닝 능력이 올라오면서 이 구분선이 흐려지고 있습니다. Windsurf 팀은 “처음으로 Sonnet이 Opus 사용자에게도 실질적인 대안이 됐다”고 표현했습니다. (출처: Anthropic 공식 블로그, 2026.02.17)

▲ 목차로 돌아가기

Q&A


claude-sonnet-4-6을 사용합니다. Anthropic Claude API 공식 문서(platform.claude.com/docs/en/about-claude/models/overview)에서 확인할 수 있습니다. (2026.03.25 기준)
Free 플랜에서도 Claude Sonnet 4.6을 쓸 수 있나요?

네, Sonnet 4.6은 현재 Free 플랜의 기본 모델입니다. 파일 생성, 커넥터, Skills, Context Compaction도 Free에 포함됐습니다. 단 사용량 제한은 Pro 대비 더 타이트하게 적용됩니다. (출처: Anthropic 공식 가격 페이지, 2026.03.25 기준)
1M 토큰 컨텍스트 윈도우 사용에 추가 비용이 드나요?

2026년 3월 13일 정식 출시 이후, 200K를 넘어도 동일 단가가 적용됩니다. Sonnet 4.6 기준 입력 $3/백만 토큰, 출력 $15/백만 토큰입니다. 기존에 있던 베타 헤더나 추가 과금 구조가 사라졌습니다. (출처: Anthropic 공식 발표, 2026.03.13)
Sonnet 4.6과 Opus 4.6 중 코딩 작업엔 어떤 게 나은가요?

단순·반복 코딩이나 중간 복잡도 이하라면 Sonnet 4.6이 비용 효율 면에서 낫습니다. 반면 복잡한 에이전트 빌드, 대규모 코드베이스 리팩토링, 에러 수정 자력 완성이 중요한 작업에선 Opus 4.6이 토큰 효율과 완성도 모두 높습니다. 실측 테스트에서 Opus 4.6은 약 21분 46초에 완성했고, Sonnet 4.6은 37분에 미완성이었습니다. (출처: dev.to Tensorlake 실측, 2026.03.05)

API에서는 thinking 파라미터를 설정하면 되고, claude.ai에서는 설정 메뉴에서 Extended Thinking을 켤 수 있습니다. Sonnet 4.6은 Adaptive Thinking과 Extended Thinking 모두 지원합니다. 자세한 내용은 platform.claude.com/docs/en/build-with-claude/adaptive-thinking에서 확인할 수 있습니다. (2026.03.25 기준)

▲ 목차로 돌아가기

마치며

다만 “저렴하다”는 말을 곧이곧대로 믿으면 곤란한 순간이 옵니다. 복잡한 작업일수록 토큰 소비가 늘어서 비용 격차가 줄어들고, 1M 컨텍스트 윈도우도 600K 이상 구간에서는 성능이 불안정해질 수 있습니다. 어떤 작업에 쓰느냐에 따라 모델 선택이 달라져야 한다는 게 솔직한 결론입니다.

개인적으로는 일상적인 작업과 API 프로토타이핑엔 Sonnet 4.6, 오래 걸리고 복잡한 프로젝트엔 Opus 4.6으로 나눠 쓰는 게 현실적으로 가장 낫다고 봅니다. 그리고 가격 구조가 빠르게 바뀌고 있으니, 분기마다 한 번씩 Anthropic 공식 가격 페이지를 확인하는 게 손해를 줄이는 가장 간단한 방법입니다.

📎 본 포스팅 참고 자료

  1. Anthropic 공식 블로그 — Introducing Claude Sonnet 4.6 (anthropic.com/news/claude-sonnet-4-6)
  2. Anthropic 공식 가격 페이지 (claude.com/pricing)
  3. Anthropic 지원 센터 — Claude March 2026 Usage Promotion (support.claude.com)
  4. Tensorlake 개발팀 실측 테스트 — Claude Opus 4.6 vs Sonnet 4.6 Coding Comparison (dev.to/tensorlake)
  5. Wikidocs — Claude 1M 컨텍스트 윈도우 정식 출시 분석 (wikidocs.net)

⚠️ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 가격·한도·플랜 구성은 Anthropic 공식 사이트에서 최신 내용을 반드시 확인하세요. 본 포스팅의 수치는 공식 발표 자료 및 제3자 실측 테스트를 기반으로 하며, 개별 사용 환경에 따라 결과가 다를 수 있습니다. (2026.03.25 기준 작성)

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기