Claude Sonnet 4.6 / 2026.02.17 출시
1M Context GA: 2026.03.13
Claude Sonnet 4.6, Opus보다 낫다는 수치가 나왔습니다
Anthropic이 2026년 2월 17일 공개한 Claude Sonnet 4.6은 단순한 업그레이드가 아닙니다. 공식 발표에 따르면 Claude Code 사용자의 59%가 같은 회사의 최상위 모델인 Opus 4.5보다 Sonnet 4.6을 선호했습니다. 그리고 3월 13일, 1M 토큰 컨텍스트 창에 추가 요금이 붙지 않는다는 결정이 내려졌습니다. 두 수치 모두 기존 블로그가 잘 다루지 않는 내용입니다. 공식 문서와 실사용 데이터를 교차해 정리했습니다.
Sonnet이 Opus를 이긴 수치, 어떻게 나온 건가요?
결론부터 말씀드리면, Anthropic이 공식 발표문에서 직접 공개한 수치입니다. Claude Code 내부 테스트에서 사용자들이 Sonnet 4.6과 Opus 4.5를 블라인드로 비교했을 때, 59%가 Sonnet 4.6을 선호했습니다. (출처: Anthropic 공식 블로그, 2026.02.17) 이 숫자가 의미하는 건 단순한 성능 우위가 아닙니다. Opus 대비 5분의 1 수준의 비용으로 더 많은 사람이 더 좋은 경험을 하고 있다는 뜻입니다.
같은 테스트에서 Sonnet 4.5 대비 선호율도 70%로 나왔습니다. 사용자들이 꼽은 이유는 크게 세 가지였습니다. 코드 수정 전에 컨텍스트를 더 꼼꼼히 읽는다, 공통 로직을 중복으로 만들지 않고 통합한다, 그리고 멀티스텝 작업에서 지시를 일관되게 따른다는 점이었습니다.
기존 블로그 대부분은 “Sonnet은 중간 모델”이라는 프레임을 그대로 씁니다. 그런데 Anthropic 공식 발표에서 Opus 4.5 대비 선호율이 공개된 것은 이번이 처음입니다. 비용이 5배 저렴하면서도 실사용 선호도가 높다는 건, 적어도 코딩·에이전트 워크플로에서는 “Opus가 기본, Sonnet은 절충”이라는 공식이 더 이상 유효하지 않다는 신호입니다.
가격은 그대로인데 왜 성능이 올랐을까요?
Sonnet 4.6의 API 가격은 Sonnet 4.5와 동일하게 입력 $3, 출력 $15 (100만 토큰 기준)입니다. (출처: Anthropic 공식 API 문서, platform.claude.com/docs/en/about-claude/pricing) 가격이 오르지 않았는데 성능이 올랐다는 건, 토큰당 효율이 높아졌다는 의미입니다.
Anthropic이 공개한 벤치마크 결과를 보면 컴퓨터 사용(Computer Use) 부문이 특히 눈에 띕니다. Pace Insurance의 자체 벤치마크에서 Sonnet 4.6이 컴퓨터 사용 정확도 94%를 기록하며 “지금까지 테스트한 모델 중 가장 높은 성능”이라는 평가를 받았습니다. (출처: Anthropic 공식 파트너 인용, 2026.02.17) Box는 Sonnet 4.5 대비 복잡한 추론 Q&A에서 15 퍼센트포인트 개선을 확인했다고 밝혔습니다.
| 모델 | 입력 (100만 토큰) | 출력 (100만 토큰) | Sonnet 4.6 대비 |
|---|---|---|---|
| Claude Sonnet 4.6 | $3.00 | $15.00 | 기준 |
| Claude Opus 4.6 | $5.00 | $25.00 | 약 1.7배~ |
| Claude Opus 4.5 | $5.00 | $25.00 | 약 1.7배~ |
| Claude Opus 4.1 | $15.00 | $75.00 | 약 5배 |
출처: Anthropic API 공식 요금 문서 — platform.claude.com/docs/en/about-claude/pricing (2026.03.18 확인)
Opus 4.1과 비교하면 Sonnet 4.6이 5배 저렴합니다. 고정비가 큰 API 기반 서비스라면, 같은 예산에서 5배 더 많은 요청을 처리할 수 있다는 의미입니다.
1M 컨텍스트, 추가 요금이 없다는 게 사실인가요?
맞습니다. 그리고 이게 생각보다 큰 변화입니다. 2026년 3월 13일, Anthropic은 Opus 4.6과 Sonnet 4.6에 대해 1M 토큰 컨텍스트 창을 표준 요금 그대로 일반 제공(GA)한다고 발표했습니다. (출처: claude.com/blog/1m-context-ga, 2026.03.13) 이전에는 대용량 컨텍스트에 프리미엄 요금이 붙는 구조였는데, 그게 사라진 겁니다.
공식 발표 원문을 직접 확인하면 이렇게 나와 있습니다. “No multiplier: a 900K-token request is billed at the same per-token rate as a 9K one.” (출처: claude.com/blog/1m-context-ga) 90만 토큰짜리 요청이나 9,000토큰짜리 요청이나 토큰당 단가가 똑같다는 뜻입니다. 이전까지는 긴 컨텍스트를 쓰면 단가가 올라가는 구조였습니다.
예시로 계산해 보겠습니다. 코드베이스 분석 작업에서 입력 50만 토큰을 쓴다고 하면:
- 기존 구조 (프리미엄 적용 시 약 2배 가정): 50만 × $6/100만 = 약 $3.00
- 현재 구조 (표준 요금 $3/100만): 50만 × $3/100만 = $1.50
긴 컨텍스트를 자주 쓰는 에이전트 워크플로라면, 이 차이가 월 단위로 쌓이면 상당한 비용 절감이 됩니다. ※ 기존 프리미엄 배율은 서비스에 따라 달랐으므로 위 계산은 추정 수치입니다.
미디어 제한도 달라졌습니다. 요청당 이미지나 PDF 페이지를 기존 100개에서 600개까지 첨부할 수 있게 됐습니다. 대용량 문서 분석이나 다중 이미지 처리 워크플로에서는 즉각적인 차이가 납니다.
1M 토큰을 다 채우면 오히려 문제가 생깁니다
여기서부터는 기존 블로그에서 잘 다루지 않는 이야기입니다. 1M 컨텍스트 창이 열렸다고 해서 무조건 다 채워 쓰면 된다고 생각하면, 실사용에서 막힙니다.
Reddit의 r/ClaudeAI 스레드(2026.03.13 기준 1,855 추천)에서 커뮤니티 합의로 정리된 내용을 보면, 추론 중심 작업에서는 250k~500k 토큰 구간부터 품질 저하가 감지된다고 합니다. 단순 문서 검색(Needle in a Haystack 스타일) 작업은 1M까지 버티는 경우도 있지만, 코드 수정이나 멀티스텝 계획처럼 추론이 개입될수록 컨텍스트가 길어질수록 모델이 오래된 지시를 상대적으로 덜 중요하게 처리하는 경향이 생깁니다.
- 코딩·에이전트 작업은 300k~400k에서 수동 compact 또는 새 세션 시작 권장 (커뮤니티 공통 의견)
- 1M 컨텍스트는 “한 번에 다 넣고 끝내는 도구”가 아니라 “중단 없이 조금 더 길게 작업할 수 있는 여유 공간”으로 이해하는 게 맞습니다
- 컨텍스트가 늘어날수록 매 턴마다 전송되는 토큰 수도 늘어나므로, 요금이 누적되는 속도도 빨라집니다
- Claude Code에서
CLAUDE_AUTOCOMPACT_PCT_OVERRIDE환경변수로 자동 compact 임계값 조정 가능
한 엔지니어링팀(Medium 기고, 2026.03.15)은 Opus 컨텍스트를 200k에서 500k로 올렸더니 오히려 전체 토큰 사용량이 줄었다고 보고했습니다. 이유는 컨텍스트가 넉넉해지면서 불필요한 요약 작업이 줄었기 때문입니다. 다만 이건 특정 워크플로에 국한된 결과이므로, 모든 케이스에 적용되는 일반 법칙은 아닙니다. 확인 필요.
Opus 4.6은 그럼 언제 써야 하나요?
Sonnet 4.6이 여러 지표에서 앞서고 있지만, Opus 4.6이 명확하게 우위인 영역이 있습니다. Anthropic 공식 발표 원문에서 직접 확인한 내용입니다. “We find that Opus 4.6 remains the strongest option for tasks that demand the deepest reasoning, such as codebase refactoring, coordinating multiple agents in a workflow, and problems where getting it just right is paramount.” (출처: Anthropic 공식 블로그, 2026.02.17)
코드베이스 전체 리팩터링, 여러 에이전트를 동시에 조율해야 하는 워크플로, 한 번에 정확하게 맞춰야 하는 작업에서는 Opus가 더 적합하다는 뜻입니다. MRCR v2 벤치마크(긴 컨텍스트에서 다중 문서 추론 정확도)에서도 Opus 4.6이 78.3%로 프론티어 모델 중 최상위입니다. (출처: claude.com/blog/1m-context-ga, 2026.03.13) 이 수치가 의미하는 건, 수백 페이지 계약서나 대규모 코드베이스를 한 세션에 올려두고 교차 분석할 때 Opus가 더 안정적이라는 겁니다.
- 일반 코딩, 버그 수정, 코드 리뷰
- 프론트엔드 UI 생성
- 문서 분석, 이메일 작성
- API 기반 대규모 호출 (비용 최적화)
- Free/Pro 플랜 기본 사용
- 코드베이스 전체 리팩터링
- 다중 에이전트 조율 워크플로
- 대규모 계약서·법률 문서 교차 분석
- 한 번에 정확해야 하는 작업
- MRCR v2 기준 장문 추론 작업
Claude Code 구독자라면 이 부분이 직접 달라집니다
무료·Pro 플랜 사용자는 Claude Sonnet 4.6이 이미 기본 모델로 적용되어 있습니다. claude.ai와 Claude Cowork 모두 마찬가지입니다. 추가 설정 없이 자동 적용됩니다. 그리고 무료 플랜도 이번 업데이트로 파일 생성, 커넥터, 스킬, 컴팩션 기능이 포함됐습니다. (출처: Anthropic 공식 블로그, 2026.02.17)
Max, Team, Enterprise 플랜에서는 Claude Code의 Opus 4.6 세션이 1M 컨텍스트를 자동으로 사용합니다. 이전에는 1M 컨텍스트에 추가 사용량이 소진됐는데, 이제는 기본 포함입니다. 단, 컨텍스트가 길어지면 세션당 소비하는 토큰 쿼터도 늘어나므로, 5x Max 플랜이라면 세션 횟수가 줄어들 수 있습니다. 이 부분은 체감 차이가 날 수 있으니 직접 확인이 필요합니다.
Claude Code에서 컨텍스트 자동 compact 임계값을 조정하고 싶다면 ~/.claude/settings.json에 "CLAUDE_AUTOCOMPACT_PCT_OVERRIDE": "40" 형태로 설정하면 됩니다. 수치는 컨텍스트 창 대비 퍼센트입니다. 커뮤니티에서 40% 전후를 권장하고 있습니다.
Pro, Max, Team, Enterprise 플랜이라면 Claude in Excel 추가 기능에서 MCP 커넥터를 쓸 수 있게 됐습니다. S&P Global, PitchBook, Moody’s, FactSet 같은 외부 데이터 소스를 스프레드시트 안에서 직접 연결할 수 있는 구조입니다. 이미 claude.ai에서 MCP 커넥터를 설정해 뒀다면 Excel에서 별도 설정 없이 바로 연동됩니다. (출처: Anthropic 공식 블로그, 2026.02.17)
Q&A — 자주 묻는 것들
마치며
솔직히 말하면, Claude Sonnet 4.6 이전까지는 “중간 모델은 중간 성능”이라는 게 AI 모델 시장에서 통하는 공식이었습니다. 그런데 이번에 Anthropic이 직접 공개한 수치는 그 전제를 흔들고 있습니다. Opus 4.5 대비 실사용 선호율 59%, 그리고 1M 컨텍스트 추가 요금 철폐라는 두 가지 변화가 거의 동시에 나온 겁니다.
막상 써보면 1M 컨텍스트가 만능이 아니라는 것도 알 수 있습니다. 250k를 넘으면 추론 품질이 떨어지기 시작하고, 컨텍스트가 클수록 토큰 소진 속도도 빨라집니다. 이 부분이 좀 아쉬웠습니다. 수치 자체보다 실제로 얼마나 쓸 수 있는지가 더 중요한데, 그 한계가 공식 발표에는 잘 드러나지 않거든요.
이게 핵심입니다. 일반 코딩·분석·에이전트 작업에서는 Sonnet 4.6이 충분히 올라왔고, Opus의 역할은 깊은 추론이 필요한 복잡한 작업으로 좁아졌습니다. 구독비를 높이지 않아도 더 좋은 기본 모델을 쓸 수 있게 됐다는 게, 이번 업데이트에서 가장 실질적인 변화라고 생각합니다.
본 포스팅 참고 자료
- Anthropic 공식 블로그 — Introducing Claude Sonnet 4.6 (2026.02.17) anthropic.com/news/claude-sonnet-4-6
- Anthropic 공식 블로그 — 1M Context GA 발표 (2026.03.13) claude.com/blog/1m-context-ga
- Anthropic API 공식 요금 문서 (2026.03.18 확인) platform.claude.com/docs/en/about-claude/pricing
- Reddit r/ClaudeAI — 1M 컨텍스트 실사용 스레드 (2026.03.13, 추천 1,855) reddit.com/r/ClaudeAI
본 포스팅은 2026년 3월 18일 기준으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능·요금이 변경될 수 있습니다. 최신 정보는 Anthropic 공식 문서를 직접 확인하시기 바랍니다.


댓글 남기기