Claude Sonnet 4.6 기준
⏰ 프로모션 종료 D-5
Claude Sonnet 4.6 프로모션,
3월 28일 전에 이렇게 씁니다
프로모션이 실제로 어떻게 작동하는가
Anthropic이 2026년 3월 13일부터 28일까지 Claude 전 요금제(Free, Pro, Max, Team)에 사용량 2배 프로모션을 적용 중입니다. Enterprise는 제외입니다. 공식 헬프센터 페이지(support.claude.com)에 직접 명시된 내용입니다.
작동 방식은 간단합니다. 평일 오전 8시~오후 2시(ET) / 오전 5시~11시(PT) / 오후 12시~오후 6시(GMT)를 “피크 시간대”로 지정하고, 이 외 시간대에는 5시간 사용량이 자동으로 두 배 적용됩니다. 별도 설정이 필요하지 않습니다.
피크 시간대에는 기존 한도 그대로입니다. 늘어난 것은 비피크 구간의 5시간 세션 한도뿐입니다. 주말은 피크 시간대 자체가 없으므로 하루 종일 2배 구간입니다.
💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다
프로모션 안내 페이지에는 “보너스 사용량”이라는 표현을 쓰는데, 기술적으로는 “비피크 시간대 요청의 사용량 소모가 절반으로 계산되는 구조”에 가깝습니다. 별도 추가 버킷이 생기는 게 아니라, 기존 버킷 소모 속도가 느려집니다.
비피크 보너스가 주간 한도에 안 잡히는 이유
대부분이 거꾸로 알고 있는 구조
Reddit의 클로드 커뮤니티(r/ClaudeAI, 구독자 64만)에서 이 부분이 가장 많이 혼동됐습니다. 핵심 FAQ를 공식 페이지에서 그대로 옮기면 이렇습니다.
“Does bonus usage count against my weekly usage limit?
No. The additional usage you get during off-peak hours doesn’t count toward any weekly usage limits on your plan.“
(출처: Claude Help Center – Claude March 2026 usage promotion, 2026.03.13)
비피크 구간에서 추가로 쓴 만큼은 주간 한도에 합산되지 않습니다. 5시간 세션 한도가 2배가 됐는데, 그 2배 부분에서 소모한 양은 주간 카운터에 반영이 안 된다는 뜻입니다.
실제 커뮤니티 논의에서 한 사용자는 이렇게 정리했습니다. “요청 한 개가 피크 시간대에는 사용량 2%를 소모한다면, 비피크 시간대엔 1%만 소모합니다. 절반 속도로 버킷이 닳는 겁니다.” 직접 확인해보면, Claude 설정 > 사용량 페이지에서 실시간으로 달라지는 소모 속도를 볼 수 있습니다.
💡 숫자를 계산해보니 Max5 플랜 기준 차이가 꽤 컸습니다
Max5 플랜 기준 1주 사용량이 약 88,000토큰 허용이라고 알려져 있습니다(출처: Milvus AI Quick Reference). 비피크 구간 추가 사용분이 주간 한도에 안 잡히면, 실제 활용 가능 토큰은 2배 이상으로 늘어나는 구조입니다.
Extended thinking, 생각보다 비쌉니다
기본 thinking budget이 무료가 아닌 이유
Claude Sonnet 4.6 extended thinking은 Claude Code에서 기본값으로 활성화돼 있습니다. 그리고 이 기본 thinking budget이 31,999 토큰입니다. 이 수치는 laozhang.ai의 Claude Code 비용 가이드(2026.03)에서 Anthropic 공식 비용 문서를 인용해 확인한 수치입니다.
문제는 thinking 토큰이 출력 토큰으로 과금된다는 점입니다. Sonnet 4.6 기준 출력 토큰은 백만 개당 15달러입니다. 요청 한 건에서 thinking 토큰이 31,999개 풀로 소모된다면, 출력 토큰 기준으로 약 0.48달러가 thinking에만 쓰이는 셈입니다.
API 사용자라면 이 비용이 직접 청구서에 찍힙니다. Pro·Max 구독자는 토큰 요금이 직접 나오지는 않지만, thinking 토큰 소모는 5시간 세션 한도와 주간 한도에 반영됩니다. 단순한 작업에서 extended thinking을 켜두면 사용량이 예상보다 빠르게 닳는 이유가 바로 여기 있습니다.
한국 시간 기준 완전 비피크 구간
한국에 사는 게 이번만큼은 유리한 이유
피크 시간대 기준이 ET 오전 8시~오후 2시인데, 이를 KST(한국 표준시)로 환산하면 오후 9시~다음날 오전 3시입니다. 즉, 한국 낮 시간대 전체가 비피크 구간입니다.
정리하면, 한국 기준 오후 9시에서 자정 사이 딱 3시간만 피크 구간입니다. 오전 9시~오후 9시, 그러니까 일반적인 업무 시간 전체가 비피크입니다. Extended thinking을 많이 써야 하는 코딩이나 분석 작업이라면, 오전에 몰아서 쓰는 게 가장 효율적입니다.
💡 주말에는 피크 자체가 없습니다. 하루 종일 2배 구간입니다.
평일 대비 주말에 extended thinking을 몰아서 쓰는 전략이 가능합니다. 특히 길고 복잡한 코드베이스 리팩토링처럼 thinking budget을 많이 소모하는 작업에서 차이가 큽니다.
Claude Code + extended thinking 조합 주의사항
기본값이 켜져 있다는 걸 모르면 한도가 빠르게 닳습니다
Claude Code에서 extended thinking은 기본값으로 켜져 있고, thinking budget은 31,999 토큰입니다. API 사용자라면 이 수치가 곧 추가 비용이고, 구독 사용자라면 세션 한도 소모 속도에 직접 영향을 줍니다.
Anthropic 공식 비용 문서에서 권장하는 방법은 작업 복잡도에 따라 thinking budget을 조정하는 것입니다. 단순 파일 검색이나 간단한 버그 수정에는 thinking이 필요하지 않습니다. /effort 명령어로 budget을 줄이거나, MAX_THINKING_TOKENS=8000 설정으로 기본값을 낮춰두면 대부분의 일반 작업에서 한도 소모 속도가 눈에 띄게 달라집니다.
반대로, 복잡한 멀티파일 리팩토링이나 아키텍처 결정처럼 깊은 추론이 필요한 작업에는 budget을 오히려 늘리는 게 맞습니다. Sonnet 4.6 기준 최대 64,000 토큰까지 설정할 수 있습니다. 이 구분 없이 기본값으로만 쓰면 불필요한 소모가 누적됩니다.
💡 Agent teams를 쓴다면 thinking 비용이 배수로 붙습니다
Claude Code agent teams는 동시에 여러 서브에이전트를 실행합니다. laozhang.ai의 비용 분석에서 agent teams는 일반 세션 대비 약 7배 토큰을 소모한다고 나옵니다. 여기에 extended thinking까지 켜져 있다면, 단일 작업 하나가 세션 한도의 상당 부분을 쓸 수 있습니다.
지금 당장 써야 하는 이유
Sonnet 4.6가 이 시점에 의미 있는 이유
Anthropic이 3월 28일 프로모션 종료 이후 이 구조가 일회성인지, 아니면 비피크 인센티브로 정착할지 공식 답변을 내놓지 않은 상황입니다. 지금까지는 2025년 연말 프로모션(Holiday 2025 Usage Promotion)에 이어 두 번째 비슷한 방식입니다. 정기화 여부는 아직 열린 문제입니다.
Claude Sonnet 4.6는 2026년 2월 17일 정식 출시됐습니다. Anthropic 공식 페이지에서 입력 토큰 백만 개당 3달러, 출력 토큰 백만 개당 15달러로 Sonnet 4.5와 동일한 가격을 유지하면서 코딩·에이전트·추론에서 성능이 높아졌습니다. Pro 플랜($20)에서 기본 모델로 쓸 수 있고, extended thinking도 지원됩니다.
1M 컨텍스트 윈도우가 2026년 3월 GA(정식 출시)로 전환되면서 API 사용자도 별도 베타 헤더 없이 쓸 수 있게 됐고, 1M 입력 초과 시 적용되던 2배 가산 요금도 사라졌습니다. 이 변화와 프로모션이 겹쳐 있는 지금 3월 말이 실질적으로 가장 많은 걸 쓸 수 있는 창입니다.
Q&A
마치며
이번 3월 프로모션은 Anthropic이 처음 시도하는 방식이 아닙니다. 2025년 연말에도 같은 구조로 운영됐고, 이번이 두 번째입니다. 비피크 시간대 수요를 끌어올려 서버 부하를 분산시키는 방식이기도 하고, 구독자 경험을 개선하는 방법이기도 합니다.
핵심 두 가지만 기억하면 됩니다. 첫째, 비피크 구간(한국 기준 오전 9시~오후 9시, 주말 하루 종일)에 쓰면 사용량이 절반 속도로 소모되고 추가 소모분은 주간 한도에 안 잡힙니다. 둘째, extended thinking 기본 budget(31,999 토큰)은 출력 토큰으로 과금되니 작업 복잡도에 맞게 조정하면 훨씬 오래 씁니다.
3월 28일까지입니다. 복잡한 코딩 작업, 긴 문서 분석, 아키텍처 결정이 밀려 있다면 지금이 가장 낮은 비용으로 가장 많이 쓸 수 있는 구간입니다.
본 포스팅 참고 자료
본 포스팅은 2026년 3월 23일 기준 / Claude Sonnet 4.6 기준으로 작성됐습니다.
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다.
최신 정보는 support.claude.com에서 직접 확인하세요.


댓글 남기기