IT/AI
Claude Code Max 5x, 써보니 이게 한도를 먹고 있었습니다
월 $100짜리 Max 5x 요금제를 써도 1~2시간 만에 5시간 한도가 바닥난다는 제보가 쏟아지고 있습니다. 원인은 단순한 ‘사용량 증가’가 아닙니다. 3월 초부터 Anthropic이 서버사이드에서 캐시 유지 시간(TTL)을 1시간에서 5분으로 조용히 바꿨고, 그 결과 동일한 작업의 토큰 비용이 최대 32배까지 불어난 게 실측 데이터로 확인됩니다.
토큰 비용 증가
캐시 TTL
초과 낭비율
콜 수
$100을 내도 1시간 만에 한도가 걸리는 진짜 이유
결론부터 말씀드리면, 지금 상황에서 Claude Code Max 5x($100/월) 한도가 기대보다 빠르게 소진되는 원인은 세 가지가 겹쳐 있습니다. 하나는 의도적인 피크타임 한도 축소, 다른 하나는 캐시 TTL 서버사이드 변경, 그리고 마지막은 --resume 플래그를 쓸 때 캐시 전체가 무효화되는 버그입니다.
이 중 가장 직접적인 영향은 캐시 TTL 변경입니다. 캐시가 살아 있을 때는 동일한 컨텍스트 재호출 비용이 신규 작성 대비 약 12.5분의 1 수준인데, TTL이 5분으로 줄어들면 5분만 쉬어도 컨텍스트 전체를 처음부터 다시 올려야 합니다. 긴 코딩 세션일수록 누적 컨텍스트가 커지기 때문에 피해가 더 큽니다. 세션 재개 직후 사용 한도 계기판이 갑자기 껑충 뛰어 있는 이유가 바로 이것입니다.
Anthropic은 이 변경에 대한 블로그 포스트도, 구독자 이메일도, 상태 페이지 업데이트도 발행하지 않았습니다. 2026년 3월 31일 The Register 보도 이후 공개 이슈 tracker에서 처음 공식 인정이 이루어졌습니다. (출처: The Register, 2026.03.31)
💡 공식 발표문에는 “피크타임 7%의 사용자에게 영향”이라고 나와 있지만, 커뮤니티 측정 결과와 실제 사용자 경험을 함께 놓고 보면 체감 피해는 그 이상입니다. 두 데이터를 교차해야 실상이 보입니다.
3월 8일 이후 실측 데이터로 확인된 TTL 변경
한 개발자가 2026년 1월 11일부터 4월 11일까지 두 대의 독립된 머신(Linux 워크스테이션 + Windows 노트북)에서 총 119,866건의 API 콜 데이터를 분석한 결과, 캐시 TTL이 서버사이드에서 변경된 정확한 시점이 특정됐습니다. (출처: GitHub anthropics/claude-code issue #46829, 2026.04.12)
| 기간 | TTL 동작 | 비용 낭비율 |
|---|---|---|
| 2026년 1월 | 5분 TTL만 존재 | 52.5% |
| 2026년 2월 | 1시간 TTL 100% | 1.1% (거의 0) |
| 2026년 3월 | 5분 TTL 93% 이상 | 25.9% |
| 2026년 4월 (1~11일) | 5분 TTL 지속 | 14.8% |
▲ 출처: GitHub anthropics/claude-code issue #46829 (2026.04.12 기준)
2월에는 비용 낭비율이 1.1%에 불과했지만, 3월 8일 이후 TTL이 5분으로 전환되면서 같은 작업에 25.9%의 추가 비용이 발생합니다. 이 낭비율은 모델(Sonnet/Opus 무관)에 관계없이 동일하게 17.1% 수준으로 나타납니다. 캐시 TTL이 원인이기 때문입니다.
5분 TTL의 실제 의미는 이렇습니다. 코딩 중 잠깐 화장실을 다녀오거나 다른 브라우저 탭을 5분 이상 보면, 돌아왔을 때 전체 컨텍스트가 처음부터 캐시 재작성 비용으로 청구됩니다. Sonnet 기준으로 5분 TTL 캐시 쓰기 비용은 읽기 비용의 12.5배입니다.
–resume 플래그가 캐시를 통째로 날리는 구조
커뮤니티 역공학으로 밝혀진 두 가지 버그
한 개발자가 228MB짜리 Claude Code 독립 바이너리를 Ghidra와 MITM 프록시, radare2로 역공학해 두 가지 독립적인 캐시 무효화 버그를 발견했습니다. Anthropic 엔지니어 Thariq Shihipar가 3월 31일 공식 X 포스트를 통해 “현재 최우선 조사 중”이라고 확인했습니다. (출처: GitHub #40524, 2026.03.31)
버그 A — 빌링 문자열 치환 오류: Anthropic의 커스텀 Bun 포크가 모든 API 요청에서 빌링 귀속 문자열을 치환하는데, 대화 기록에 빌링 관련 단어가 포함되면 치환 위치를 잘못 잡아 캐시 접두사 전체가 깨집니다. 결과적으로 캐시된 토큰이 아닌 전체 재빌드 비용(10~20배)이 청구됩니다. 회피법은 npx @anthropic-ai/claude-code로 실행하는 것입니다. Bun 포크를 거치지 않기 때문입니다.
버그 B — –resume 플래그 캐시 무효화: --resume이나 --continue 플래그를 쓰면 툴 첨부 파일이 기존 세션과 다른 위치에 삽입되어 이전 대화 전체의 캐시가 무효화됩니다. 한 세션에서 652,069개의 출력 토큰이 사용자 프롬프트 없이 생성된 케이스가 GitHub #38029에 기록돼 있습니다. 회피법은 /clear → /rename → 새 세션으로 이어가는 것입니다.
💡 공개된 버그 리포트와 공식 발표를 함께 살펴보면, v2.1.69 이상에서 캐시 회귀가 시작됐고 v2.1.34로 다운그레이드하면 증상이 개선된다는 점이 공통적으로 나타납니다. 이를 통해 회귀 범위가 상당히 좁혀진 상태입니다.
피크 타임 한도 조정, 공식 인정된 내용
2026년 3월 26일, Anthropic 엔지니어 Thariq Shihipar가 개인 X(트위터) 포스트를 통해 피크타임 한도 조정을 공식 확인했습니다. 이후 Anthropic 공식 Reddit 계정이 r/Anthropic에 “Update on Session Limits”라는 제목의 포스트를 게시했습니다. (출처: Anthropic Official Reddit, r/Anthropic, 2026.03.26)
공식 발표의 핵심 세 가지를 정리하면 이렇습니다. 첫째, 주간 총 사용량은 변경 없음. 둘째, 평일 피크타임(미국 동부 오전 8시~오후 2시, 한국시간 밤 9시~새벽 3시) 동안 5시간 세션이 더 빠르게 소진됨. 셋째, 약 7%의 Pro 구독자가 영향을 받을 것이라고 했으나 실제 커뮤니티 보고는 그 이상입니다.
PCWorld가 Anthropic에 직접 확인한 내용에 따르면, 피크타임에 세션 한도가 줄어드는 대신 “오프피크 효율 개선으로 상쇄”된다고 설명했습니다. 그러나 3월 28일 2배 오프피크 프로모션이 종료된 이후로는 이 상쇄 효과도 사라진 상태입니다. (출처: PCWorld, 2026.03.26)
💡 오프피크 2배 프로모션(3월 13~28일)이 끝난 직후 사용 경험이 급격히 나빠졌다는 보고가 집중된 이유가 여기 있습니다. 프로모션 종료 + 피크타임 축소 + 캐시 버그가 동시에 겹쳤습니다.
지금 당장 적용할 수 있는 우회법 5가지
아래는 커뮤니티 메가스레드(r/ClaudeAI, 2026.03.30)에서 실제 효과가 검증된 우회법입니다. Claude Code CLI 사용자를 기준으로 정리했습니다.
settings.json 설정으로 기본 소모량 60~80% 절감
아래 설정을 ~/.claude/settings.json에 추가하면 기본 모델을 Sonnet으로 고정하고, 숨겨진 thinking 토큰을 32K에서 10K로 제한하며, 컨텍스트를 50% 시점에서 자동 압축합니다. 서브에이전트는 Haiku로 라우팅되어 약 80% 비용 절감 효과가 있습니다.
{
"model": "sonnet",
"env": {
"MAX_THINKING_TOKENS": "10000",
"CLAUDE_AUTOCOMPACT_PCT_OVERRIDE": "50",
"CLAUDE_CODE_SUBAGENT_MODEL": "haiku"
}
}
npx 방식으로 실행 — 버그 A 직접 회피
독립 바이너리 대신 npx @anthropic-ai/claude-code로 실행하면 Bun 포크의 빌링 문자열 치환 버그를 건너뛸 수 있습니다. 이 방법으로 캐시 깨짐이 줄었다는 사례가 GitHub에 여러 건 보고됐습니다.
–resume 대신 /clear → /rename → 새 세션
--resume이나 --continue는 캐시를 통째로 재생성시킵니다. 세션을 이어가야 한다면 /rename으로 저장 후 /clear하고 새 세션에서 핵심 컨텍스트만 붙여 넣는 방식이 토큰 비용을 현저히 낮춥니다.
CLAUDE.md는 60줄 이하로, node_modules는 .claudeignore로
CLAUDE.md는 매 메시지마다 컨텍스트에 올라갑니다. 하나의 큰 파일(약 11,000 토큰) 대신 4개의 작은 파일(약 800토큰 합계)로 분리하면 세션 시작 비용을 90% 줄일 수 있습니다. .claudeignore로 node_modules/, dist/, *.lock을 제외하는 것도 필수입니다.
무거운 작업은 한국 기준 저녁 9시 이후에
Anthropic의 피크타임은 미국 동부 오전 8시~오후 2시(ET)로, 한국 기준 밤 9시~새벽 3시에 해당합니다. 즉 한국 저녁 이후나 주말에 집중적으로 쓰면 오프피크 한도를 그대로 누릴 수 있습니다.
Max 5x vs Max 20x, 지금 업그레이드가 답일까
Max 20x($200/월)로 올린다고 해도 현재 캐시 버그와 피크타임 축소 정책은 그대로 적용됩니다. Max 20x 사용자도 90분 만에 세션 한도를 소진했다는 보고가 GitHub에 여러 건 올라와 있습니다. 즉 업그레이드는 더 큰 용기를 사는 것이지, 새는 구멍을 막는 것이 아닙니다.
| 구분 | Pro ($20) | Max 5x ($100) | Max 20x ($200) |
|---|---|---|---|
| 5시간 세션 | 기본값 | Pro × 5 | Pro × 20 |
| 캐시 버그 영향 | 있음 | 있음 | 있음 |
| 피크타임 축소 | 적용 | 적용 | 적용 |
| Opus 접근 | 제한 | 가능 | 가능 |
| Sonnet 주간 한도 | 있음 | 있음 | 있음 |
매일 Claude Code로 8시간 풀타임 코딩을 하는 게 아니라면, 지금 시점에서는 Max 5x + 위의 우회법 조합이 Max 20x 업그레이드보다 합리적입니다. 반면 대규모 자동화 워크플로우를 Claude Code로 돌리는 경우라면, 고정 구독보다 API 직접 사용(토큰당 과금)이 예측 가능한 비용 구조를 만들어 줍니다. Anthropic 공식 API는 세션 윈도우 한도 없이 토큰당 가격으로 과금되기 때문입니다. (출처: Anthropic API 문서, platform.anthropic.com)
솔직히 말하면, 현재 한도 이슈는 Anthropic이 인프라를 추가 확보하는 속도에 따라 수주 내 개선될 여지가 있습니다. 2026년 3월 기준 Anthropic의 연환산 수익이 $190억에 달하고, 캐시 버그도 이미 최우선 과제로 지정됐으니까요. 다만 공식 해결 일정은 아직 공개되지 않았습니다.
Q&A
마치며
Claude Code Max 5x 한도 이슈의 핵심은 사용자의 ‘과다 사용’이 아니라, 3월 8일 전후로 서버사이드에서 캐시 TTL이 1시간에서 5분으로 조용히 바뀌었다는 점입니다. 119,866건 실측 데이터가 이를 뒷받침하고, GitHub의 공개 이슈 트래커에 Anthropic 엔지니어도 인정한 내용입니다.
당장 쓸 수 있는 가장 효과적인 대책은 세 가지입니다. settings.json으로 기본 소모량을 줄이고, –resume 대신 /clear+새 세션으로 캐시 무효화를 피하며, 무거운 작업은 한국 기준 저녁 9시 이후로 옮기는 것입니다. 이 세 가지만 적용해도 체감 사용 가능 시간이 눈에 띄게 늘어납니다.
Anthropic이 버그 수정을 완료하기 전까지, 지금 이 상태에서 최대한 버티는 방법은 결국 캐시 구조를 이해하고 행동을 바꾸는 것입니다. 불편하지만, 구조를 알고 나면 훨씬 덜 당황스럽습니다.
본 포스팅 참고 자료
- GitHub anthropics/claude-code #41930 — Widespread abnormal usage limit drain (2026.04.01)
- GitHub anthropics/claude-code #46829 — Cache TTL silently regressed from 1h to 5m (2026.04.12)
- The Register — Anthropic admits Claude Code quotas running out too fast (2026.03.31)
- Anthropic 공식 — Claude March 2026 usage promotion (2026.03.13)
- Anthropic Help Center — How Do Usage and Length Limits Work?
본 포스팅은 2026년 04월 16일 기준 공개된 정보를 바탕으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 실제 사용 환경에 따라 토큰 소모량과 한도 적용 방식이 달라질 수 있으므로 중요한 결정 전에는 Anthropic 공식 문서를 반드시 확인하시기 바랍니다.

댓글 남기기