Claude Code Max 5x, 써보니 이게 한도를 먹고 있었습니다

Published on

in

Claude Code Max 5x, 써보니 이게 한도를 먹고 있었습니다

2026.04.16 기준 / Claude Code v2.1.88 기준
IT/AI

Claude Code Max 5x, 써보니 이게 한도를 먹고 있었습니다

월 $100짜리 Max 5x 요금제를 써도 1~2시간 만에 5시간 한도가 바닥난다는 제보가 쏟아지고 있습니다. 원인은 단순한 ‘사용량 증가’가 아닙니다. 3월 초부터 Anthropic이 서버사이드에서 캐시 유지 시간(TTL)을 1시간에서 5분으로 조용히 바꿨고, 그 결과 동일한 작업의 토큰 비용이 최대 32배까지 불어난 게 실측 데이터로 확인됩니다.

32×
캐시 미스 시
토큰 비용 증가
5분
3월 이후
캐시 TTL
25.9%
3월 비용
초과 낭비율
119,866
실측 API
콜 수

$100을 내도 1시간 만에 한도가 걸리는 진짜 이유

결론부터 말씀드리면, 지금 상황에서 Claude Code Max 5x($100/월) 한도가 기대보다 빠르게 소진되는 원인은 세 가지가 겹쳐 있습니다. 하나는 의도적인 피크타임 한도 축소, 다른 하나는 캐시 TTL 서버사이드 변경, 그리고 마지막은 --resume 플래그를 쓸 때 캐시 전체가 무효화되는 버그입니다.

이 중 가장 직접적인 영향은 캐시 TTL 변경입니다. 캐시가 살아 있을 때는 동일한 컨텍스트 재호출 비용이 신규 작성 대비 약 12.5분의 1 수준인데, TTL이 5분으로 줄어들면 5분만 쉬어도 컨텍스트 전체를 처음부터 다시 올려야 합니다. 긴 코딩 세션일수록 누적 컨텍스트가 커지기 때문에 피해가 더 큽니다. 세션 재개 직후 사용 한도 계기판이 갑자기 껑충 뛰어 있는 이유가 바로 이것입니다.

Anthropic은 이 변경에 대한 블로그 포스트도, 구독자 이메일도, 상태 페이지 업데이트도 발행하지 않았습니다. 2026년 3월 31일 The Register 보도 이후 공개 이슈 tracker에서 처음 공식 인정이 이루어졌습니다. (출처: The Register, 2026.03.31)

💡 공식 발표문에는 “피크타임 7%의 사용자에게 영향”이라고 나와 있지만, 커뮤니티 측정 결과와 실제 사용자 경험을 함께 놓고 보면 체감 피해는 그 이상입니다. 두 데이터를 교차해야 실상이 보입니다.

▲ 목차로 돌아가기

3월 8일 이후 실측 데이터로 확인된 TTL 변경

한 개발자가 2026년 1월 11일부터 4월 11일까지 두 대의 독립된 머신(Linux 워크스테이션 + Windows 노트북)에서 총 119,866건의 API 콜 데이터를 분석한 결과, 캐시 TTL이 서버사이드에서 변경된 정확한 시점이 특정됐습니다. (출처: GitHub anthropics/claude-code issue #46829, 2026.04.12)

기간 TTL 동작 비용 낭비율
2026년 1월 5분 TTL만 존재 52.5%
2026년 2월 1시간 TTL 100% 1.1% (거의 0)
2026년 3월 5분 TTL 93% 이상 25.9%
2026년 4월 (1~11일) 5분 TTL 지속 14.8%

▲ 출처: GitHub anthropics/claude-code issue #46829 (2026.04.12 기준)

2월에는 비용 낭비율이 1.1%에 불과했지만, 3월 8일 이후 TTL이 5분으로 전환되면서 같은 작업에 25.9%의 추가 비용이 발생합니다. 이 낭비율은 모델(Sonnet/Opus 무관)에 관계없이 동일하게 17.1% 수준으로 나타납니다. 캐시 TTL이 원인이기 때문입니다.

5분 TTL의 실제 의미는 이렇습니다. 코딩 중 잠깐 화장실을 다녀오거나 다른 브라우저 탭을 5분 이상 보면, 돌아왔을 때 전체 컨텍스트가 처음부터 캐시 재작성 비용으로 청구됩니다. Sonnet 기준으로 5분 TTL 캐시 쓰기 비용은 읽기 비용의 12.5배입니다.

▲ 목차로 돌아가기

–resume 플래그가 캐시를 통째로 날리는 구조

커뮤니티 역공학으로 밝혀진 두 가지 버그

한 개발자가 228MB짜리 Claude Code 독립 바이너리를 Ghidra와 MITM 프록시, radare2로 역공학해 두 가지 독립적인 캐시 무효화 버그를 발견했습니다. Anthropic 엔지니어 Thariq Shihipar가 3월 31일 공식 X 포스트를 통해 “현재 최우선 조사 중”이라고 확인했습니다. (출처: GitHub #40524, 2026.03.31)

버그 A — 빌링 문자열 치환 오류: Anthropic의 커스텀 Bun 포크가 모든 API 요청에서 빌링 귀속 문자열을 치환하는데, 대화 기록에 빌링 관련 단어가 포함되면 치환 위치를 잘못 잡아 캐시 접두사 전체가 깨집니다. 결과적으로 캐시된 토큰이 아닌 전체 재빌드 비용(10~20배)이 청구됩니다. 회피법은 npx @anthropic-ai/claude-code로 실행하는 것입니다. Bun 포크를 거치지 않기 때문입니다.

버그 B — –resume 플래그 캐시 무효화: --resume이나 --continue 플래그를 쓰면 툴 첨부 파일이 기존 세션과 다른 위치에 삽입되어 이전 대화 전체의 캐시가 무효화됩니다. 한 세션에서 652,069개의 출력 토큰이 사용자 프롬프트 없이 생성된 케이스가 GitHub #38029에 기록돼 있습니다. 회피법은 /clear/rename → 새 세션으로 이어가는 것입니다.

💡 공개된 버그 리포트와 공식 발표를 함께 살펴보면, v2.1.69 이상에서 캐시 회귀가 시작됐고 v2.1.34로 다운그레이드하면 증상이 개선된다는 점이 공통적으로 나타납니다. 이를 통해 회귀 범위가 상당히 좁혀진 상태입니다.

▲ 목차로 돌아가기

피크 타임 한도 조정, 공식 인정된 내용

2026년 3월 26일, Anthropic 엔지니어 Thariq Shihipar가 개인 X(트위터) 포스트를 통해 피크타임 한도 조정을 공식 확인했습니다. 이후 Anthropic 공식 Reddit 계정이 r/Anthropic에 “Update on Session Limits”라는 제목의 포스트를 게시했습니다. (출처: Anthropic Official Reddit, r/Anthropic, 2026.03.26)

공식 발표의 핵심 세 가지를 정리하면 이렇습니다. 첫째, 주간 총 사용량은 변경 없음. 둘째, 평일 피크타임(미국 동부 오전 8시~오후 2시, 한국시간 밤 9시~새벽 3시) 동안 5시간 세션이 더 빠르게 소진됨. 셋째, 약 7%의 Pro 구독자가 영향을 받을 것이라고 했으나 실제 커뮤니티 보고는 그 이상입니다.

PCWorld가 Anthropic에 직접 확인한 내용에 따르면, 피크타임에 세션 한도가 줄어드는 대신 “오프피크 효율 개선으로 상쇄”된다고 설명했습니다. 그러나 3월 28일 2배 오프피크 프로모션이 종료된 이후로는 이 상쇄 효과도 사라진 상태입니다. (출처: PCWorld, 2026.03.26)

💡 오프피크 2배 프로모션(3월 13~28일)이 끝난 직후 사용 경험이 급격히 나빠졌다는 보고가 집중된 이유가 여기 있습니다. 프로모션 종료 + 피크타임 축소 + 캐시 버그가 동시에 겹쳤습니다.

▲ 목차로 돌아가기

지금 당장 적용할 수 있는 우회법 5가지

아래는 커뮤니티 메가스레드(r/ClaudeAI, 2026.03.30)에서 실제 효과가 검증된 우회법입니다. Claude Code CLI 사용자를 기준으로 정리했습니다.

01

settings.json 설정으로 기본 소모량 60~80% 절감

아래 설정을 ~/.claude/settings.json에 추가하면 기본 모델을 Sonnet으로 고정하고, 숨겨진 thinking 토큰을 32K에서 10K로 제한하며, 컨텍스트를 50% 시점에서 자동 압축합니다. 서브에이전트는 Haiku로 라우팅되어 약 80% 비용 절감 효과가 있습니다.

{
"model": "sonnet",
"env": {
"MAX_THINKING_TOKENS": "10000",
"CLAUDE_AUTOCOMPACT_PCT_OVERRIDE": "50",
"CLAUDE_CODE_SUBAGENT_MODEL": "haiku"
}
}

02

npx 방식으로 실행 — 버그 A 직접 회피

독립 바이너리 대신 npx @anthropic-ai/claude-code로 실행하면 Bun 포크의 빌링 문자열 치환 버그를 건너뛸 수 있습니다. 이 방법으로 캐시 깨짐이 줄었다는 사례가 GitHub에 여러 건 보고됐습니다.

03

–resume 대신 /clear → /rename → 새 세션

--resume이나 --continue는 캐시를 통째로 재생성시킵니다. 세션을 이어가야 한다면 /rename으로 저장 후 /clear하고 새 세션에서 핵심 컨텍스트만 붙여 넣는 방식이 토큰 비용을 현저히 낮춥니다.

04

CLAUDE.md는 60줄 이하로, node_modules는 .claudeignore로

CLAUDE.md는 매 메시지마다 컨텍스트에 올라갑니다. 하나의 큰 파일(약 11,000 토큰) 대신 4개의 작은 파일(약 800토큰 합계)로 분리하면 세션 시작 비용을 90% 줄일 수 있습니다. .claudeignorenode_modules/, dist/, *.lock을 제외하는 것도 필수입니다.

05

무거운 작업은 한국 기준 저녁 9시 이후에

Anthropic의 피크타임은 미국 동부 오전 8시~오후 2시(ET)로, 한국 기준 밤 9시~새벽 3시에 해당합니다. 즉 한국 저녁 이후나 주말에 집중적으로 쓰면 오프피크 한도를 그대로 누릴 수 있습니다.

▲ 목차로 돌아가기

Max 5x vs Max 20x, 지금 업그레이드가 답일까

Max 20x($200/월)로 올린다고 해도 현재 캐시 버그와 피크타임 축소 정책은 그대로 적용됩니다. Max 20x 사용자도 90분 만에 세션 한도를 소진했다는 보고가 GitHub에 여러 건 올라와 있습니다. 즉 업그레이드는 더 큰 용기를 사는 것이지, 새는 구멍을 막는 것이 아닙니다.

구분 Pro ($20) Max 5x ($100) Max 20x ($200)
5시간 세션 기본값 Pro × 5 Pro × 20
캐시 버그 영향 있음 있음 있음
피크타임 축소 적용 적용 적용
Opus 접근 제한 가능 가능
Sonnet 주간 한도 있음 있음 있음

매일 Claude Code로 8시간 풀타임 코딩을 하는 게 아니라면, 지금 시점에서는 Max 5x + 위의 우회법 조합이 Max 20x 업그레이드보다 합리적입니다. 반면 대규모 자동화 워크플로우를 Claude Code로 돌리는 경우라면, 고정 구독보다 API 직접 사용(토큰당 과금)이 예측 가능한 비용 구조를 만들어 줍니다. Anthropic 공식 API는 세션 윈도우 한도 없이 토큰당 가격으로 과금되기 때문입니다. (출처: Anthropic API 문서, platform.anthropic.com)

솔직히 말하면, 현재 한도 이슈는 Anthropic이 인프라를 추가 확보하는 속도에 따라 수주 내 개선될 여지가 있습니다. 2026년 3월 기준 Anthropic의 연환산 수익이 $190억에 달하고, 캐시 버그도 이미 최우선 과제로 지정됐으니까요. 다만 공식 해결 일정은 아직 공개되지 않았습니다.

▲ 목차로 돌아가기

Q&A

Q1. Max 5x를 쓰는데 “hello” 한 마디에 5시간 한도의 7%가 사라졌습니다. 정상인가요?

정상이 아닙니다. GitHub #38335에서 Max 20x 사용자가 단일 프롬프트에 21~100%의 한도가 소진됐다고 보고했고, Anthropic도 이를 “예상보다 훨씬 빠르게 한도가 소진되는 문제”로 공식 인정했습니다. (출처: The Register, 2026.03.31) 현재 버그 조사 중이며, v2.1.34로 다운그레이드하거나 npx 실행 방식으로 바꾸면 개선될 수 있습니다.

Q2. claude.ai 웹, Claude Desktop, Claude Code 한도가 공유되나요?

네, 공유됩니다. Anthropic 공식 헬프센터에 “claude.ai, Claude Code, Claude Desktop 모두 동일한 사용량 풀을 공유한다”고 명시돼 있습니다. (출처: Anthropic Help Center – How Do Usage and Length Limits Work?) 아침에 웹에서 많이 썼다면 오후 Claude Code 세션 한도가 그만큼 줄어들어 있습니다.

Q3. 프로모션 종료 후 Max 5x 업그레이드를 결정했는데, 지금 해야 하나요?

3월 28일 2배 오프피크 프로모션이 종료됐고, 현재 캐시 버그가 수정되지 않은 상태입니다. 지금 Max 5x로 올려도 같은 버그의 영향을 받습니다. settings.json 최적화와 우회법을 먼저 적용해 보고, Pro 한도가 그래도 자주 막힌다면 업그레이드를 검토하는 순서가 합리적입니다.

Q4. API 키로 직접 쓰면 세션 한도 제한 없이 쓸 수 있나요?

맞습니다. Anthropic API는 5시간 세션 윈도우 한도가 없고 토큰당 과금 구조입니다. 다만 API rate limit(분당 요청 수)은 별도로 존재하고, 프롬프트 캐시 버그의 영향은 API에도 적용될 수 있습니다. 자동화 워크플로우나 예측 가능한 대용량 작업에는 API가 더 적합합니다. (출처: Anthropic API 문서, platform.anthropic.com)

Q5. 이 버그가 언제 고쳐지나요?

Anthropic이 공식 일정을 공개하지 않았습니다. 엔지니어 Thariq Shihipar가 “현재 최우선 조사 중”이라고 X에서 밝혔고(2026.03.31), 커뮤니티에서는 GitHub #41930 이슈 해결 타임라인을 요청 중입니다. 임시 방편으로는 v2.1.34 다운그레이드 또는 npx 실행 방식이 가장 빠른 완화책입니다.

▲ 목차로 돌아가기

마치며

Claude Code Max 5x 한도 이슈의 핵심은 사용자의 ‘과다 사용’이 아니라, 3월 8일 전후로 서버사이드에서 캐시 TTL이 1시간에서 5분으로 조용히 바뀌었다는 점입니다. 119,866건 실측 데이터가 이를 뒷받침하고, GitHub의 공개 이슈 트래커에 Anthropic 엔지니어도 인정한 내용입니다.

당장 쓸 수 있는 가장 효과적인 대책은 세 가지입니다. settings.json으로 기본 소모량을 줄이고, –resume 대신 /clear+새 세션으로 캐시 무효화를 피하며, 무거운 작업은 한국 기준 저녁 9시 이후로 옮기는 것입니다. 이 세 가지만 적용해도 체감 사용 가능 시간이 눈에 띄게 늘어납니다.

Anthropic이 버그 수정을 완료하기 전까지, 지금 이 상태에서 최대한 버티는 방법은 결국 캐시 구조를 이해하고 행동을 바꾸는 것입니다. 불편하지만, 구조를 알고 나면 훨씬 덜 당황스럽습니다.

본 포스팅 참고 자료

  1. GitHub anthropics/claude-code #41930 — Widespread abnormal usage limit drain (2026.04.01)
  2. GitHub anthropics/claude-code #46829 — Cache TTL silently regressed from 1h to 5m (2026.04.12)
  3. The Register — Anthropic admits Claude Code quotas running out too fast (2026.03.31)
  4. Anthropic 공식 — Claude March 2026 usage promotion (2026.03.13)
  5. Anthropic Help Center — How Do Usage and Length Limits Work?

본 포스팅은 2026년 04월 16일 기준 공개된 정보를 바탕으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 실제 사용 환경에 따라 토큰 소모량과 한도 적용 방식이 달라질 수 있으므로 중요한 결정 전에는 Anthropic 공식 문서를 반드시 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기