Gemini CLI v0.35.0 기준
Gemini CLI 무료 한도, 3월 25일부터 달라진 3가지
결론부터 말씀드리면, 3월 25일 이후 무료 사용자는 Gemini Pro 모델을 쓸 수 없습니다. Flash 모델만 남았습니다. 그런데 더 심각한 건 따로 있습니다. 유료 구독자조차 같은 429 오류를 맞고 있다는 거죠.
3월 25일에 정확히 무슨 일이 있었나요
Google은 2026년 3월 18일, GitHub 공식 토론(google-gemini/gemini-cli discussions #22970)을 통해 정책 변경을 예고했습니다. 명목은 “서비스 남용 방지 및 트래픽 우선순위 적용”이었습니다. 실시행일은 3월 25일.
공지에 딱 이렇게 나와 있습니다.
“Starting March 25, 2026, Gemini Pro models will only be accessible via paid subscriptions. Free tier users will be limited to Gemini Flash models.”
(출처: Google Gemini CLI 공식 GitHub 토론 #22970, 2026.03.18)
한 줄 요약 — 무료 사용자는 3월 25일부터 Pro 모델 접근이 완전히 차단됩니다. Flash 모델만 남습니다.
“무료 1000회”는 이제 다른 얘기입니다
공식 문서에 아직 1000이라고 써있는 이유
Gemini Code Assist 공식 쿼터 문서(developers.google.com/gemini-code-assist/resources/quotas)에는 무료 사용자 일일 최대 요청 수가 1,000회라고 지금도 적혀 있습니다. (출처: Google Gemini Code Assist 공식 쿼터 문서, 2026.03.31 기준)
💡 공식 문서의 숫자와 실제 사용 경험을 같이 놓고 보면 이런 차이가 보였습니다.
1,000이라는 숫자는 Flash와 Pro를 합산한 전체 요청 횟수입니다. 3월 25일 이후 무료 사용자는 Pro 모델에 0회 접근 가능하니, 사실상 Flash 전용 1,000회로 바뀐 겁니다. 게다가 GitHub 커뮤니티에서는 “요즘 실제로는 150~250회 수준으로 줄었다”는 보고가 여럿 올라오고 있고, Google 측은 아직 README를 갱신하지 않은 상태입니다.
요금제별 실제 제공 한도 비교표
| 구분 | 일일 요청 한도 | Pro 모델 접근 | 3월 25일 이후 변화 |
|---|---|---|---|
| 무료 | 약 1,000회 (Flash만) | ❌ 차단 | Pro 모델 완전 차단 |
| Google AI Pro | 1,500회 | ✅ 가능 | 우선순위 상향 |
| Google AI Ultra | 2,000회 | ✅ 가능 | 최우선순위 |
| 개인 API 키 | 별도 쿼터 적용 | ✅ 가능 | 정책 영향 없음 |
(출처: Google Gemini Code Assist 공식 쿼터 문서, 2026.03.31 기준 / 무료 Flash 실제 한도는 커뮤니티 보고 기준 추정)
이 표가 중요한 이유는 하나입니다. Pro 구독 없이 Gemini CLI를 코딩 도구로 진지하게 쓰는 건 이제 현실적으로 어렵습니다.
유료 구독자가 무료 사용자와 같은 오류를 보는 이유
3월 25일 이후 Pro 구독자 실제 경험
솔직히 말하면, 이 부분이 가장 황당한 대목입니다. Google AI Pro를 매달 내고 있는 구독자들이 3월 25일 이후 동일한 429 Too Many Requests 오류를 연속으로 받기 시작했습니다.
HuggingFace 개발자 포럼에 올라온 사례를 보면(2026.03.26 보고 기준), Pro 구독자가 OAuth로 인증한 상태에서 3월 24일까지는 정상이었는데 25일부터 모든 요청이 429 오류로 튕겼다고 합니다. 오류 메시지는 “No capacity available for model gemini-2.5-pro on the server”였습니다.
💡 공식 쿼터 문서와 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다.
정책 변경 이후 무료 사용자가 전부 Flash 모델로 밀려났는데, Flash 트래픽이 한꺼번에 몰리면서 429 오류가 폭증했습니다. 로드 밸런싱 문제가 Flash 큐에 쏠렸고, 이것이 유료 구독자 세션에도 영향을 준 구조입니다. Google은 3주 이상 이 이슈를 방치 중입니다.
모델 자동 다운그레이드 문제
더 조심해야 할 게 있습니다. Pro 모델이 한도에 걸리면 CLI가 알림 없이 Flash로 자동 전환됩니다. 개발자가 Pro로 작업하고 있다고 생각했는데 실제로는 Flash 결과물이 쌓이는 상황이 생깁니다. GitHub Issue #1847에서도 이 동작을 사용자가 직접 제어하게 해달라는 요청이 올라와 있지만, 공식 답변은 아직입니다.
Google이 서드파티 앱을 막는 진짜 이유
공지에서 짚어준 “정책 위반 사례”
Google 공식 공지에는 이런 문구가 있습니다. “서드파티 소프트웨어에서 Gemini CLI OAuth를 사용하는 경우 계정이 정지될 수 있다.” 여기서 서드파티 소프트웨어의 대표 사례로 커뮤니티에서 지목된 게 OpenClaw, OpenCode 같은 오픈소스 AI 에이전트 툴들입니다.
💡 Google의 정책 변경 배경과 구조적 맥락을 같이 놓고 보니 이런 흐름이 보였습니다.
Google 입장에서 OpenClaw나 OpenCode 사용자는 Gemini 인프라를 쓰면서도 Google 생태계 밖으로 이탈할 가능성이 높습니다. 반면 Gemini CLI 자체를 쓰는 사용자는 한도가 차면 자연스럽게 Google에 돈을 냅니다. GitHub 토론에서 한 개발자가 정확히 짚었습니다. “OpenCode에서 한도가 차면 Codex나 Kimi 같은 대안을 찾지만, Gemini CLI에서 차면 Google에 돈을 내는 경로가 자연스럽다.”
계정 정지 가능성, 기준이 아직 모호합니다
걸리는 게 있습니다. 공지에서 “정책 위반이 감지되면 계정이 정지될 수 있다”고 했는데, 어떤 행동이 위반인지 구체적인 기준이 공개되지 않았습니다. GitHub 토론에서 A2A(Agent-to-Agent) 프로토콜이나 ACP 플래그를 통한 서드파티 연동도 해당되는지 물었지만, Google 공식 답변은 “검토 중”이라고만 나왔습니다. 자동화 스크립트나 Telegram 봇에 Gemini CLI를 연결하는 것도 해당되는지 여부가 아직 공식 답변이 없습니다.
지금 쓸 수 있는 현실적인 선택지
무료로 Pro급 성능이 필요하다면
가장 깔끔한 방법은 Google AI Studio에서 개인 API 키를 발급받아 Gemini CLI에 등록하는 겁니다. 개인 API 키를 쓰면 이번 정책 변경의 영향을 받지 않고, 사용량 단위 과금(Pay-As-You-Go)으로 자신의 쿼터를 직접 통제할 수 있습니다. 다만 무료 크레딧 소진 이후에는 비용이 발생합니다.
다른 터미널 AI 도구와 비교하면
써보니까 선택지가 갈립니다. Claude Code는 Claude Pro 구독($20/월) 이상이 필요하지만 사용 한도가 Gemini CLI보다 일관성이 있습니다. OpenAI Codex CLI는 ChatGPT Plus 구독자에게는 사실상 추가 비용 없이 쓸 수 있습니다. 벤치마크 기준으로는 세 도구가 0.2% 이내 성능 차이를 보이지만(출처: vibehackers.io, 2026.03.26), 안정성과 한도 예측 가능성에서 체감 차이가 납니다.
| 도구 | 무료 사용 | 유료 최소 | 한도 안정성 |
|---|---|---|---|
| Gemini CLI | Flash만 (3/25~) | AI Pro (~₩29,000/월) | 낮음 (429 빈발) |
| Claude Code | 없음 | Claude Pro ($20/월) | 높음 |
| Codex CLI | 없음 | ChatGPT Plus ($20/월) | 보통 |
(출처: 공식 요금 페이지 기준 / 한도 안정성은 2026.03 커뮤니티 보고 기반 추정)
기대했던 것과 달랐던 건, 무료 Gemini CLI가 Claude Code나 Codex CLI의 대안이 되던 시절이 3월 25일부로 사실상 끝났다는 점입니다.
자주 묻는 질문 — Gemini CLI 사용 제한
마치며 — 총평
Gemini CLI가 무료로 Pro 모델을 쓸 수 있다는 게 Claude Code, Codex CLI 대비 가장 강한 무기였습니다. 그 무기가 3월 25일을 기점으로 사라졌습니다.
솔직히 말하면, 정책 변경 자체는 충분히 예측 가능한 수순이었습니다. 인퍼런스 비용을 무한정 무료로 제공하는 건 지속 가능하지 않으니까요. 문제는 타이밍과 방식입니다. 변경 일주일 전에 공지하고, 유료 구독자에게도 똑같은 429 오류를 3주 이상 방치하는 건 제품에 대한 신뢰를 깎아먹는 일입니다.
지금 당장 개인 API 키를 등록해서 쓰거나, Claude Code·Codex CLI로 갈아타는 게 현실적인 선택입니다. Google이 Flash 큐 오버로드 문제를 해결하고 유료 구독자 안정성을 회복하기 전까지는, Gemini CLI를 메인 도구로 쓰기엔 리스크가 있습니다.
📚 본 포스팅 참고 자료
- Google Gemini CLI 공식 GitHub 토론 #22970 — Service update: mitigating abuse and prioritizing traffic
https://github.com/google-gemini/gemini-cli/discussions/22970 - Google Gemini Code Assist 공식 쿼터 문서 (2026.03.31 기준)
https://developers.google.com/gemini-code-assist/resources/quotas - Google One AI Plans 공식 요금제 비교 페이지
https://one.google.com/about/google-ai-plans/ - Gemini CLI 공식 릴리스 노트 (geminicli.com)
https://geminicli.com/docs/changelogs/
본 포스팅은 2026년 3월 31일 기준으로 작성되었습니다. Gemini CLI 정책·UI·쿼터 수치는 Google의 업데이트로 언제든지 변경될 수 있습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있으므로 최신 정보는 공식 문서를 확인해 주세요.











댓글 남기기