Gemini CLI v0.1.x 기준
3월 25일 정책 변경 예정
Gemini CLI 무료, Pro 쓰던 게 아니었습니다
구글이 어제(2026.03.19) 공식 발표했습니다. 3월 25일부터 Gemini CLI 무료 사용자는 Pro 모델을 쓸 수 없습니다. Flash만 가능합니다. 그런데 사실 이미 그랬습니다. 공식 문서에 적힌 “하루 1,000 요청”은 Pro에 해당하는 수치가 아닙니다.
“1,000 요청 무료”라는 말, 조건이 있었습니다
Gemini CLI를 소개하는 유튜브나 블로그에는 “하루 1,000 요청 무료”라는 말이 자주 등장합니다. 맞는 말이긴 한데, 빠진 맥락이 있습니다. 그 1,000 요청은 Flash 모델에 대한 한도입니다. Pro 모델은 처음부터 별도 제한이 있었고, 실제 사용자들은 25~100회 요청만에도 Pro 한도에 걸렸습니다.
💡 공식 GitHub 토론(#4122)에 직접 나와 있습니다: “The Gemini CLI free quota is typically 1,000 requests per day and up to 60 RPM on Flash. Flash is not a heavy lifter for coding applications. You may get a small number of requests on Gemini 2.5 Pro, but Pro is a paid model.” — Gemini CLI 팀 공식 답변 (2025.07, 출처: github.com/google-gemini/gemini-cli/discussions/4122)
Pro 모델 무료 접근은 “실험적으로 일부 제공”하는 형태였지, 1,000 요청 전부가 Pro에 보장된 게 아니었습니다. 문서엔 한 줄도 명확히 적혀 있지 않았고, 구글 팀도 “혼란을 드려 죄송하다”고 직접 인정했습니다. 공식 문서에서 별도 이유를 밝히지 않은 채 운영되어 온 정책이었습니다.
이게 단순한 실수가 아닌 이유가 있습니다. 구글은 무료 Gemini CLI의 OAuth 인증을 통해 서드파티 도구들이 Pro 할당량을 우회해서 쓰고 있다는 걸 파악하고 있었고, 3월 19일 발표는 그 대응의 일환입니다. (출처: KuCoin News, 2026.03.19)
인증 방식에 따라 Gemini CLI 한도가 완전히 달라집니다
Gemini CLI는 로그인 방식이 세 가지입니다. 어떤 방식으로 인증하느냐에 따라 한도 자체가 다릅니다. 같은 “무료 사용자”라도 숫자가 달라서 헷갈리는 경우가 많습니다.
| 인증 방식 | 일일 요청 한도 | 분당 한도 | 사용 가능 모델 (3.25 이후) |
|---|---|---|---|
| Google 계정 로그인 (개인) | 1,000회 | 60 RPM | Flash만 가능 (Pro 차단) |
| Gemini API Key (무료) | 250회 | 10 RPM | Flash만 가능 |
| Vertex AI Express Mode | 가변 | 가변 | 90일 무료, 이후 청구 |
출처: Gemini CLI 공식 문서 — Quotas and pricing (geminicli.com/docs/resources/quota-and-pricing/)
눈에 띄는 건 API Key 인증입니다. 같은 무료임에도 일일 한도가 250회로 훨씬 낮습니다. 터미널에서 API Key 방식으로 쓰고 있다면 1,000회가 아니라 250회가 실제 한도입니다. 구글 계정 로그인 방식과 4배 차이입니다.
Vertex AI Express Mode는 별도 결제 설정 없이 쓸 수 있지만, 90일이 지나면 자동으로 청구 설정을 요구합니다. 기간 한도가 있는 무료라는 점에서 일반적인 “무료 한도”와 다릅니다. 90일이 넘도록 청구 설정을 안 하면 접근이 막힙니다.
3월 25일부터 무료 사용자에게 달라지는 것들
구글의 Ryan J. Salva(Head of Gemini CLI, Senior Product Director of Developer Experience)가 2026.03.18 GitHub 공식 토론에 올린 서비스 업데이트 발표에 따르면, 세 가지가 바뀝니다.
⚠️ 2026.03.25부터 시행되는 3가지 변경사항
- 무료 사용자는 Pro 모델 접근 완전 차단. Gemini Flash 모델만 사용 가능. Pro·Ultra 구독($19.99/월 이상) 필요.
- 트래픽 우선순위가 라이선스 유형별로 달라짐. 무료 사용자는 피크 타임에 접근 제한 가능성.
- 어뷰징 탐지 강화. Gemini CLI의 OAuth 인증을 이용해 서드파티 소프트웨어에 연결하는 행위 적발 시 계정 제한.
출처: GitHub Discussions #22970, google-gemini/gemini-cli (2026.03.18)
세 번째 항목이 특히 중요합니다. Gemini CLI의 OAuth 인증은 OpenClaw, Antigravity 등 서드파티 AI 코딩 도구들이 구글 Pro 모델을 무료로 우회해서 사용하는 창구로 쓰여왔습니다. 실제로 2026년 2월에도 OpenClaw 사용자들이 구글에 의해 계정 제한을 받은 사례가 있습니다. (출처: Hacker News #47115805, 2026.02.23)
Antigravity(구글의 코딩 에이전트 플랫폼)을 통한 접근도 마찬가지입니다. 유료 구독을 Gemini CLI 이외의 경로로 우회하는 방식은 이번 정책 강화의 직접적인 단속 대상입니다. 툴 이름만 달라도 백엔드에서 Gemini CLI OAuth를 쓰고 있다면 해당됩니다.
유료 구독해도 Gemini CLI가 막히는 경우가 있습니다
돈을 내도 막히는 상황이 보고되고 있습니다. Google AI Pro($19.99/월) 구독자들이 2026년 2월부터 Gemini 3.1 Pro를 사용 중 주간 한도에 걸리는 문제를 겪고 있습니다. Google AI 공식 개발자 포럼에는 “한 번도 Gemini 3.1을 쓴 적이 없는데 주간 할당량이 잠겼다”는 제목의 스레드가 3일 전에 올라왔습니다.
💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다: 공식 문서에는 AI Pro 구독 시 Gemini Code Assist 기준 1,500 요청/일이라고 적혀 있습니다. 그런데 실제 사용자는 246회 Pro 요청(+ 16회 Flash + 1회 Flash-Lite = 263회)만에 한도 초과 오류를 받았습니다. 1,500회의 약 17% 수준입니다. 공식 문서에서 이유를 밝히지 않고 있습니다.
원인으로 추정되는 건 두 가지입니다. 첫 번째는 Pro 모델 전용 별도 할당량이 존재한다는 것입니다. Gemini CLI에서 “하루 1,500 요청”은 Flash와 Pro를 합산한 전체 요청 수로 카운트되지 않을 가능성이 큽니다. 두 번째는 단일 프롬프트가 내부적으로 여러 번의 API 호출을 발생시킨다는 점입니다. GitHub 팀의 답변에서도 이 점을 직접 언급했습니다.
Ultra 구독자($249.99/월)도 “주간 할당량을 2시간 만에 다 썼다”는 사례가 Reddit에서 확인됩니다. 구독료 대비 실사용 가능 시간이 구독 내용에 명시된 한도보다 훨씬 짧을 수 있습니다.
Claude Code, Codex와 무료 한도 직접 비교해봤습니다
터미널 기반 AI 코딩 도구 세 가지를 무료 한도 기준으로 나란히 놓았습니다. 3월 25일 이후 기준입니다.
| 도구 | 무료 모델 수준 | 무료 일일 한도 | 유료 최저가 |
|---|---|---|---|
| Gemini CLI | Flash만 가능 (3.25~) | 약 1,000회 | $19.99/월 |
| OpenAI Codex CLI | ChatGPT Plus 필요 | 없음 (유료 전용) | $20/월 |
| Claude Code | Claude 모델 (Pro 필요) | 없음 (유료 전용) | $20/월 |
출처: 각 공식 문서 및 nxcode.io 비교 리포트 (2026.03.11), deployhq.com 비교 글 기준
숫자만 보면 Gemini CLI가 여전히 무료 한도 면에서 앞섭니다. 하루 1,000회는 Claude Code나 Codex가 아예 제공하지 않는 수치입니다. 문제는 Flash 모델로만 쓸 때 코딩 품질입니다. GitHub 공식 답변에서도 “Flash is not a heavy lifter for coding applications”라고 직접 표현했습니다. Flash가 빠르긴 하지만, 복잡한 리팩토링이나 멀티 파일 수정 작업에서는 Pro보다 결과물이 눈에 띄게 낮습니다.
솔직히 말하면, “무료 1,000회”라는 숫자는 코딩 작업 기준으로 체감이 다릅니다. 프롬프트 1회가 내부적으로 수십 번의 API 호출을 발생시키는 구조 때문에, 실제 세션 기준으로는 10~15회 세션이면 하루 한도가 소진될 수 있습니다.
무료로 최대한 쓰려면 지금 당장 이렇게 하세요
3월 25일 이전까지, 아직 무료로 Gemini 3.1 Pro를 쓸 수 있는 사흘이 남았습니다. 그 이후를 대비해 지금 당장 할 수 있는 것들을 정리했습니다.
🔧 Gemini CLI 무료 한도 최적화 체크리스트
- 인증 방식 확인: Google 계정 로그인인지 API Key 로그인인지 확인. API Key 방식이면 하루 한도가 250회로 줄어듭니다.
- /settings에서 “Preview Features” 활성화: 공식 릴리스 노트에 따르면 이 토글을 켜면 Free Tier 사용자도 Gemini 3 Pro·Flash에 접근 가능합니다. 단, 3.25 이후 유지 여부는 미정입니다.
- /stats model 명령어로 현재 사용량 확인: 세션 중 토큰·요청 수를 실시간 확인 가능합니다. 한도 초과 전에 미리 감지할 수 있습니다.
- Plan Mode 활용: 2026.03.11 추가된 Plan Mode(/plan 또는 Shift+Tab)는 읽기 전용으로 실행되므로 실제 코드 변경 없이 분석·설계가 가능합니다. 토큰 소비를 줄이는 데 효과적입니다.
- Vertex AI Express Mode 고려: 결제 설정 없이 90일 무료 사용 가능. 기간 내에는 Pro 모델 접근도 일부 가능합니다.
3월 25일 이후에도 무료로 Pro 수준의 코딩을 원한다면, Gemini CLI 단독보다 GitHub Copilot Free(월 2,000 completions + 50 premium requests)와 병행하는 방식이 현재로선 무료 커버리지가 가장 넓습니다. (출처: nxcode.io, 2026.03.11 — “Best free tier for CLI work: Gemini CLI (1,000 req/day, mostly Flash) combined with Copilot Free”)
Q&A
마치며
Gemini CLI는 여전히 무료 코딩 도구 중 한도 수치가 가장 너그러운 편입니다. 하루 1,000회라는 숫자 자체는 Claude Code나 Codex가 제공하지 않는 수준입니다. 하지만 그 1,000회가 전부 Pro 요청에 해당하지 않는다는 걸 처음부터 명확히 밝히지 않았다는 점은 짚고 넘어가야 합니다.
3월 25일 이후 무료 사용자에게 Flash만 남는 건 아쉽지만, 이 부분은 처음부터 구조상 예고된 수순이었습니다. 서드파티 우회 사용이 광범위하게 이루어지고 있었고, Pro 모델 무료 제공은 실질적으로 지속 불가능한 수준이었습니다. 유료 AI Ultra 구독자도 2시간 만에 주간 할당량이 소진되는 상황이었으니까요.
Flash 모델의 실제 코딩 품질이 개선되고 있는 건 분명합니다. Gemini 3.1 Flash는 이전 세대보다 속도와 컨텍스트 처리 면에서 확실히 좋아졌습니다. Plan Mode를 활용해 분석→설계→구현 흐름을 나누면 Flash 한도 안에서도 꽤 실용적인 작업이 가능합니다. 무료로 계속 쓰되, 지금부터는 한도를 아끼며 쓰는 방식으로 접근하는 게 현실적입니다.
본 포스팅 참고 자료
- Google Developers Blog — Plan mode is now available in Gemini CLI (2026.03.11) developers.googleblog.com
- Gemini CLI 공식 문서 — Quotas and pricing geminicli.com/docs/resources/quota-and-pricing/
- GitHub Discussions #22970 — Service update: mitigating abuse and prioritizing traffic (2026.03.18) github.com/google-gemini/gemini-cli/discussions/22970
- GitHub Discussions #4122 — Clarification on Daily Request Limit github.com/google-gemini/gemini-cli/discussions/4122
- KuCoin News — Gemini CLI to Limit Free Users to Flash Model Starting March 25 (2026.03.19)
- Google AI Developer Forum — weekly rate limit even with ZERO usage on Gemini 3.1 (2026.03.17)
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Gemini CLI는 수시로 업데이트되는 서비스로, 본문의 수치와 정책은 2026.03.21 기준이며 이후 달라질 수 있습니다. 최신 정보는 공식 문서를 직접 확인하시기 바랍니다.


댓글 남기기