Gemini CLI v0.35.0 기준
IT/AI
Gemini CLI 1,000회 무료, 실제로 안 되는 3가지 이유
구글이 “하루 1,000회 무료, Gemini 2.5 Pro까지”라고 발표했습니다. 그런데 막상 써보면 생각보다 훨씬 빨리 막힙니다. 공식 문서를 직접 뜯어보니, 홍보 문구와 실제 한도 사이에 세 가지 구조적 차이가 있었습니다.
1,000회가 Flash 기준이라는 것, 공식 문서에 이렇게 나옵니다
결론부터 말씀드리면, Gemini CLI의 무료 일일 1,000회는 Gemini 2.5 Pro를 1,000번 쓸 수 있다는 뜻이 아닙니다. 공식 문서(Google for Developers, 2026.03.25 업데이트)에는 “1,000회는 개인(free) 티어 사용자가 Gemini Code Assist를 통해 사용할 수 있는 하루 최대 모델 요청 수”로 명시돼 있습니다. 여기서 ‘모델’은 Gemini CLI가 자동으로 결정합니다. 즉, 구글이 Flash 쪽으로 라우팅하면 Flash가 쓰이고, Pro 쪽으로 라우팅하면 Pro가 쓰이는 구조입니다. (출처: Google Gemini Code Assist Quotas, 2026.03.25)
공식 문서의 정확한 표현은 이렇습니다. “Model requests will be made across the Gemini model family as determined by Gemini CLI.” 번역하면 “어느 모델이 쓰일지는 Gemini CLI가 결정합니다”입니다. 사용자가 모델을 지정하지 않으면 CLI가 알아서 선택하는 구조이고, 무료 구간에서는 Flash가 기본값으로 적용됩니다. 유튜브나 블로그에서 “하루 1,000회 무료로 Gemini 2.5 Pro를 마음껏 써도 된다”라는 설명이 자주 등장하는데, 공식 GitHub Discussion에서 구글 직원이 직접 “이건 오해”라고 정정한 내용이 있습니다. (출처: GitHub Gemini CLI Discussions #4122)
💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다.
무료 사용자가 gemini -m "gemini-2.5-pro"를 입력해도 CLI가 내부적으로 Flash로 전환할 수 있습니다. 특히 2026년 3월 25일 이후 무료 티어에서는 Pro 모델 라우팅 자체가 차단됐습니다.
프롬프트 1개 ≠ 요청 1회, 실제로 얼마나 빠르게 소진될까
이게 두 번째 함정입니다. Gemini CLI는 터미널 AI 에이전트이기 때문에, 내가 “이 폴더 파일들 정리해줘”라고 프롬프트를 하나 입력해도 CLI 내부에서 GoogleSearch 도구 호출, ReadFolder, WriteFile 등 여러 번의 모델 요청이 연쇄적으로 발생합니다. 공식 문서에도 “When in agent mode or when using the Gemini CLI, one prompt might result in multiple model requests.”라고 명확히 적혀 있습니다. (출처: Google Gemini Code Assist Quotas)
실제 소진 속도를 직접 따라 계산해볼 수 있습니다
| 작업 유형 | 프롬프트 수 | 실제 모델 요청 수(추정) | 1,000회 소진 시점 |
|---|---|---|---|
| 간단한 질문·답변 | 1개당 1회 | 약 1~2회 | 약 500~1,000개 프롬프트 |
| 웹 검색 + 파일 저장 | 1개당 여러 도구 호출 | 약 5~10회 | 약 100~200개 프롬프트 |
| 코드베이스 리팩토링 | 1개당 수십 회 호출 | 약 20~50회 | 약 20~50개 프롬프트 |
※ 모델 요청 수는 작업 복잡도에 따라 달라지는 추정치. 실제 소비량은 /stats model 명령어로 세션 중 직접 확인 가능합니다.
코드베이스 리팩토링 같은 무거운 작업에서는 프롬프트 25~50개만으로 하루 한도가 꽉 찰 수 있습니다. 이건 GitHub Discussion에서 실사용자들이 직접 보고한 수치이기도 합니다. 25개 요청 후 막혔다는 보고가 여러 건이었고, 구글 측도 “프롬프트 1개가 수십 건의 모델 요청을 유발할 수 있다”고 공식 답변했습니다. (출처: GitHub Discussion #4122)
2026년 3월 25일, 무료 사용자에게 생긴 결정적 변화
세 번째이자 가장 최근에 생긴 변화입니다. 구글은 2026년 3월 25일부터 무료 티어 사용자의 Gemini Pro 모델 접근을 완전히 차단했습니다. 공식 GitHub Discussion(#22970)에서 구글 팀은 “Starting March 25, 2026, Gemini Pro models will only be accessible via paid subscriptions. Free tier users will be limited to Gemini Flash models.”이라고 직접 공지했습니다. 무료로 Pro를 쓸 수 있던 구조가 이날부터 Flash 전용으로 바뀐 겁니다.
⚠️ 주의: 이 변경 이후에도 여러 유튜브 영상과 블로그는 “Gemini CLI로 Gemini 2.5 Pro 무료 1,000회”를 안내하고 있습니다. 해당 콘텐츠는 2026년 3월 25일 이전 기준이므로 현재에는 적용되지 않습니다. 2026년 3월 25일 이후 무료 사용자는 Flash 계열 모델만 사용 가능합니다.
이 조치의 배경으로 구글은 “무료 티어 남용(abuse) 방지 및 트래픽 우선순위 조정”을 공식 이유로 밝혔습니다. 특정 국가에서 대규모로 무료 Pro 쿼터를 탐색하는 행위가 원인 중 하나로 지목됐습니다. 공식 이유 외에 추가적인 설명은 제공되지 않았습니다. 이 변경 이후 Gemini CLI를 처음 설치하는 개발자라면, 터미널에 Gemini 2.5 Pro 모델명을 입력해도 Flash로 강제 전환되거나 “Pro 모델은 유료 구독 필요” 오류가 발생합니다.
Google AI Plus를 사도 CLI 한도가 늘지 않는 이유
여기서 많은 분들이 놓치는 부분이 있습니다. 구글이 2026년 1월에 출시한 Google AI Plus(월 11,000원)는 Gemini CLI에서 공식 미지원 티어입니다. geminicli.com 공식 문서에 이렇게 적혀 있습니다. “Supported tiers: Tiers not listed above, including Google AI Plus, are not supported.” Gemini 앱이나 Google One 스토리지 혜택은 받을 수 있지만, CLI의 일일 요청 한도는 무료 1,000회에서 전혀 변하지 않습니다. (출처: geminicli.com 공식 문서, 2026.03.26)
| 구독 티어 | 한국 월 요금 | Gemini CLI 일일 한도 | CLI 지원 여부 |
|---|---|---|---|
| 무료 (Google 계정) | ₩0 | 1,000회 (Flash만) | ✅ |
| Google AI Plus | ₩11,000 | 1,000회 (동일) | ❌ 미지원 |
| Google AI Pro | ₩29,000 | 1,500회 (Pro 포함) | ✅ |
| Google AI Ultra | ₩369,000 | 2,000회 (Pro 포함) | ✅ |
| Gemini API Key (무료) | ₩0 | 250회 (Flash만) | ✅ |
※ 요금은 2026.04.07 기준 한국 가격. 출처: geminicli.com 공식 문서, Google 공식 문서
한 달에 11,000원을 내도 CLI 관점에서는 무료 사용자와 똑같은 1,000회 Flash 한도가 적용됩니다. CLI 한도를 늘리려면 AI Plus가 아니라 AI Pro나 AI Ultra를 선택해야 합니다.
Claude Code와 비교했을 때 실제 차이가 나는 조건
Gemini CLI와 Claude Code를 비교하는 콘텐츠는 많지만, 대부분 기능 소개 수준에 머뭅니다. 실제로 측정된 데이터가 있습니다. DataCamp가 인용한 Composio의 CLI 도구 빌드 테스트(2026년 3월)에서 Claude Code는 1시간 17분 만에 작업을 완료했고, Gemini CLI는 2시간 2분이 걸렸습니다. 속도에서는 Claude Code가 약 1.6배 빠른 결과를 보였습니다. (출처: DataCamp, “Gemini CLI vs. Claude Code: Differences and Use Cases (2026)”, 2026.03.26) 속도 차이가 비용이나 한도 문제에서 오는 건 아닙니다.
두 도구가 갈리는 조건이 있습니다
Gemini CLI가 우위를 보이는 상황은 따로 있습니다. 컨텍스트 창이 매우 큰 경우입니다. Gemini 2.5 Pro는 최대 100만 토큰 컨텍스트를 지원합니다. 대형 코드베이스 전체를 한 번에 올려놓고 분석할 때는 Claude Code보다 유리합니다. 반면 반복적인 짧은 작업, 빠른 코드 수정, 정확성이 중요한 작업에서는 Claude Code 쪽이 실측 데이터상 더 나은 결과를 보였습니다. Reddit에서 실사용자들이 정리한 피드백도 비슷합니다. Gemini CLI는 오픈소스이고 구글이 지원하는 대기업 도구라는 안정감이 있지만, 계획 모드(plan mode)와 실행 모드 사이의 전환이 Claude Code보다 덜 유연하다는 의견이 반복적으로 등장합니다.
💡 두 도구의 실사용 흐름을 함께 놓고 보면 이런 패턴이 보입니다.
무료로 시작해서 한도 문제 없이 쓰고 싶다면 Gemini CLI의 무료 Flash 구간은 가벼운 작업에 충분합니다. 하지만 코드 품질과 속도가 중요한 반복 개발 작업이라면, Claude Code($20/월)가 구독 대비 실제 처리량에서 더 효율적입니다.
한도를 실질적으로 늘리는 방법 3가지
한도 문제를 해결하는 방법은 공식 문서에 세 가지 경로가 나와 있습니다.
Google AI Pro 구독 (₩29,000/월)
하루 한도가 1,000회 → 1,500회로 늘어나고, Gemini Pro 모델 접근이 가능해집니다. 현재로서는 CLI 한도를 올리면서 Pro 모델까지 같이 쓸 수 있는 가장 실용적인 옵션입니다.
Gemini API Key (종량제)
한도 자체가 유연해집니다. 대신 쓴 만큼 비용이 발생합니다. Gemini 2.5 Pro 기준 입력 100만 토큰당 $1.25, 출력 100만 토큰당 $10 수준입니다. (출처: Google AI Studio 요금표) 대규모 반복 작업에는 비용이 빠르게 올라갈 수 있습니다.
Vertex AI Express Mode 활용
90일간 무료로 사용할 수 있고, 한도는 계정과 모델에 따라 다릅니다. 테스트 목적이거나 단기 프로젝트라면 API Key보다 먼저 시도해볼 수 있는 옵션입니다. 90일 이후에는 결제 활성화가 필요합니다.
한 가지 더 짚고 넘어갈 것이 있습니다. 세션 중에 /stats model 명령어를 입력하면 현재까지 사용한 토큰 수와 남은 한도를 실시간으로 볼 수 있습니다. 작업이 무거워질 것 같다면 중간에 소비량을 확인하는 습관이 불필요한 한도 초과를 막는 가장 실용적인 방법입니다. (출처: geminicli.com 공식 문서)
Q&A
마치며
Gemini CLI는 여전히 터미널 AI 에이전트 중 가장 관대한 무료 구간 중 하나를 제공합니다. 다만 “무료로 Gemini 2.5 Pro를 하루 1,000번”이라는 문구는 3월 25일 이후로는 사실이 아닙니다. 무료라면 Flash, Pro를 쓰고 싶다면 AI Pro 이상, 그리고 AI Plus는 CLI에서 아무 효과가 없다는 세 가지를 먼저 알고 시작하면 막히는 상황 자체를 피할 수 있습니다.
솔직히 말하면, 지금 상황에서 Gemini CLI의 최대 강점은 오픈소스라는 점과 구글이 계속 업데이트를 밀어넣는다는 점입니다. Plan 모드, MCP 확장 지원 등 최근 몇 달간 기능이 빠르게 쌓이고 있습니다. 한도 문제는 구조적으로 개선될 여지가 있고, 공식 GitHub에서도 “내부적으로 쿼터를 조정 중”이라는 언급이 있었습니다. 지금은 Flash 무료 구간으로 시작해서 써보고, 실제로 Pro 모델이 필요한 작업이 생길 때 AI Pro로 전환하는 순서가 현실적입니다.
본 포스팅 참고 자료
- Google Gemini Code Assist 공식 Quotas 문서 (2026.03.25 업데이트)
- Gemini CLI 공식 사이트 — Quotas and Pricing (2026.03.26 업데이트)
- GitHub Gemini CLI Discussions #4122 — Clarification on Daily Request Limit
- GitHub Gemini CLI Discussions #22970 — Service update: mitigating abuse (2026.03.18)
- DataCamp, “Gemini CLI vs. Claude Code: Differences and Use Cases (2026)”, 2026.03.26
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Gemini CLI의 한도·요금·지원 티어는 Google의 내부 정책에 따라 예고 없이 조정될 수 있으며, 최신 정보는 반드시 공식 문서에서 직접 확인하시기 바랍니다.

댓글 남기기