Gemini CLI 무료, 1,000회가 전부가 아닙니다
하루 1,000회 무료라고 했는데, 막상 써보면 Pro 모델은 5~7회 만에 막힙니다.
숫자 이면에 있는 구조를 공식 문서로 직접 들여다봤습니다.
✔ Pro vs Flash 실제 배분
✔ Plan 모드 쿼터 절약법
✔ Claude Code·Codex 비교
“하루 1,000회”가 틀린 말은 아니지만, 전부도 아닙니다
결론부터 말씀드리면, 1,000회는 모델 요청 전체의 합산 기준이고 그 안에서 Pro 모델과 Flash 모델이 따로 할당됩니다. Gemini CLI는 작업 성격에 따라 내부적으로 모델을 자동 선택하는데, 코딩처럼 무거운 추론이 필요한 작업은 Pro로 라우팅됩니다. 그리고 Pro의 무료 할당은 Flash와 비교해 현저히 낮습니다. Hacker News 스레드에서 구글 직원이 직접 확인한 내용입니다. (출처: github.com/google-gemini/gemini-cli/discussions/4122)
이 글은 공식 쿼터 문서와 GitHub Discussion의 내부 답변, 그리고 공식 비교 자료를 교차해서 실제로 어떤 구조인지 풀어냅니다.
공식 쿼터 표를 직접 펼쳐봤습니다
| 인증 방식 | 요금제 | 일일 최대 요청 |
|---|---|---|
| 구글 계정 로그인 | Gemini Code Assist (개인 무료) | 1,000회 |
| Google AI Pro (~월 $20) | 1,500회 | |
| Google AI Ultra (~월 $250) | 2,000회 | |
| Gemini API 키 | 무료 (미결제) | 250회 ⚠ |
| 종량제 (결제 연동) | 사용량 기반 | |
| Vertex AI | Express 모드 (무료 90일) | 계정별 상이 |
(출처: geminicli.com 공식 쿼터 문서)
💡 공식 발표와 실제 사용 패턴을 같이 놓고 보니 이런 차이가 보였습니다 — 구글 계정으로 로그인하면 1,000회지만, AI Studio에서 API 키를 발급받아 붙이면 오히려 250회로 줄어듭니다. 많은 가이드 영상이 “API 키 쓰면 더 유연하다”고 가르치는데, 무료 기준으로는 정반대입니다.
숫자 차이가 4배입니다. 무료로 최대한 쓰고 싶다면 구글 계정 로그인(OAuth)이 맞고, API 키 방식은 나중에 결제 연동이 필요할 때 바꾸는 게 낫습니다.
Pro 모델이 5~7회에 막히는 이유
공식 README에는 “Gemini 3 모델 접근 포함”이라고 나와 있습니다. 하지만 “어떤 Gemini 3 모델이, 얼마나”는 적혀 있지 않습니다. 실제로 GitHub Discussion에서 구글 내부 직원이 답변한 내용에 따르면, 1,000회 쿼터는 Flash와 Pro의 혼합 기준이고, Pro의 무료 할당량은 Flash 대비 현저히 낮게 설정되어 있습니다. (출처: github.com/google-gemini/gemini-cli/discussions/4122, 2025.07 Google 직원 공식 답변)
Hacker News 커뮤니티에서도 실측 데이터가 공유됐습니다. “1,000회는 Flash 포함 합계입니다. Pro는 5~7회 정도 쓰면 한도가 걸립니다”라는 코멘트가 현재도 상단에 올라 있습니다. Pro 1회는 복잡한 추론을 포함하기 때문에 단순 프롬프트 1회와 다릅니다. 코딩 작업 한 번이 내부적으로 수십 개의 모델 호출로 구성되는 경우도 있습니다. 복잡한 리팩토링 작업 한 번이 내부적으로 수십 번의 API 호출로 쌓입니다.
⚠ 실제로 확인된 패턴 (커뮤니티 실측 기준)
- 단순 질의 (Flash 라우팅): 1,000회 풀로 사용 가능
- 코드 생성·리팩토링 (Pro 라우팅): 실질 한도 5~100회 (작업 복잡도에 따라 크게 다름)
- 대형 코드베이스 분석: 단일 작업이 50~100 API 호출로 집계됨
구글은 이 부분에 대해 “Pro 용량을 내부적으로 조율 중이며 향후 한도를 높일 계획”이라고 공식 답변을 남겼지만, 구체적인 일정은 아직 공개되지 않았습니다. 지금 시점에서는 코딩 작업에 Pro가 얼마나 사용됐는지 `/stats model` 명령어로 직접 확인하는 게 제일 정확합니다.
API 키로 인증하면 오히려 줄어드는 이유
AI Studio에서 API 키를 발급받아 GEMINI_API_KEY로 환경변수를 설정하면 “더 많은 제어권”을 갖는다고 느끼기 쉽습니다. 많은 가이드 영상이 이 방법을 소개합니다. 그런데 공식 쿼터 문서에는 이렇게 명시되어 있습니다.
“API 키 무료 티어: 하루 최대 250회, Flash 모델 한정”
(출처: geminicli.com 공식 쿼터 문서)
구글 계정 로그인(1,000회)과 비교하면 4분의 1입니다. 거기다 API 키 무료 티어는 Flash 모델로만 제한됩니다. Pro 모델을 쓰려면 결제 정보를 등록하고 종량제로 전환해야 합니다. 즉, “API 키를 쓰면 Pro도 쓸 수 있다”는 건 맞지만, 그건 무료가 아닙니다.
반면 구글 계정으로 로그인하면 Pro 모델을 (소량이지만) 무료로 쓸 수 있고, 일일 한도도 1,000회로 4배 높습니다. 무료로 최대한 활용하고 싶다면 gemini를 실행한 뒤 Google 계정으로 OAuth 로그인하는 방법이 유리합니다.
Plan 모드가 쿼터 소모를 줄이는 원리
2026년 3월 13일, 구글은 Gemini CLI에 Plan 모드를 공식 추가했습니다. (출처: Google for Developers Korea 블로그, 2026.03.13) Plan 모드는 코드를 실제로 수정하기 전에 읽기 전용(read-only) 단계를 거치는 방식입니다. 에이전트가 먼저 코드베이스를 탐색하고, 의존성을 분석하고, 파일 구조를 파악한 뒤 실행 계획을 제안합니다. 사람이 계획을 승인하면 그때 비로소 실제 코드 수정이 시작됩니다.
💡 Plan 모드에서 탐색 단계의 API 호출은 수정 단계보다 훨씬 가볍습니다. 잘못된 방향으로 수십 번 Pro를 소모하는 대신, Flash 수준의 읽기 호출로 전략을 정하고 Pro 호출을 아낄 수 있습니다.
Plan 모드 켜는 방법
# 실행 시 Plan 모드로 시작
# 또는 실행 중 전환
/plan on
# 진행 상태 및 쿼터 확인
/stats model
코딩 작업을 무작정 돌리기 전에 Plan 모드로 먼저 계획을 잡으면, Pro 모델 쿼터를 실제 수정 단계에만 집중해서 쓸 수 있습니다. 특히 대형 리팩토링처럼 방향을 잘못 잡으면 API 호출이 폭발적으로 늘어나는 작업에서 효과적입니다.
Claude Code·Codex CLI와 비교하면 어떤가요
터미널 AI 코딩 에이전트 3강 구도에서 가격 구조는 꽤 다릅니다. deployhq.com 비교 분석 기준으로 정리하면 아래와 같습니다.
| 항목 | Gemini CLI | Claude Code | Codex CLI |
|---|---|---|---|
| 무료 진입 | ✔ 구글 계정 | 없음 | ChatGPT Plus 포함 |
| 기본 유료 | AI Pro ~$20/월 | Claude Pro $20/월 | ChatGPT Plus $20/월 |
| 컨텍스트 창 | 100만 토큰 | 20만 토큰 | 32만 토큰 |
| 실시간 웹 검색 | 내장 | 없음 | 없음 |
| 오픈소스 | Apache 2.0 | 비공개 | 비공개 |
| Plan 모드 | ✔ (2026.03~) | 유사 기능 있음 | ✔ Suggest 모드 |
(출처: deployhq.com 비교 분석 / 2025.12.29 기준, 요금 환율 기준 변동 가능)
Claude Code는 별도 구독 없이는 시작 자체가 안 됩니다. Codex CLI는 ChatGPT Plus($20/월)를 이미 쓰고 있다면 추가 비용 없이 사용할 수 있습니다. Gemini CLI만 진짜 $0으로 시작할 수 있는 유일한 선택지입니다.
단, 코딩 품질 면에서 Claude Code가 멀티파일 일관성에서 앞서고, Codex CLI는 CI/CD 자동화 통합에서 강점이 있다는 게 실사용 후기에서 자주 나오는 평가입니다. Gemini CLI는 대규모 코드베이스 분석과 웹 검색 기반 최신 정보 참조에서 차별점이 있습니다.
Q&A
Q1. 무료로 실제 코딩 작업을 할 수 있는 수준인가요?
단순 질문·검색·소규모 수정은 충분히 가능합니다. 다만 대형 리팩토링이나 복잡한 디버깅처럼 Pro 모델이 집중 투입되는 작업은 하루에 2~3회 정도면 한도에 걸릴 수 있습니다. Plan 모드를 먼저 쓰면 그나마 Pro 소모를 줄이는 데 도움이 됩니다.
Q2. /stats model 명령어로 뭘 볼 수 있나요?
현재 세션에서 Flash, Pro, Flash-Lite 모델별로 몇 번 호출됐는지 확인할 수 있습니다. “246 pro requests, 16 flash requests”처럼 나뉘어서 표시되므로, 실제로 Pro를 얼마나 썼는지 정확히 파악할 수 있습니다. 매 작업 전후에 체크하는 습관을 들이면 쿼터 관리에 도움이 됩니다.
Q3. Google AI Pro를 구독하면 Pro 모델 한도가 늘어나나요?
공식 문서 기준으로 AI Pro는 일일 1,500회로 늘어나지만, 그 안에서 Pro와 Flash의 배분이 구체적으로 얼마인지는 공식적으로 공개되지 않았습니다. 커뮤니티 보고 기준으로는 Pro 할당도 무료 대비 많이 늘어나는 편이지만, 여전히 상한이 있다는 후기가 있습니다.
Q4. Windows에서도 바로 쓸 수 있나요?
공식 GitHub에는 macOS, Linux, Windows 모두 지원으로 나와 있습니다. npm이 설치되어 있다면 npm install -g @google/gemini-cli 명령어 하나로 바로 설치 가능합니다. WSL 없이도 됩니다. 단, 일부 shell 명령어 실행 기능은 환경에 따라 동작이 다를 수 있습니다.
Q5. 무료 쿼터가 올라갈 가능성이 있나요?
구글 직원이 GitHub Discussion에서 “Pro 용량을 내부 조율 중이며 향후 개선 예정”이라고 답변했습니다. 다만 구체적인 일정은 공개되지 않았습니다. 지금은 커뮤니티와 공식 채널을 통해 수시로 변경되는 구조이므로, geminicli.com/docs의 쿼터 페이지를 주기적으로 확인하는 게 가장 정확합니다.
마치며
그럼에도 Claude Code나 Codex CLI와 비교하면 여전히 $0으로 진입할 수 있는 유일한 선택지입니다. 1M 토큰 컨텍스트, 내장 Google 검색, Apache 2.0 오픈소스 구조는 다른 두 도구에는 없는 장점입니다. 2026년 3월에 추가된 Plan 모드는 쿼터를 효율적으로 쓰는 데 실제로 도움이 됩니다.
솔직히 말하면, 지금 당장 Pro 모델을 하루 종일 무제한 쓰는 건 무료 티어로는 어렵습니다. 하지만 가볍게 시작해 보고 실제로 얼마나 필요한지 파악하는 용도로는 충분합니다. 써보고 판단해도 늦지 않습니다.
본 포스팅 참고 자료
- Gemini CLI 공식 쿼터 문서 — geminicli.com/docs/resources/quota-and-pricing
- Gemini CLI 공식 GitHub README (Apache 2.0) — github.com/google-gemini/gemini-cli
- GitHub Discussion: Clarification on Daily Request Limit — github.com/google-gemini/gemini-cli/discussions/4122
- Google for Developers Korea Blog — developers-kr.googleblog.com (2026.03.13)
- Claude Code·Codex CLI·Gemini CLI 비교 — deployhq.com (2025.12.29)
본 포스팅은 2026년 3월 29일 기준으로 작성됐습니다. Gemini CLI의 쿼터 정책, 모델 배분, 요금 구조는 구글의 서비스 정책에 따라 예고 없이 변경될 수 있습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있으므로, 실제 사용 전 공식 문서에서 최신 내용을 반드시 확인하시기 바랍니다.











댓글 남기기