Gemini CLI v0.1.x / Plan 모드 신규 탑재
Gemini CLI 무료 한도: “1,000회 공짜”가 실제로 틀린 이유
Google이 공식 문서에서 선언한 “하루 1,000회 무료”는 숫자 자체는 사실입니다. 하지만 그 숫자를 그대로 믿으면 Plan 모드를 켜는 순간 생각보다 훨씬 빠르게 한도에 도달하게 됩니다. 특히 2026년 3월 11일 정식 출시된 Plan 모드는 Gemini 3.1 Pro를 우선 사용하는 구조이기 때문에, 무료 한도를 쓰는 방식이 완전히 달라집니다.
Plan 모드 정식 출시: 무엇이 달라졌나
2026년 3월 11일, Google Developers 블로그를 통해 Gemini CLI에 Plan 모드(Plan Mode)가 공식 출시되었습니다. (출처: Google Developers Blog, 2026.03.11) 이 모드는 AI가 코드베이스를 먼저 분석하고, 구조적인 실행 계획을 수립한 뒤, 사용자의 최종 승인을 받아야만 파일을 수정하는 읽기 전용 설계 환경입니다.
사용 방법은 간단합니다. 터미널에서 /plan을 입력하거나 Shift+Tab을 눌러 모드를 전환하면 됩니다. Plan 모드에서는 read_file, grep_search, glob 등 읽기 전용 도구만 허용되며, 파일 수정은 ~/.gemini/tmp/ 하위 계획 파일(.md)에만 한정됩니다.
겉으로 보면 더 안전하고 신중한 AI 개발 환경처럼 보입니다. 그러나 바로 이 Plan 모드가 무료 한도와 관련해 예상과 완전히 다른 결과를 만들어냅니다.
알고 보면 반대입니다 — “1,000회” 숫자의 함정
💡 많은 분들이 오해하는 부분: Google 계정으로 로그인하면 하루 1,000회 요청이 가능하다는 것은 사실입니다. 하지만 “1회 요청”과 “1번의 프롬프트”는 다릅니다.
Google 공식 문서(Gemini Code Assist Quotas, 2026.02.25 기준)는 다음과 같이 명시합니다.
| 로그인 방식 | 분당 요청(RPM) | 일일 요청(RPD) | 모델 |
|---|---|---|---|
| Google 계정 (Gemini Code Assist) | 60 | 1,000 | Gemini 모델 자동 선택 |
| Gemini API 키 (무료) | 10 | 250 | Flash 모델만 |
| Google AI Pro | 120 | 1,500 | Gemini 모델 자동 선택 |
(출처: Google Developers 공식 문서, 2026.02.25 기준)
여기서 핵심은 Google 공식 문서 자체에 굵게 표시된 경고문 한 줄입니다. “When in agent mode or when using the Gemini CLI, one prompt might result in multiple model requests.” — 즉, 에이전트 모드에서 프롬프트 1개가 다수의 API 요청으로 처리됩니다. 이것이 독자에게 의미하는 바는 명확합니다. 한 번 복잡한 작업을 요청할 때마다 내부적으로 3~5개 API 호출이 발생하며, 유효 사용 횟수는 숫자로 표시된 한도보다 훨씬 적습니다.
실제 사용자들의 보고를 보면, GitHub Issue #6557에서는 “하루 20개 메시지밖에 못 썼다”는 불만이 올라왔고, Reddit r/GeminiCLI에서는 Pro 플랜(1,500회) 사용자도 50~60번의 실제 대화 후 한도에 도달했다는 경험이 공유되었습니다. (출처: GitHub google-gemini/gemini-cli #6557, 2026.03 기준)
직접 검증 수식:
실제 사용 가능 프롬프트 수 = 일일 API 한도 ÷ 프롬프트당 API 호출 수
= 1,000 ÷ 3~5 = 약 200~333회 (단순 작업 기준)
= 1,000 ÷ 15~50 = 약 20~67회 (Plan 모드·복잡한 코딩 작업 기준)
→ 결과 해석: Plan 모드로 복잡한 기능 개발을 하루 종일 사용하면, 광고에 나온 1,000회 한도는 실질적으로 20~67번의 대화로 소진됩니다.
로그인 방법에 따라 한도가 4배 달라지는 이유
Gemini CLI는 세 가지 로그인 방식을 지원합니다. Google 계정(OAuth), Gemini API 키, Vertex AI 인증이 그것입니다. 문제는 같은 “무료”라는 단어를 쓰면서 실제 한도가 최대 4배까지 차이난다는 점입니다.
Google 계정으로 로그인하면 하루 1,000회의 API 요청과 분당 60회가 허용됩니다. 반면 API 키를 발급받아 연결하면 하루 250회, 분당 10회에 불과합니다. 그뿐 아니라 API 키 방식에서는 Flash 모델만 사용 가능합니다.
💡 이 분석은 공식 quota 문서와 실사용 비교를 교차한 결과입니다
많은 개발자들이 “API 키를 쓰는 게 더 자유롭다”고 생각하지만, 무료 구간에서는 오히려 Google 계정 OAuth 로그인이 4배 더 많은 요청을 허용합니다. 개인 개발자라면 반드시 Google 계정으로 gemini auth login 방식을 선택하세요.
직접 계산:
Google 계정 일일 한도 ÷ API 키 일일 한도 = 1,000 ÷ 250 = 4배
→ 결과 해석: 어떤 방식으로 인증하느냐가 무료로 쓸 수 있는 양을 결정합니다. 소스 코드에서 GEMINI_API_KEY 환경변수만 설정한 경우 자동으로 API 키 방식이 적용되어 실질 한도가 4분의 1로 줄어듭니다. (출처: Gemini CLI 공식 Quota 문서)
Plan 모드가 무료 한도를 더 빨리 소진시키는 구조
2026년 3월 11일 공식 출시된 Plan 모드의 공식 문서에는 매우 중요한 내용이 담겨 있습니다. “Automatic Model Routing” 항목입니다. (출처: Gemini CLI Plan Mode 공식 문서)
공식 문서에 따르면, Plan 모드에서는 Gemini CLI가 자동으로 고추론(Pro) 모델에 요청을 라우팅합니다. 코드베이스 분석, 아키텍처 설계, 의존성 파악 등 모든 Plan 단계의 작업이 Gemini 3.1 Pro 모델을 사용하는 것입니다. 반면 Plan 승인 후 구현(Implementation) 단계로 전환되면 자동으로 빠른 Flash 모델로 전환됩니다.
⚠️ 잠깐, 이게 사실입니다: Reddit r/GeminiCLI(2026.03.08)에서 한 사용자가 실측한 결과, Pro 플랜(1,500 API 요청/일) 기준으로 Plan 모드에서는 Gemini 3.1 Pro 요청이 약 200회, Flash 요청이 약 1,300회 배분됩니다. 여기서 1번의 Plan 모드 대화가 3~5개 Pro 요청을 소비하면, 실제로는 약 40~67번의 Plan 대화 후 Pro 모델이 소진됩니다.
더 심각한 것은, 기존에 Gemini CLI를 모델 라우팅 없이 사용하던 개발자도 Plan 모드 기본 활성화 이후 자동으로 이 구조에 편입된다는 점입니다. 공식 문서 기준, Plan 모드는 기본(Default) 설정으로 활성화되어 있습니다. 무의식 중에 Plan 모드로 진입하면 Pro 요청이 소진됩니다.
Plan 모드 사용 시 요청 소비 구조 (추정)
Plan 단계: 1회 대화 → Gemini 3.1 Pro 3~5 API 요청
구현 단계: 1회 대화 → Gemini Flash 1~3 API 요청
(※ 추정치. 실제 요청 수는 프롬프트 복잡도에 따라 달라짐. 근거: Gemini CLI 공식 Plan 모드 문서 Automatic Model Routing 항목)
실제로 써보면 당황하는 이유 — Pro vs Flash 라우팅 미스터리
Gemini CLI를 처음 쓰는 분들이 가장 당황하는 상황은, 분명히 한도가 남아 있는데 갑자기 Pro 모델 응답이 느려지거나 Flash로 강제 전환되는 순간입니다. 이것은 버그가 아닙니다. 공식 라우팅 정책입니다.
Gemini CLI는 내부적으로 요청 복잡도를 판단해 Pro와 Flash 사이에서 자동으로 전환합니다. 그런데 여기서 알려지지 않은 사실이 있습니다. 응답이 두 번 이상 느리면 자동으로 그 세션에서 Flash로 전환되어 버립니다. (출처: Augment Code 실사용 분석 리포트, 2026.03.12)
이 자동 전환이 사용자에게 명시적으로 알림을 주지 않는 경우가 많아서, Pro 응답을 기대하고 있었는데 실제로는 Flash가 답변하고 있는 상황이 발생합니다. 세션 도중 현재 어떤 모델이 답변하는지 확인하려면 /stats session 명령어를 사용하면 됩니다.
💡 현재 세션의 모델별 사용량 확인하는 법
/stats session
이 명령어로 Pro와 Flash 각각 몇 번의 API 요청이 사용되었는지 확인할 수 있습니다. 하루 한도 관리의 기본입니다.
또한 Reddit에서 확인된 바에 따르면 Gemini CLI가 내부적으로 루프 체크, 모델 라우팅 결정 등 부가적인 Flash 호출을 수행했으며, 이것이 사용자 모르게 전체 API 요청 횟수를 늘리고 있었습니다. 한 오픈소스 포크 프로젝트(llxprt-code)는 이 불필요한 Flash 호출을 제거해 같은 작업량에 API 요청을 절반으로 줄이는 데 성공했다고 밝혔습니다. (출처: Reddit r/GeminiCLI, 2026.03.08)
무료 한도를 가장 오래 유지하는 3가지 방법
무료로 Gemini CLI를 가장 효율적으로 사용하는 방법은 세 가지로 압축됩니다. 공식 문서와 실사용자 경험을 교차 분석한 결과입니다.
01Google 계정으로 로그인하세요 (API 키 금지)
API 키로 연결할 경우 일일 한도가 250회(Flash 전용)로 제한됩니다. 반드시 gemini auth login 명령어로 Google 계정 OAuth를 사용하세요. 이것만 지켜도 무료 한도가 4배 늘어납니다. (출처: Gemini CLI Quota 공식 문서)
02Plan 모드는 큰 작업에만, Flash 모드로 일상 코딩을
Plan 모드가 Pro 모델을 우선 사용하는 만큼, 파일 하나 수정하거나 간단한 함수를 추가하는 일상적인 코딩은 일반 모드(Flash)로 처리하는 것이 현명합니다. Pro 요청은 아키텍처 설계나 복잡한 마이그레이션처럼 추론이 꼭 필요한 경우에만 사용하는 것이 실질적으로 더 많은 고품질 응답을 유지하는 방법입니다.
03GEMINI.md로 컨텍스트를 사전에 주입하세요
프로젝트 루트에 GEMINI.md 파일을 만들어 코드베이스 구조, 주요 패턴, 금지 사항 등을 미리 기술해두면 AI가 탐색에 소비하는 API 요청 횟수가 크게 줄어듭니다. Gemini CLI는 세션 시작 시 이 파일을 자동으로 로드합니다. 같은 정보를 매번 다시 물어보는 반복 요청을 방지할 수 있습니다.
자주 묻는 질문 (Q&A)
Q1. Gemini CLI 무료 한도 1,000회는 매일 자정에 초기화되나요?
/stats model 명령어로 현재 남은 한도를 세션 중에 확인할 수 있습니다. (출처: Gemini CLI 공식 문서)
Q2. Plan 모드를 끄면 무료 한도를 더 오래 쓸 수 있나요?
/settings에서 “Plan”을 검색하여 Plan 모드를 토글 오프하거나, Default Approval Mode를 Auto-Edit으로 설정하세요. Pro 응답 품질이 필요하지 않은 간단한 수정 작업에서는 이 방법이 더 효율적입니다.
Q3. Google AI Pro 구독을 하면 무료 한도 문제가 해결되나요?
Q4. Plan 모드의 Conductor 확장은 무료로 쓸 수 있나요?
Q5. Gemini CLI 무료 vs Claude Code 무료, 어느 쪽이 실질적으로 더 넉넉한가요?
마치며
Gemini CLI의 무료 한도는 분명 업계 최고 수준의 파격적인 조건입니다. 하루 1,000회라는 숫자는 경쟁 서비스와 비교해도 압도적입니다. 그러나 그 숫자가 현실에서 의미하는 것이 무엇인지는 사용 방식에 따라 완전히 달라집니다.
2026년 3월에 정식 출시된 Plan 모드는 분명 매력적인 기능이지만, 바로 이 기능이 Pro 모델 라우팅을 기본 활성화하면서 무료 사용자의 고품질 응답 가용 횟수를 크게 줄입니다. 로그인 방식이 잘못되면 한도가 4분의 1로 줄어들고, Plan 모드를 무분별하게 사용하면 하루 20번의 대화로도 Pro 한도가 소진됩니다.
제가 강조하고 싶은 것은 하나입니다. “공짜니까 마음껏 쓸 수 있다”는 전제 아래 복잡한 개발 작업을 계획하셨다면, 오늘 글에서 확인한 구조를 먼저 이해하고 시작하시기 바랍니다. Google 계정 로그인, Plan 모드 선택적 사용, GEMINI.md 설정이라는 세 가지만 지켜도 체감 사용량이 크게 달라집니다.
📚 본 포스팅 참고 자료
- Google Developers Blog — Plan mode is now available in Gemini CLI (2026.03.11)
- Gemini CLI 공식 문서 — Quotas and Pricing
- Google Developers — Quotas and limits | Gemini Code Assist (2026.02.25)
- Gemini CLI 공식 문서 — Plan Mode (2026.03.11)
- GitHub google-gemini/gemini-cli Issue #6557 — Free tier daily request 관련
- Reddit r/GeminiCLI — Pro 플랜 한도 실사용 경험 (2026.03.08)
- sanj.dev — Claude Code vs Gemini CLI vs OpenCode 비교 (2026.02.25)











댓글 남기기