Gemini CLI Plan 모드: “일단 써보면 된다” 믿으면 무료 한도 소진 폭탄 그대로 맞는 이유

Published on

in

Gemini CLI Plan 모드: “일단 써보면 된다” 믿으면 무료 한도 소진 폭탄 그대로 맞는 이유

2026.03.16 기준
Gemini CLI v0.29.0+

Gemini CLI Plan 모드: “일단 써보면 된다” 믿으면 무료 한도 소진 폭탄 그대로 맞는 이유

2026년 3월 11일 구글이 기본 활성화(enabled by default)로 배포한 Plan 모드 — 무료 사용자가 모르면 손해 보는 3가지 구조적 함정과 실제 활용 전략을 공식 문서 기반으로 파헤칩니다.

1,000회
무료 일일 한도
60회/분
분당 요청 한도
Gemini 3.1 Pro
Plan 단계 자동 모델
Apache 2.0
오픈소스 라이선스

Plan 모드란 무엇인가 — 핵심부터 먼저

Gemini CLI Plan 모드는 2026년 3월 11일 구글이 공식 발표한 기능으로, 코드베이스에 어떤 변경도 가하지 않는 읽기 전용(read-only) 분석 환경입니다. AI가 먼저 충분히 조사하고, 전략을 수립하고, 그 계획을 사람이 검토한 뒤에야 실제 코드 수정을 진행하는 구조입니다. (출처: Google Developers Blog, 2026.03.11)

기존 터미널 AI 도구의 가장 큰 문제는 “일단 수정하고 보는” 방식이었습니다. 복잡한 마이그레이션이나 신규 기능 추가를 명령하면 AI가 의도를 잘못 파악한 채로 파일을 덮어쓰거나 의존성을 망가뜨리는 사고가 빈번했습니다. Plan 모드는 이 고질적인 문제를 해결하기 위해 AI의 행동 범위 자체를 구조적으로 제한합니다.

💡 공식 문서 기반 분석 — Plan 모드에서 허용되는 도구 목록
읽기 전용 파일 접근(read_file, list_directory, glob), 검색(grep_search, google_web_search), 질의(ask_user), 읽기 전용 MCP 도구(예: github_read_issue, postgres_read_schema)만 허용됩니다. 쓰기 도구는 ~/.gemini/tmp/ 내부의 .md 계획 파일에만 예외적으로 허용됩니다. (출처: geminicli.com/docs/cli/plan-mode, 2026.03.16 기준)

진입 방법은 세 가지입니다. 입력창에 /plan을 입력하거나, Shift+Tab으로 승인 모드를 순환하거나, 자연어로 “이 기능을 위한 계획을 세워줘”라고 말하면 됩니다. 기본 승인 모드를 항상 Plan으로 고정하려면 /settings에서 Default Approval ModePlan으로 설정하면 됩니다.

▲ 목차로 돌아가기

무료 사용자가 절대 모르는 한도 소진 구조

많은 사람이 Gemini CLI를 “구글 계정 하나로 무료”라고 알고 있습니다. 실제로 공식 문서에 따르면 개인 구글 계정 OAuth 로그인 기준으로 하루 1,000회, 분당 60회 요청이 제공됩니다. (출처: geminicli.com/docs/resources/quota-and-pricing, 2026.03.16 기준) 이 숫자만 보면 넉넉해 보입니다.

그런데 Plan 모드에서 실제로 일어나는 일을 공식 문서에서 확인해보면 이야기가 달라집니다. Plan 모드가 활성화되면 Gemini CLI는 Gemini 3.1 Pro 수준의 고추론 모델을 자동으로 라우팅합니다. 고추론 모델은 단일 요청에서 내부적으로 여러 번의 추론 단계를 실행하기 때문에 일반 대화형 요청보다 토큰 소모가 몇 배 많습니다. 즉, 외형상 요청 1회처럼 보여도 실제 내부 연산 부하는 3~5배에 달할 수 있습니다.

💡 직접 계산해보는 시나리오
데이터베이스 마이그레이션처럼 복잡한 Plan 1회를 완성하는 과정에서 Gemini CLI는 codebase_investigator 서브에이전트를 포함해 내부적으로 10~20회의 분석 루프를 돌립니다. 공식 문서는 이를 “복잡한 시스템 의존성과 워크플로를 파악하기 위한 전문 서브에이전트 사용”이라고 명시합니다. 이 경우 Plan 1개 작업이 표면상 요청 카운터를 10회 이상 차감할 수 있습니다. 1,000회의 하루 한도는 이러한 고강도 Plan 작업 약 50~100회분에 불과합니다. 가볍게 여기면 오후 중에 한도가 소진됩니다.

인증 방식 일일 한도 분당 한도 사용 모델
구글 계정 OAuth (무료) 1,000회 60회 Gemini 전 모델 자동
Gemini API 키 (무료) 250회 10회 Flash 모델만
Google AI Pro (유료 구독) 1,500회 120회 Gemini 전 모델 자동
Gemini Code Assist 기업용 2,000회 120회 Gemini 전 모델 자동

(출처: geminicli.com/docs/resources/quota-and-pricing, 2026.03.16 기준 / API 키 무료 등급은 Plan 모드에서 Flash 모델 고정으로 Pro 라우팅 혜택 없음)

특히 주목할 함정은 Gemini API 키 무료 등급입니다. 이 방식으로 인증하면 Flash 모델만 사용 가능하고 하루 한도도 250회에 불과합니다. Plan 모드에서 고추론 Pro 모델 자동 라우팅의 혜택을 전혀 누릴 수 없습니다. 이 차이를 모르고 API 키로만 쓰면 Plan 모드를 쓰는 의미 자체가 크게 줄어드는 것입니다.

▲ 목차로 돌아가기

YOLO 모드에서 Plan 모드가 왜 안 되는가

Gemini CLI의 승인 모드는 크게 세 가지입니다. 일반 기본 모드(Default), 모든 편집을 자동 승인하는 Auto-Edit(YOLO) 모드, 그리고 이번에 추가된 Plan 모드입니다. 많은 개발자가 CI/CD 자동화나 빠른 프로토타이핑을 위해 YOLO 모드를 주로 씁니다.

그런데 공식 문서에는 다음과 같이 명시되어 있습니다. “이 도구(enter_plan_mode)는 Gemini CLI가 YOLO 모드에 있을 때는 사용할 수 없습니다.” (출처: geminicli.com/docs/cli/plan-mode, 2026.03.16 기준) YOLO 모드는 사용자 확인을 생략하고 즉시 실행하는 것이 목적이므로, 검토와 승인을 본질로 하는 Plan 모드와 구조적으로 충돌합니다.

⚠️ 실무에서 마주치는 충돌 시나리오
자동화 스크립트나 CI 파이프라인에서 Gemini CLI를 YOLO 모드(--approval-mode=autoEdit)로 실행하고 있다면, /plan 커맨드를 입력하거나 enter_plan_mode 도구를 호출해도 Plan 모드로 전환되지 않습니다. 자동화 환경에서 Plan 모드의 사전 분석을 활용하고 싶다면 별도의 분석 단계를 Plan 모드(--approval-mode=plan)로 먼저 실행하고, 그 출력 계획 파일(.md)을 검토한 뒤 두 번째 단계에서 Auto-Edit로 구현 단계를 진행하는 2단계 파이프라인이 필요합니다.

또 한 가지 놓치기 쉬운 제약이 있습니다. Plan 모드는 Gemini CLI가 요청을 처리 중이거나 확인 다이얼로그를 표시하는 동안에는 Shift+Tab 순환 목록에서 자동으로 제외됩니다. 즉, 한창 분석이 진행되는 도중에는 Plan 모드로의 전환이 불가능합니다. 처음 세션을 시작할 때 승인 모드를 미리 설정해두는 것이 가장 안전한 방법입니다.

▲ 목차로 돌아가기

Pro→Flash 자동 전환, 이게 왜 중요한가

여기가 Plan 모드에서 가장 많이 오해받는 지점입니다. 많은 사람이 “Plan 모드를 쓰면 항상 느린 Pro 모델을 써서 속도가 느리다”고 생각합니다. 하지만 공식 문서는 정반대의 원리를 설명합니다.

💡 공식 문서와 실사용 비교를 교차 분석한 결과입니다

구체적으로 의미하는 바는 이렇습니다. Plan 없이 바로 Auto-Edit 모드로 실행하면 AI가 처음부터 끝까지 같은 모델을 사용합니다. 하지만 Plan 모드를 거치면 분석/설계는 Pro가 정밀하게 수행하고, 반복적인 코드 수정 실행은 Flash가 빠르게 처리합니다. 결과적으로 Plan 모드를 거친 세션이 오히려 총 처리 속도가 빠를 수 있고, 유료 API 키 사용자라면 토큰 비용도 절감됩니다.

다만 이 자동 라우팅이 작동하려면 “auto 모델” 설정을 사용해야 합니다. Gemini API 키 무료 등급처럼 특정 모델이 고정된 경우에는 이 최적화가 동작하지 않습니다. 또한 자동 라우팅을 원하지 않을 경우 settings.json에서 "modelRouting": false로 비활성화할 수 있습니다.

▲ 목차로 돌아가기

Claude Code와 비교했을 때 진짜 차이

AI 코딩 CLI 도구 중에서 Gemini CLI와 가장 많이 비교되는 것은 앤트로픽의 Claude Code입니다. 두 도구 모두 2026년 현재 Plan 모드(또는 계획 기능)를 갖추고 있지만, 접근 방식에서 중요한 차이가 있습니다.

구분 Gemini CLI Claude Code
진입 비용 무료 (구글 계정) Claude Pro/Max 구독 필요
Plan 모드 기본 활성화 ✅ 기본 ON 선택적 활성화
모델 라우팅 최적화 Plan→Pro, 구현→Flash 자동 구독 플랜 내 고정 모델
컨텍스트 창 100만 토큰 100만 토큰 (베타)
오픈소스 여부 Apache 2.0 비공개
자율 추론 깊이 강함 (Gemini 3.1 Pro) 매우 강함 (Opus 4.6)

(출처: sanj.dev, 2026.02.25 비교 리뷰 / geminicli.com/docs, 2026.03.16 기준)

실제 현장 비교 리뷰에 따르면 Claude Code는 다중 파일에 걸친 복잡한 디버깅 추론에서 여전히 한 단계 앞섭니다. (출처: sanj.dev 비교 리뷰, 2026.02.25) 반면 Gemini CLI는 신용카드 없이 30초 안에 시작할 수 있고, 무료 일일 1,000회라는 넉넉한 한도, 구글 검색 그라운딩을 통한 실시간 정보 연동이라는 고유한 강점이 있습니다. 무엇을 쓸지가 아니라 어떤 작업에 쓸지가 핵심입니다.

▲ 목차로 돌아가기

실전 사용법 — Plan 모드를 제대로 써먹는 순서

지금까지 함정을 알았으면, 이제 올바른 사용 순서를 정리할 차례입니다. 다음은 공식 문서 기반의 권장 워크플로입니다.

STEP 1

설치 및 구글 계정 인증 (API 키 아님)
npm install -g @google/gemini-cligemini 실행. OAuth 로그인 선택. API 키 무료 등급으로 인증하면 Plan 모드에서 Pro 라우팅이 작동하지 않으므로 반드시 구글 계정 OAuth를 권장합니다.
STEP 2

복잡한 작업에만 Plan 모드 활용
단순한 파일 수정 한두 개는 일반 모드가 더 경제적입니다. 의존성 분석이 필요한 마이그레이션, 신규 모듈 설계, 보안 취약점 탐색 같은 복잡한 작업에서만 /plan을 입력하거나 자연어로 요청합니다.
STEP 3

ask_user 질문에 구체적으로 답하기
Plan 모드 진행 중 Gemini CLI가 ask_user 도구로 질문을 던집니다. 이 질문에 모호하게 답하면 계획의 품질이 낮아집니다. 아키텍처 선택지, 설정 파일 위치, 우선순위 등을 가능한 구체적으로 응답하는 것이 핵심입니다.
STEP 4

계획 파일을 직접 편집하여 정밀도 높이기
STEP 5

계획 승인 → 자동으로 Flash 모드 전환 확인
계획을 승인하면 Gemini CLI가 자동으로 Flash 모델로 전환하여 구현을 시작합니다. /stats model 명령으로 현재 모델 사용 현황과 잔여 한도를 언제든 확인할 수 있습니다.

한도 관리 팁도 빠뜨릴 수 없습니다. 기본적으로 세션 데이터와 계획 파일은 30일간 보관됩니다. /settings의 Session Retention 항목에서 이 기간을 조정할 수 있습니다. 오래된 세션을 정리하지 않으면 임시 디렉토리가 쌓이므로 주기적인 관리를 권장합니다.

▲ 목차로 돌아가기

자주 묻는 질문 5가지

Q1. Plan 모드를 기본으로 설정해두는 것이 항상 좋은가요? ▼
복잡한 작업 위주로 일한다면 기본 Plan 모드가 효율적입니다. 하지만 간단한 파일 수정이나 빠른 스크립트 작성처럼 분석 단계가 필요 없는 작업이 많다면 Plan 모드가 오히려 불필요한 한도를 소모합니다. 작업 유형에 따라 세션 시작 시 모드를 선택하거나, /settings에서 Default Approval Mode를 일반(Default)으로 유지하고 필요할 때만 /plan으로 전환하는 방식이 더 실용적입니다.
Q2. Plan 모드에서 생성된 계획 파일은 어디에 저장되나요? ▼
기본 저장 경로는 ~/.gemini/tmp/<project>/<session-id>/plans/입니다. 프로젝트 디렉토리 안에서 관리하고 싶다면 settings.json"plan": { "directory": ".gemini/plans" }를 추가하고 해당 경로에 대한 정책 파일을 함께 설정하면 됩니다. 단, 보안 정책상 커스텀 경로는 반드시 프로젝트 루트 내부에 있어야 합니다.
Q3. 무료 API 키로도 Plan 모드를 쓸 수 있나요? ▼
Plan 모드 자체는 사용 가능합니다. 그러나 API 키 무료 등급은 Flash 모델만 허용하므로, Plan 단계에서 Gemini 3.1 Pro 수준의 고추론 모델 자동 라우팅이 작동하지 않습니다. 설계와 분석의 품질이 구글 계정 OAuth 인증 방식보다 낮습니다. Plan 모드의 진가를 최대한 활용하려면 구글 계정 로그인이 필수입니다.
Q4. Conductor 확장이란 무엇이고, 언제 쓰면 되나요? ▼
Conductor는 Plan 모드와 ask_user 도구를 최대한 활용하도록 설계된 공식 확장 도구(GitHub: gemini-cli-extensions/conductor)입니다. 복잡한 마이그레이션이나 대규모 기능 구현처럼 여러 단계의 트랙으로 분리해야 할 때 유용합니다. 각 마일스톤마다 주요 결정사항을 사람에게 확인하면서 진행하므로, 자율성과 제어권 사이의 균형을 잡을 수 있습니다. 구글은 향후 Conductor를 Gemini CLI 기본 내장 모드로 통합할 계획이라고 공식 발표했습니다.
Q5. Plan 모드를 사용하지 않으려면 어떻게 하나요? ▼
/settings 명령 후 “Plan”으로 검색하여 토글을 끄면 됩니다. 이렇게 하면 Shift+Tab 모드 순환에서 Plan 모드가 제외되고, enter_plan_modeexit_plan_mode 도구가 등록 해제됩니다. 이미 익숙한 플래닝 프로세스가 있거나 터미널을 가볍게 유지하고 싶다면 비활성화를 선택할 수 있습니다.

▲ 목차로 돌아가기

마치며 — Plan 모드가 AI 코딩 워크플로에 의미하는 것

Gemini CLI Plan 모드는 단순히 “먼저 계획하고 나중에 실행하는” 기능이 아닙니다. 설계 단계에 고추론 모델을, 구현 단계에 고속 모델을 자동으로 배분하는 이 구조는 AI 에이전트가 비용과 성능을 스스로 최적화하는 방향으로 진화하고 있음을 보여주는 구체적인 사례입니다.

무료 사용자 입장에서 중요한 것은 딱 두 가지입니다. 첫째, 반드시 API 키가 아닌 구글 계정 OAuth로 로그인해서 Pro 라우팅 혜택을 받을 것. 둘째, 단순 작업에 Plan 모드를 남발하지 않아야 하루 1,000회 한도를 정말 중요한 작업에 아낄 수 있다는 점입니다.

Claude Code가 깊은 추론과 완전한 자율성에서 앞선다면, Gemini CLI는 무료 진입 장벽과 구글 생태계 연동에서 독보적입니다. 이 두 도구는 경쟁보다 상호 보완에 가깝습니다. Plan 모드라는 새로운 레이어를 얼마나 잘 활용하느냐가 2026년 개발자 생산성의 핵심 변수가 될 것입니다.

📚 본 포스팅 참고 자료

  1. Google Developers Blog — “Plan mode is now available in Gemini CLI” (2026.03.11) https://developers.googleblog.com/plan-mode-now-available-in-gemini-cli/
  2. Gemini CLI 공식 문서 — Plan Mode (2026.03.16 기준) https://geminicli.com/docs/cli/plan-mode/
  3. Gemini CLI 공식 문서 — Quotas and Pricing (2026.03.16 기준) https://geminicli.com/docs/resources/quota-and-pricing/
  4. ADTmag — “Google Adds ‘Plan Mode’ to Gemini CLI” (2026.03.12) https://adtmag.com/articles/…
  5. sanj.dev — “Claude Code vs Gemini CLI vs OpenCode vs Goose vs Aider in 2026” (2026.02.25) https://sanj.dev/post/comparing-ai-cli-coding-assistants
  6. InfoWorld — “Gemini CLI introduces plan mode” (2026.03.13) https://www.infoworld.com/article/4144594/…

본 포스팅은 2026년 3월 16일 기준 Gemini CLI v0.29.0+ 및 공식 문서를 바탕으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 모든 수치(한도, 가격, 모델명)는 구글의 업데이트에 따라 달라질 수 있으므로 최신 정보는 공식 문서(geminicli.com/docs)를 반드시 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기