2026.03.11 출시
IT/AI
Gemini CLI Plan 모드, 직접 확인한 5가지 진실
결론부터 말씀드리면, 무료 사용자가 Plan 모드를 켰을 때 Pro 모델이 자동으로 붙는다는 건 조건이 있습니다. 인증 방식에 따라 Flash만 쓰이는 경우가 있고, MCP 도구 허용 범위도 생각보다 좁습니다. 공식 문서와 할당량 표를 직접 교차 확인했습니다.
Plan 모드가 뭔지, 한 줄로 정리하면
Gemini CLI v0.33.0부터 기본 활성화된 Plan 모드는 코드를 건드리기 전에 읽기 전용 상태로 코드베이스를 탐색하고, 마크다운 파일로 구현 계획을 뽑아주는 기능입니다. 2026년 3월 11일 구글 개발자 블로그에 공식 발표됐습니다. (출처: Google Developers Blog, 2026.03.11)
이전까지 Gemini CLI는 “하겠습니다” 하면 바로 파일을 수정했습니다. Plan 모드는 그 흐름을 뒤집어서, 먼저 탐색하고 → 질문하고 → 계획서를 작성한 뒤 → 사용자가 승인하면 그때 실행하는 구조입니다. 리스크가 큰 DB 마이그레이션, 대형 리팩토링에서 “일단 해버리는” AI의 가장 흔한 실수를 막는 구조적 장치입니다.
진입 방법은 세 가지입니다. 터미널에서 /plan을 입력하거나, Shift+Tab으로 승인 모드를 순환하거나, “이 DB 마이그레이션 계획 짜줘”처럼 자연어로 요청하면 됩니다.
Pro 모델 자동 전환, 무조건 되는 게 아닙니다
💡 공식 발표문과 실제 할당량 표를 같이 놓고 보니 이런 차이가 보였습니다.
구글 공식 블로그는 “Plan 모드에서 Gemini 3.1 Pro처럼 고추론 Pro 모델이 자동 라우팅된다”고 밝히고 있습니다. 그런데 이 자동 라우팅은 ‘auto 모델’ 설정을 쓸 때만 작동합니다. 그리고 더 중요한 사실이 있습니다.
Gemini API Key로 무료 등급을 쓰는 경우, 공식 할당량 문서에 Flash 모델만 허용된다고 나와 있습니다. (출처: geminicli.com/docs/resources/quota-and-pricing/) 즉, API Key 무료 등급에서 Plan 모드를 켜도 Pro 모델이 붙지 않습니다. Flash만 씁니다.
반면 Google 계정으로 로그인해서 Gemini Code Assist(개인) 무료 등급을 쓰면, 일일 1,000 요청 내에서 Gemini CLI가 자체적으로 모델을 결정해 Pro를 포함한 Gemini 모델 패밀리를 씁니다. Plan 모드의 Pro 자동 라우팅 혜택을 무료로 받으려면 반드시 Google 계정 로그인 방식을 써야 합니다.
| 인증 방식 | 무료 일일 한도 | Plan 모드 Pro 라우팅 |
|---|---|---|
| Google 계정 (Gemini Code Assist) | 1,000 요청 | ✅ 가능 |
| Gemini API Key (무료) | 250 요청 | ❌ Flash만 |
| Google AI Pro (월 29,000원) | 1,500 요청 | ✅ 가능 |
| Google AI Ultra (월 180,000원) | 2,000 요청 | ✅ 가능 |
출처: geminicli.com/docs/resources/quota-and-pricing/ (2026.03 기준)
Google AI Plus(월 11,000원) 요금제는 공식 문서에 지원 플랜 목록에 없습니다. Gemini CLI 할당량 문서에 “Google AI Plus는 지원되지 않습니다”라고 직접 명시돼 있습니다. 11,000원 내고 Gemini CLI 할당량을 높이려 했다면 효과가 없습니다.
무료로 쓸 수 있는 한도, 실제 숫자로 따져봤습니다
Google 계정 무료 등급에서 하루 1,000 요청이 가능하다는 건 맞습니다. 그런데 Plan 모드에서 복잡한 코드베이스를 분석할 때는 단일 요청이 아니라 여러 sub-agent 호출이 연쇄적으로 발생합니다. 공식 GitHub 논의에서 “실제로 5~7개 Pro 요청이면 한도에 걸린다”는 보고가 있습니다. (출처: Hacker News 스레드, 2025.07)
왜 이런 일이 생기냐면, Gemini CLI는 Plan 모드에서 codebase_investigator 같은 Research Sub-agent를 자동으로 띄웁니다. Sub-agent는 별도 모델 요청을 소비합니다. 규모 있는 리팩토링 계획 하나를 짜는 데 내부적으로 10~20회 모델 호출이 일어날 수 있습니다. 1,000 요청이라는 숫자가 크게 느껴지지만, 하루에 복잡한 Plan 세션을 여러 번 돌리면 빠르게 소진됩니다.
현재 세션 사용량은 터미널에서 /stats model 명령어로 실시간 확인이 가능합니다. 세션 종료 시에도 모델 사용 요약이 자동으로 출력됩니다. (출처: geminicli.com/docs/resources/quota-and-pricing/)
MCP 도구 허용 범위, 생각보다 좁습니다
💡 “Plan 모드에서 MCP 도구가 된다”고 했는데, 직접 공식 문서의 허용 도구 목록을 확인하니 조건이 붙어 있었습니다.
공식 발표문은 “Plan 모드가 read-only MCP 도구를 지원한다”고 명시합니다. 그런데 공식 도구 제한 목록을 보면, MCP 도구 중 readOnlyHint 어노테이션이 붙은 것만 허용됩니다. 이 어노테이션이 없는 MCP 도구는 읽기 전용처럼 보여도 Plan 모드에서 차단됩니다. Reddit에서도 “MCPs are not considered read only unfortunately”라는 실사용 피드백이 그대로 올라와 있습니다.
예를 들어 PostgreSQL 스키마를 Plan 모드에서 읽고 싶다면, 해당 MCP 서버의 도구에 readOnlyHint = true 어노테이션이 명시돼 있어야 합니다. 없으면 Plan 모드에서 쓸 수 없습니다. 직접 연결하는 사내 MCP 서버가 이 어노테이션을 지원하지 않으면, 외부 데이터를 Plan 단계에서 끌어오는 기능이 사실상 막힙니다.
우회 방법은 있습니다. ~/.gemini/policies/ 디렉토리에 TOML 정책 파일을 만들어 특정 MCP 도구를 Plan 모드에서 명시적으로 허용할 수 있습니다. 공식 문서가 예시 정책 파일을 직접 제공하고 있습니다. (출처: geminicli.com/docs/cli/plan-mode/#custom-policies)
ask_user 툴이 실제로 바꾸는 것
Plan 모드에서 새로 도입된 ask_user 툴은 AI가 추측 없이 멈추고 직접 물어보게 만드는 장치입니다. 기존 AI 코딩 도구의 가장 흔한 실패 패턴 — “확신을 가지고 틀린 방향으로 코드를 작성” — 을 구조적으로 막습니다.
예를 들어 “인증 기능을 추가해”라고 하면, 이전 방식에서는 AI가 JWT를 선택해 바로 구현했을 수 있습니다. ask_user가 있으면 “세션 기반과 JWT 중 어느 쪽을 원하시나요? 현재 인프라에 Redis가 있나요?”처럼 아키텍처 선택을 사용자에게 돌려줍니다. 계획이 확정된 뒤에야 구현을 시작합니다.
실사용자 피드백 중에는 “Plan 모드 자체는 좋은데, Gemini가 작은 프로젝트에서도 계속 중간에 끊어서 물어보는 게 오히려 흐름을 끊는다”는 의견도 있습니다. (출처: Reddit r/GeminiCLI, 2026.03) 복잡하고 위험한 작업에서는 장점이지만, 단순한 변경에서는 오히려 번거로울 수 있습니다. /settings에서 Plan 모드를 기본 모드로 고정하거나 끌 수 있습니다.
Claude Code Plan 모드와 실제로 다른 점
💡 두 도구의 Plan 모드를 비교하면서, 차이가 단순한 기능 유무가 아니라 MCP 허용 범위라는 점이 눈에 들어왔습니다.
Reddit r/GeminiCLI의 실사용자 비교에서 “Claude Code의 /plan이 더 완성도 높다”는 평가가 있습니다. 핵심 이유로 꼽힌 건 MCP 도구 허용 범위입니다. Claude Code Plan 모드에서는 read-only MCP 도구를 더 유연하게 쓸 수 있는 반면, Gemini CLI는 readOnlyHint 어노테이션 제약이 있습니다. (출처: Reddit r/GeminiCLI, 2026.03.11)
반면 Gemini CLI Plan 모드가 앞서는 부분도 있습니다. 모델 자동 라우팅이 내장돼 있어, Plan 단계에서는 고추론 Pro 모델을 쓰고 구현 단계로 넘어가면 자동으로 빠른 Flash 모델로 전환합니다. Claude Code는 이 라우팅을 사용자가 수동으로 지정하거나 별도 설정이 필요합니다. 계획에는 깊은 추론, 실행에는 속도를 자동으로 분리한다는 점에서 구조적으로 합리적입니다.
기업 현장에서 보면, The Futurum Group의 Mitch Ashley는 “Plan 모드처럼 변경 전 인간 확인을 강제하는 구조가 기업 구매 결정에서 기준이 되어가고 있다”고 밝혔습니다. (출처: DevOps.com, 2026.03.12) 자율 실행보다 검토 흐름을 기본값으로 두는 방향은 이미 업계 방향성이 됐습니다.
Q&A
마치며
Gemini CLI Plan 모드는 “AI가 먼저 물어보고 나중에 코드를 짠다”는 방향 자체는 맞습니다. 특히 Google 계정 무료 등급으로도 하루 1,000 요청 내에서 Pro 모델 라우팅까지 쓸 수 있다는 건 솔직히 놀라운 수준입니다.
다만 API Key 무료 등급이라면 Flash만 쓰인다는 점, MCP 도구 허용 범위가 readOnlyHint 어노테이션에 달려 있다는 점은 써보기 전에 알고 있어야 합니다. 이 두 가지를 모르면 “Plan 모드 켰는데 왜 Pro 모델 안 씌나?”, “MCP 연결했는데 왜 데이터를 못 읽나?” 하는 상황에 바로 부딪힙니다.
아직 Claude Code나 Codex CLI 대비 MCP 유연성은 아쉽습니다. 그래도 모델 자동 라우팅은 구조적으로 깔끔하고, Conductor 확장이 내장 모드로 올라오는 게 예정돼 있습니다. 지금 당장 DB 마이그레이션이나 대형 리팩토링을 계획 중이라면, Plan 모드를 한 번 돌려볼 가치는 충분합니다.
📎 본 포스팅 참고 자료
- Google Developers Blog — Plan mode is now available in Gemini CLI (2026.03.11)
https://developers.googleblog.com/plan-mode-now-available-in-gemini-cli/ - Gemini CLI 공식 문서 — Plan Mode
https://geminicli.com/docs/cli/plan-mode/ - Gemini CLI 공식 문서 — Quotas and pricing
https://geminicli.com/docs/resources/quota-and-pricing/ - GitHub — Gemini CLI v0.33.0 릴리스 노트 (Discussions #22078)
https://github.com/google-gemini/gemini-cli/discussions/22078 - DevOps.com — Gemini CLI Plan Mode Separates Thinking From Doing (2026.03.12)
https://devops.com/gemini-cli-plan-mode-separates-thinking-from-doing-and-makes-read-only-the-default/
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 모든 수치와 기능은 2026년 3월 31일 기준 공식 문서를 바탕으로 작성됐으며, Google이 공식 답변을 내놓지 않은 부분은 별도로 표기했습니다. Gemini CLI는 업데이트 주기가 빠른 오픈소스 프로젝트이므로 중요한 결정 전에 공식 문서를 직접 확인하는 것을 권장합니다.











댓글 남기기