Gemini CLI v0.33.0
⚠ 3.25 유료 전환 예정
Gemini CLI Plan 모드, 3가지 조건 공식 문서에서 확인했습니다
Plan 모드가 기본 활성화됐다는 소식은 반가운데, 정작 가장 중요한 내용은 잘 안 알려져 있습니다. 2026년 3월 25일부터 무료 사용자는 Gemini Pro 모델에 접근할 수 없게 됩니다. Plan 모드가 고품질 추론을 위해 Pro 모델을 자동 선택한다는 걸 감안하면, 이 변화는 Plan 모드의 핵심 기능에 직접적인 영향을 줍니다. 공식 문서와 실제 사용자 피드백을 교차해서 짚어봤습니다.
Plan 모드란 무엇인가 — 핵심을 먼저
Gemini CLI Plan 모드는 2026년 3월 11일 v0.33.0에서 정식 출시됐습니다. 한 줄로 요약하면 AI가 파일을 수정하기 전에 먼저 읽고 계획을 짜도록 강제하는 읽기 전용 실행 환경입니다. (출처: Google Developers Blog, 2026.03.11)
기존 AI 코딩 도구가 가진 고질적인 문제가 있습니다. 명령을 내리면 에이전트가 의도를 파악하지도 않은 채 바로 파일을 수정합니다. 결과물이 방향을 완전히 잘못 잡고 나서야 “아, 그런 뜻이 아니었는데”라는 상황이 생기는 거죠. Plan 모드는 이 흐름을 뒤집습니다. 코드에 손대기 전 단계에서 codebase를 읽고, 의존성을 파악하고, 사용자에게 질문까지 합니다.
Plan 모드에서 허용되는 도구는 공식 문서에 명확히 정해져 있습니다. 파일 읽기(read_file, glob, grep_search), 검색, 서브에이전트, MCP 읽기 전용 도구, 그리고 플랜 파일 저장용 write_file만 ~/.gemini/tmp/…/plans/ 경로 안에서만 허용됩니다. (출처: geminicli.com 공식 문서)
💡 공식 발표문과 실제 도구 제한 목록을 같이 놓고 보면, Plan 모드가 “안전한 탐색”을 내세우면서도 ~/.gemini/tmp 안에서는 파일 쓰기를 허용한다는 점이 보입니다. 즉, 로컬 프로젝트 코드는 완벽히 보호되지만 플랜 파일 자체는 AI가 스스로 생성·수정하는 구조입니다.
3월 25일 이후 달라지는 것 — 공짜라고 생각했다면 다시 보세요
많은 개발자들이 Gemini CLI의 가장 큰 장점으로 무료로 Gemini Pro 모델을 쓸 수 있다는 점을 꼽아왔습니다. 하루 1,000요청, 분당 60요청 한도로 Gemini 2.5 Pro급 이상 모델을 무료로 쓸 수 있었으니까요. 실제로 이 무료 한도가 Claude Code 대비 진입 장벽을 낮추는 핵심 차별점이었습니다.
그런데 이게 바뀝니다. 2026년 3월 18일 Gemini CLI 공식 GitHub Discussions에 올라온 서비스 업데이트 공지에 따르면, 3월 25일부터 무료 플랜 사용자는 Gemini Pro 모델에 접근할 수 없습니다. 무료로 사용 가능한 모델은 Gemini Flash 계열로 제한됩니다. (출처: google-gemini/gemini-cli GitHub Discussions #22970, 2026.03.18)
여기서 문제가 생깁니다. Plan 모드는 공식 문서에서 “고추론 Pro 모델인 Gemini 3.1 Pro를 계획 단계에 자동으로 라우팅한다”고 명시합니다. 즉, Plan 모드의 핵심 품질 보증이 Pro 모델에 달려 있습니다. 무료 사용자가 Plan 모드를 켜도 Flash 모델로만 동작하게 된다면, 구글이 마케팅하는 “고품질 아키텍처 계획 수립” 경험은 유료 구독자 전용이 되는 셈입니다.
⚠ 3월 25일부터 달라지는 것
- 무료 플랜: Gemini Flash 모델만 사용 가능
- Pro/Ultra 플랜: Gemini Pro 모델 유지 (유료 전환 필요)
- Plan 모드의 자동 모델 라우팅 기능 → 유료 구독자에게만 완전 작동
- AI Studio 무료 플랜도 4월 1일부터 Pro 모델 제한 예정
Plan 모드 실제 작동 흐름 3단계
Plan 모드 진입 방법은 세 가지입니다. 터미널에서 /plan을 입력하거나, Shift+Tab으로 모드를 순환하거나, 자연어로 “이 기능 계획 짜줘”라고 요청하면 됩니다. 기본값으로 이미 활성화되어 있기 때문에 따로 설치할 필요는 없습니다. (출처: geminicli.com 공식 문서)
목표 제시 → 에이전트가 코드베이스 탐색
원하는 작업을 설명하면 에이전트가 read-only 도구들로 관련 파일과 의존성을 조사합니다. 이 단계에서 코드 변경은 전혀 발생하지 않습니다.
ask_user 도구로 질문 → 방향 확정
ask_user 도구를 통해 에이전트가 아키텍처 선택지나 모호한 요구사항에 대해 직접 질문합니다. 추측으로 진행하지 않는 것이 핵심입니다.
마크다운 플랜 생성 → 승인 후 실행 전환
~/.gemini/tmp/…/plans/에 마크다운 파일로 실행 계획이 저장됩니다. Ctrl+X로 직접 편집도 가능합니다. 승인하면 자동으로 실행 모드로 전환됩니다.
계획 파일은 기본 30일 보관됩니다. 커스텀 디렉토리를 설정하면 프로젝트 루트 아래 원하는 경로에 저장할 수 있지만, 이 경우 자동 삭제가 적용되지 않아 직접 관리해야 합니다.
모델 자동 라우팅 — 계획엔 Pro, 실행엔 Flash
Plan 모드에서 가장 눈에 띄는 기술적 특징은 모델 자동 라우팅입니다. 공식 문서는 이렇게 명시합니다. 계획 단계에서는 Gemini 3.1 Pro 같은 고추론 Pro 모델을 자동 선택하고, 계획 승인 후 실행 단계로 넘어가면 고속 Flash 모델로 전환됩니다. (출처: geminicli.com/docs/cli/plan-mode, 2026.03)
전략 수립에는 무거운 모델을, 전술적 실행에는 빠른 모델을 쓰는 방식입니다. 매 요청에 Pro 모델을 쓰는 것보다 비용과 속도 모두에서 효율적입니다. 단, 이 자동 라우팅 기능을 끄고 싶다면 settings.json에서 "modelRouting": false로 설정하면 됩니다.
💡 공식 발표문의 “모델 라우팅” 설명과 3월 25일 무료 Pro 차단 정책을 같이 보면 이런 그림이 나옵니다. 무료 플랜에서 Plan 모드를 쓸 경우, 계획 단계에 원래 배정되던 Pro 모델 대신 Flash 모델이 돌아갑니다. 구글이 Plan 모드의 가장 강력한 특징으로 내세우는 “정교한 아키텍처 판단”이 실질적으로 유료 기능이 되는 셈입니다.
| 단계 | 사용 모델 | 무료 플랜(3.25~) | 유료 플랜 |
|---|---|---|---|
| 계획(Plan) | Gemini 3.1 Pro | Flash로 제한 | Pro 사용 가능 |
| 실행(Implement) | Gemini Flash | Flash 유지 | Flash 유지 |
출처: geminicli.com 공식 문서 / GitHub Discussions #22970 (2026.03.18)
Claude Code와 비교했을 때 진짜 차이
Reddit에서 올라온 실사용 비교(r/GeminiCLI, 2026.03.06) 내용을 정리하면 꽤 솔직한 그림이 나옵니다. Claude Code는 코딩 작업에서 들여쓰기, 루프 안정성, 복잡한 파일 편집 등 기본기에서 확연히 앞섭니다. 반면 Gemini CLI는 고수준 설계 분석, 학습용 설명, 비코딩 자동화 작업에서 더 강하다는 평가가 많았습니다.
흥미로운 점은 Plan 모드가 바로 이 약점을 메우는 방향으로 설계됐다는 겁니다. Gemini CLI가 직접 코드를 짜는 능력이 Claude Code보다 떨어진다는 것을 인정하고, 그 대신 계획을 잘 짜서 실행 오류를 줄이는 방식을 선택한 구조입니다. 실제로 r/GeminiCLI 에서 한 사용자는 “Claude로 Gemini의 응답을 먹여서 GEMINI.md를 만들고 그걸로 Gemini CLI를 돌리는 방법으로 6시간 만에 도구를 완성했다”고 했습니다. Claude의 추론 능력과 Gemini CLI의 무료 실행 한도를 조합한 방식입니다.
💡 실제 사용자 후기와 Plan 모드 공식 설계 의도를 함께 보면 이런 흐름이 보입니다. Plan 모드는 Gemini CLI의 모델 실행 한계를 인식한 상태에서, 사전 계획의 품질을 높여 실행 단계의 실수를 줄이려는 구조적 대응입니다. 달리 말하면, 도구 자체의 코딩 능력이 아니라 워크플로우 설계로 경쟁하겠다는 방향입니다.
| 항목 | Gemini CLI | Claude Code |
|---|---|---|
| 플랜 모드 | 기본 내장, 기본 활성화 | 별도 지시 필요 |
| 파일 편집 안정성 | 루프·들여쓰기 오류 보고 | 안정적 |
| 컨텍스트 윈도우 | 1M 토큰 | 200K 토큰 |
| 무료 한도(2026.03.25~) | Flash만, 하루 1,000요청 | 제한적 (별도 확인 필요) |
| 오픈소스 여부 | ✅ 오픈소스 | ❌ 클로즈드 |
출처: r/GeminiCLI (2026.03.06), geminicli.com 공식 문서, Google Codelabs
쿼터 소진 문제 — 유료 구독자도 안심할 수 없습니다
유료로 전환하면 문제가 해결될 것처럼 보이지만, 실제로는 다릅니다. 2026년 3월 GitHub Discussions에 올라온 사용자 제보에 따르면, Ultra 플랜 구독자가 주간 쿼터를 2시간 만에 다 써버리는 상황이 보고됐습니다. Antigravity(Gemini의 IDE 에이전트) 구독자 사이에서도 비슷한 불만이 나왔습니다. (출처: GitHub Discussions #22970 댓글, 2026.03.18)
Plan 모드가 Gemini 3.1 Pro를 계획 단계에 집중 투입하는 구조라는 점에서, Pro 모델 요청 횟수가 빠르게 소진될 가능성이 높습니다. 특히 대규모 코드베이스를 대상으로 Plan 모드를 실행하면 codebase_investigator 서브에이전트가 반복 탐색하면서 토큰을 대거 소비합니다. “유료 전환하면 끝”이라고 단순하게 생각하면 막상 써보고 실망할 수 있습니다.
실용적인 접근은 Plan 모드를 쿼터가 여유로운 시간대에 집중적으로 쓰고, 실행 단계는 Flash로 분산시키는 겁니다. 또는 공식 문서에서 제공하는 커스텀 정책 파일로 Plan 모드에서 불필요한 MCP 도구 호출을 제한하면 쿼터 절약에 도움이 됩니다.
자주 묻는 질문
마치며 — 좋은 기능인데, 조건이 있습니다
솔직히 말하면, Plan 모드 자체는 잘 만들어진 기능입니다. “실행보다 계획 먼저”라는 원칙은 AI 코딩 에이전트 시장에서 올바른 방향이고, 모델 자동 라우팅이나 read-only MCP 연동은 다른 도구엔 없는 차별점입니다.
다만 3월 25일 무료 Pro 차단과 쿼터 소진 문제는 “공짜로 Claude Code 급 경험”이라는 기대를 조정해야 한다는 신호입니다. Plan 모드를 제대로 쓰려면 Pro 모델이 필요하고, 그건 유료입니다. 대규모 코드베이스에서 쿼터를 빠르게 소진한다는 실사용 피드백도 있습니다. 기능 자체는 ✅이지만, 기대치 조정은 필요합니다.
현재 시점(2026.03.23)에서 가장 현실적인 활용법은 Claude로 사전 설계를 하고 결과를 GEMINI.md에 정리한 뒤 Gemini CLI Plan 모드를 돌리는 조합입니다. 무료 한도를 쓰면서 Pro 추론은 외부에서 가져오는 방식입니다. 이미 실제로 이 방식으로 쓰는 사람들이 있고, 결과도 나쁘지 않습니다.
본 포스팅 참고 자료
- Google Developers Blog — Plan mode is now available in Gemini CLI (2026.03.11)
- Gemini CLI 공식 문서 — Plan Mode (geminicli.com)
- GitHub Discussions #22970 — Service update: mitigating abuse and prioritizing traffic (2026.03.18)
- DevOps.com — Gemini CLI Plan Mode Separates Thinking From Doing (2026.03.16)
- Google for Developers Korea — 3월 둘째 주 업데이트 (2026.03.13)
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 특히 무료 플랜 쿼터 정책, 모델 라우팅 방식, 요금제 구성은 Google의 공지 없이 변경될 수 있으므로 공식 채널을 주기적으로 확인하는 것을 권장합니다.

댓글 남기기