Gemini CLI Plan 모드, 무료인데 Pro 모델이 돌아가는 이유

Published on

in

Gemini CLI Plan 모드, 무료인데 Pro 모델이 돌아가는 이유

2026.03.11 기준 / Gemini CLI 최신 버전
TECH

Gemini CLI Plan 모드, 무료인데 Pro 모델이 돌아가는 이유

2026년 3월 11일, Gemini CLI에 Plan 모드가 정식 탑재됐습니다. 코드를 건드리기 전에 AI가 먼저 읽기 전용으로 코드베이스를 분석하고, 구조화된 실행 계획을 마크다운 파일로 뽑아주는 기능입니다. 대부분의 블로그는 “기능이 생겼다”는 수준에서 멈추는데, 정작 중요한 건 따로 있습니다. 무료 계정 기준 하루 1,000회 요청 한도가 Plan 모드 안에서 어떻게 소비되는지, 그리고 왜 유료 구독 없이도 Gemini 3.1 Pro가 플래닝에 투입되는지 — 공식 문서를 직접 뜯어봤습니다.

1,000회
무료 계정 일일 요청 한도
(출처: Google 공식 쿼터 문서)
3.1 Pro
Plan 모드 중 자동 라우팅 모델
(출처: Gemini CLI 공식 문서)
읽기 전용
Plan 모드 중 파일 수정 완전 차단
(출처: Gemini CLI 공식 문서)

Plan 모드가 생기기 전에는 뭐가 문제였나

Gemini CLI의 기존 작동 방식은 단순했습니다. 프롬프트를 입력하면 모델이 바로 파일을 읽고, 수정하고, 쉘 명령을 실행했습니다. 빠른 건 맞는데, 그만큼 실수가 잦았습니다. Reddit의 r/GeminiCLI에는 “들여쓰기가 자꾸 깨진다”, “루프에 빠져서 같은 파일을 계속 지웠다 썼다 한다”는 후기가 반복적으로 올라왔습니다 (출처: Reddit r/GeminiCLI, 2026.03.06).

핵심 문제는 순서입니다. 분석과 실행이 동시에 일어나면, 모델이 코드베이스를 충분히 이해하기 전에 수정을 시작합니다. 1만 줄짜리 레거시 프로젝트에서 의존성을 잘못 파악한 채 파일을 덮어쓰기 시작하면, 원복하는 데 오히려 시간이 더 걸립니다.

Plan 모드는 이 순서 문제를 구조적으로 해결하려는 시도입니다. 읽고, 분석하고, 계획을 세우는 단계와 실제로 코드를 건드리는 단계를 물리적으로 분리했습니다.

▲ 목차로 돌아가기

Plan 모드 실제 작동 방식 — 읽기 전용의 범위

Plan 모드에서 허용되는 도구는 공식 문서에 명확하게 나와 있습니다. read_file, list_directory, glob 같은 파일 읽기 툴과, grep_search, google_web_search 등의 검색 툴만 활성화됩니다. 파일 쓰기는 딱 한 곳 — ~/.gemini/tmp/<project>/<session-id>/plans/ 안의 마크다운 파일에만 허용됩니다. 프로젝트 코드 어디에도 손을 대지 않습니다 (출처: geminicli.com/docs/cli/plan-mode).

💡 공식 문서와 실제 폴더 구조를 같이 보면 이런 차이가 보입니다

Plan 모드가 생성하는 파일은 프로젝트 디렉토리 밖 임시 폴더에 저장됩니다. 즉, Plan 모드 중에는 git status로 아무 변경도 잡히지 않습니다. 플랜 파일을 의도적으로 프로젝트 안에 두고 싶다면 settings.json에서 plan.directory를 별도로 지정해야 합니다.

진입 방법은 세 가지입니다. 터미널에서 /plan을 입력하거나, Shift+Tab으로 모드를 순환시키거나, 자연어로 “이 기능을 구현할 계획 먼저 세워줘”라고 말하면 됩니다. 플랜이 완성되면 승인 여부를 묻고, 승인 시 자동으로 일반 구현 모드로 전환됩니다.

ask_user 툴도 새로 추가됐습니다. AI가 스스로 판단하기 애매한 구조적 선택지(예: 기존 Logger 클래스를 재사용할지 새로 만들지)를 만나면 플래닝을 멈추고 직접 물어봅니다. 가정으로 때우는 대신 확인하는 구조입니다 (출처: developers.googleblog.com, 2026.03.11).

▲ 목차로 돌아가기

무료인데 3.1 Pro가 쓰이는 구조

이게 이번에 제일 눈에 띄는 부분입니다. Gemini CLI는 기본적으로 비용·속도 효율이 좋은 Flash 계열 모델을 씁니다. 그런데 Plan 모드에 진입하는 순간, 공식 문서에 딱 이렇게 나옵니다.

“Planning Phase: While in Plan Mode, the CLI routes requests to a high-reasoning Pro model to ensure robust architectural decisions and high-quality plans.”

— Gemini CLI 공식 문서 “Automatic Model Routing” 섹션 (geminicli.com/docs/cli/plan-mode, 2026.03.11)

구글 계정으로 로그인한 무료 사용자도 플래닝 단계에서는 Gemini 3.1 Pro가 투입됩니다. 구현 단계로 넘어가면 다시 Flash로 자동 전환됩니다. 무료로 Pro를 쓰는 게 아니라, 모델 라우팅이 페이즈 단위로 자동 최적화되는 겁니다.

💡 “무료=Flash”라는 공식이 Plan 모드에서는 그대로 적용되지 않습니다

무료 쿼터인 하루 1,000회 요청은 모델 종류와 무관하게 카운트됩니다. Plan 모드 1회 실행이 여러 번의 요청으로 처리될 수 있기 때문에, 복잡한 플랜 한 건이 Flash 코딩 세션 10회보다 쿼터를 더 빠르게 소진할 수 있습니다.

이 설정은 기본값입니다. 끄고 싶다면 settings.json에서 "plan": { "modelRouting": false }로 설정하면 됩니다. 단, 끄면 플래닝 품질이 Flash 수준으로 떨어집니다 (출처: geminicli.com/docs/cli/plan-mode#automatic-model-routing).

▲ 목차로 돌아가기

쿼터 수치로 보는 Plan 모드 비용 현실

공식 문서 기준으로 인증 방식에 따라 쿼터가 다르게 적용됩니다 (출처: geminicli.com/docs/resources/quota-and-pricing, 2026.03 기준).

인증 방식 일일 요청 한도 분당 요청 한도 Plan 모드 모델
구글 계정 로그인 (무료) 1,000회 60회 Gemini 3.1 Pro → Flash (자동)
Gemini API 키 (무료 티어) 250회 10회 Flash 계열 한정
Google AI Pro (월 29,000원) 1,500회 120회 Gemini 3.1 Pro → Flash (자동)
Google AI Ultra (월 360,000원) 2,000회 120회 Gemini 3.1 Pro → Flash (자동)

여기서 한 가지 짚어둬야 할 부분이 있습니다. “한 번의 프롬프트 = 한 번의 요청”이 아닙니다. 공식 문서에 이렇게 나옵니다: “When in agent mode or when using the Gemini CLI, one prompt might result in multiple model requests.” (출처: developers.google.com/gemini-code-assist/resources/quotas). 복잡한 코드베이스를 분석하는 Plan 모드 1회 실행이 내부적으로 수십 번의 모델 요청을 만들 수 있습니다. 무료 사용자 기준 하루 1,000회 한도가 생각보다 빨리 바닥날 수 있다는 뜻입니다.

API 키로 인증한 경우엔 더 심합니다. 하루 250회 한도 안에서 Plan 모드 실행과 이후 구현까지 마치려면, 작은 프로젝트 기준으로도 하루 2~3건이 한계입니다. 큰 레포를 다룰 계획이라면 구글 계정 로그인 방식이 훨씬 유리합니다.

▲ 목차로 돌아가기

Claude Code와 비교했을 때 달라지는 점

Plan 모드가 추가되면서 Gemini CLI와 Claude Code의 접근 방식 차이가 더 선명해졌습니다. Claude Code(Claude Sonnet 4.6 기준)는 처음부터 실행 전에 구조 분석과 계획을 거치는 방식을 기본으로 삼습니다. 반면 Gemini CLI는 기존에 속도를 우선했는데, Plan 모드를 통해 선택적으로 그 방식을 선택할 수 있게 됐습니다 (출처: emergent.sh/learn/gemini-cli-vs-claude-code, 2026.03.05).

💡 Plan 모드 출시 전후로 두 도구의 포지션이 달라졌습니다

Plan 모드 이전에는 “신중함이 필요하면 Claude Code, 속도가 필요하면 Gemini CLI”라는 구분이 비교적 명확했습니다. 지금은 Gemini CLI도 플래닝 단계를 선택할 수 있게 됐고, 무료 한도가 훨씬 관대하다는 점에서 개인 개발자에게는 비용 구조가 유리해졌습니다.

실사용자 관점에서 차이가 남는 부분이 있습니다. Claude Code는 계획 없이 시작해도 복잡한 의존성을 비교적 잘 추적합니다. Gemini CLI는 Plan 모드를 켜야 비슷한 수준이 나오고, Plan 모드를 끄면 들여쓰기 오류나 루프 이슈가 다시 나타납니다 (출처: Reddit r/GeminiCLI, 2026.03.06). 요컨대 Plan 모드는 선택 기능이지만, Gemini CLI에서는 사실상 필수에 가깝게 써야 한다는 게 현재 사용자 피드백의 중론입니다.

Conductor 확장도 이번에 함께 공개됐습니다. Plan 모드와 ask_user를 조합해서 복잡한 마이그레이션이나 멀티 트랙 개발을 오케스트레이션해주는 외부 확장입니다. 구글은 이 Conductor를 향후 Gemini CLI 내장 모드로 통합할 계획이라고 밝혔습니다 (출처: developers.googleblog.com, 2026.03.11).

▲ 목차로 돌아가기

Plan 모드가 오히려 불편한 조건

Plan 모드가 무조건 좋은 건 아닙니다. 구조적으로 빠르게 막히는 시나리오가 있습니다.

첫째, 단발성 수정 작업에는 오버헤드입니다. 함수 이름 하나 바꾸거나 변수 타입 수정 같은 작은 변경에도 Plan 모드를 쓰면 분석-계획-승인 사이클을 거쳐야 합니다. 이 경우엔 그냥 Auto-Edit 모드로 바로 처리하는 게 빠릅니다.

둘째, API 키 인증 사용자는 Plan 모드 중 Pro 모델이 아닙니다. 앞서 표에서도 나왔지만, API 키로 인증하면 Flash 계열 모델만 씁니다. 무료 API 키로 Plan 모드를 써봤는데 결과가 기대 이하라면, 그 이유가 모델 차이에 있을 수 있습니다.

셋째, Git 상태 확인이 기본적으로 막혀 있습니다. Plan 모드는 read-only MCP 툴은 허용하지만, git statusgit diff 같은 쉘 명령은 기본적으로 차단됩니다. 변경 이력을 참조해서 플랜을 짜야 하는 경우엔 별도로 policy 파일을 만들어서 허용해줘야 합니다 (출처: geminicli.com/docs/cli/plan-mode#custom-policies).

⚠️ 주의: 커스텀 플랜 디렉토리를 설정하면 해당 파일들은 자동 삭제 대상에서 빠집니다. 세션 데이터는 30일 후 자동 정리되지만, 직접 지정한 경로의 플랜 파일은 수동으로 관리해야 합니다 (출처: geminicli.com/docs/cli/plan-mode).

넷째, YOLO 모드와 함께 쓸 때 주의가 필요합니다. CI/CD 파이프라인처럼 비대화형 환경에서 Plan 모드를 실행하면, 플랜 승인 후 자동으로 YOLO 모드로 전환됩니다. 사람 확인 없이 전부 실행된다는 뜻입니다. 프로덕션 레포에 직접 붙여서 쓸 때는 이 자동 전환 동작을 미리 인지하고 있어야 합니다.

▲ 목차로 돌아가기

자주 묻는 질문

Plan 모드는 유료 구독이 있어야만 쓸 수 있나요?

아닙니다. 구글 계정으로 로그인한 무료 사용자도 Plan 모드를 쓸 수 있습니다. 무료 쿼터는 하루 1,000회 요청이고, Plan 모드 진입 시 Gemini 3.1 Pro가 자동 라우팅됩니다. 단, API 키로 인증하면 Flash 모델만 쓰이고 한도도 250회로 줄어듭니다 (출처: geminicli.com/docs/resources/quota-and-pricing).
Plan 모드 중에 생성된 마크다운 파일은 어디에 저장되나요?

기본 경로는 ~/.gemini/tmp/<project>/<session-id>/plans/입니다. 프로젝트 디렉토리 밖이기 때문에 git에 잡히지 않습니다. 프로젝트 안에 두고 싶다면 settings.json에서 plan.directory를 따로 지정해야 하고, 그에 맞는 policy 파일도 별도로 만들어야 합니다.
Plan 모드가 기본으로 켜져 있나요, 꺼야 켜지나요?

Plan 모드 자체는 기본으로 활성화돼 있지만, 세션이 처음부터 Plan 모드로 시작되는 건 아닙니다. 기본 시작 모드는 여전히 Default입니다. Plan 모드를 세션 기본값으로 쓰려면 /settings에서 Default Approval Mode를 Plan으로 바꿔야 합니다. 또는 매번 /plan 명령으로 수동 진입합니다.
Conductor 확장은 지금 바로 쓸 수 있나요?

네, GitHub에서 설치할 수 있습니다 (github.com/gemini-cli-extensions/conductor). 구글이 추후 내장 모드로 통합할 계획이라고 밝혔지만, 2026.03 기준으로는 외부 확장으로 설치해야 합니다. Plan 모드와 ask_user를 조합해서 복잡한 멀티 트랙 작업을 오케스트레이션하는 용도입니다.
Plan 모드에서 자동 모델 라우팅을 끄면 어떻게 되나요?

settings.json에서 "plan": { "modelRouting": false }로 설정하면 라우팅이 꺼집니다. 이 경우 세션에서 현재 설정된 모델이 플래닝에도 그대로 쓰입니다. Flash 모델로 고정된 상태라면 플래닝 품질이 낮아질 수 있습니다. 비용 통제가 최우선이 아니라면 기본 설정을 유지하는 편이 낫습니다.

▲ 목차로 돌아가기

마치며

Plan 모드의 핵심은 “코드를 건드리기 전에 생각부터 한다”는 원칙을 Gemini CLI에 구조적으로 집어넣었다는 점입니다. 이건 Claude Code가 처음부터 내세우던 접근 방식과 같습니다. Gemini CLI가 그 방향으로 옮겨왔다는 게 이번 업데이트의 실질적인 의미입니다.

다만 Plan 모드가 만능은 아닙니다. 쿼터 소모 방식, API 키 인증 시 모델 제한, git 명령 기본 차단 같은 조건들은 직접 문서를 확인하고 쓰기 시작해야 당황하지 않습니다. 특히 무료로 쓰는 분들은 하루 1,000회 한도가 Plan 모드 안에서 훨씬 빠르게 소진된다는 점을 미리 알고 있는 게 좋습니다.

개인적으로 이 방향은 맞다고 봅니다. AI가 코드를 먼저 읽고 질문하고 나서 건드리는 흐름은, 실수를 줄이는 가장 직관적인 방법입니다. 남은 건 모델 품질과 쿼터 한계가 실사용에서 얼마나 버텨주느냐입니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. Gemini CLI 공식 블로그 — Plan mode is now available in Gemini CLI
    https://developers.googleblog.com/plan-mode-now-available-in-gemini-cli/
  2. Gemini CLI 공식 문서 — Plan Mode
    https://geminicli.com/docs/cli/plan-mode/
  3. Gemini CLI 공식 문서 — Quotas and Pricing
    https://geminicli.com/docs/resources/quota-and-pricing/
  4. Google Developers — Gemini Code Assist 쿼터 및 한도
    https://developers.google.com/gemini-code-assist/resources/quotas
  5. emergent.sh — Gemini CLI vs Claude Code 비교 (2026.03.05)
    https://emergent.sh/learn/gemini-cli-vs-claude-code

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 쿼터 수치 및 모델 라우팅 동작은 Google의 업데이트에 따라 달라질 수 있으므로, 최신 정보는 공식 문서에서 확인하세요. 기준일: 2026.03.22.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기