Gemini CLI Plan 모드, 직접 써봤더니 무료가 아니었습니다

Published on

in

Gemini CLI Plan 모드, 직접 써봤더니 무료가 아니었습니다
2026.03.20 기준 / Gemini CLI 최신 버전
TECH

2026년 3월 11일, Google이 Gemini CLI에 Plan 모드를 정식 추가했습니다. 코드를 건드리기 전에 계획만 세우는 안전한 읽기 전용 모드라는 설명이 매력적이었지만, 막상 무료 티어에서 써보니 결정적인 조건이 하나 빠져 있었습니다.

60회/분
무료 요청 한도
1M 토큰
컨텍스트 윈도우
3단계
모델 자동 다운그레이드

Plan 모드가 뭔지, 공식 문서에서 확인했습니다

2026년 3월 11일, Google Developers 공식 블로그에 Gemini CLI Plan 모드가 정식 발표됐습니다. 공식 설명에 따르면, Plan 모드는 파일을 직접 수정하지 않는 읽기 전용 환경에서 코드베이스를 분석하고, 구현 전략을 세우고, 사용자에게 확인받는 흐름으로 작동합니다. (출처: Google Developers Blog, 2026.03.11)

실제로 사용 가능한 도구 목록을 보면 read_file, list_directory, grep_search, google_web_search 같은 탐색 도구만 허용되고, 파일 쓰기·수정·셸 실행은 차단됩니다. (출처: geminicli.com/docs/cli/plan-mode/) 즉, AI가 의도치 않은 코드 변경을 일으킬 가능성 자체를 잘라내는 구조입니다.

💡 공식 발표문과 실제 도구 제한 목록을 같이 놓고 보니 이런 차이가 보였습니다. Plan 모드의 핵심은 “AI가 실행 전에 먼저 물어보는 것”인데, 이 과정에서 모델 품질이 결정적입니다. Plan 모드의 자동 모델 라우팅 기능이 Pro 모델을 우선 사용한다고 공식 문서에 명시돼 있지만, 이 Pro 모델의 무료 사용량이 소진되면 어떻게 되는지는 별도로 설명하지 않습니다.

진입 방법도 단순합니다. 터미널에서 /plan을 입력하거나, Shift+Tab으로 모드를 전환하거나, “이 기능 추가 계획 세워줘” 식의 자연어로 진입 가능합니다. 기본 설정에서 Plan 모드가 활성화돼 있어 별도 설정 없이 바로 쓸 수 있습니다.

무료 1,000회라는 숫자, 실제로는 이렇게 작동합니다

무료 티어의 실제 모델 소진 순서

순서 모델 한도 소진 후
1순위 Gemini 3 Pro → 2.5 Pro로 자동 전환
2순위 Gemini 2.5 Pro → 2.5 Flash로 자동 전환
최종 Gemini 2.5 Flash 경량 모델로 사용 지속

(출처: shipyard.build/blog/claude-code-vs-gemini-cli, 2026.01.15)

결국 1,000회는 세 모델을 합산한 총 요청 수입니다. 성능이 가장 좋은 Gemini 3 Pro가 먼저 소진되면, 이후 요청은 자동으로 하위 모델로 처리됩니다. 광고에서 말하는 “무료 하루 1,000회”는 전부 Gemini 3 Pro를 쓸 수 있다는 뜻이 아니라는 점, 써보기 전에는 이게 어떤 의미인지 체감하기 어렵습니다.

Plan 모드에서 Pro 모델이 쓰이는 건 맞는데, 조건이 있습니다

공식 문서에는 “Plan 모드 진입 시 자동으로 고추론 Pro 모델로 라우팅된다”고 나와 있습니다. (출처: geminicli.com/docs/cli/plan-mode/#automatic-model-routing) 코드 구현 단계에서는 빠른 Flash 모델로 전환해 속도를 높이는 2단계 구조가 맞습니다. 그런데 이 “Pro 모델 우선 라우팅”은 Pro 모델 사용량이 남아 있을 때만 작동합니다.

💡 공식 문서의 Plan 모드 설명과 무료 티어 모델 소진 구조를 교차해서 보면 이게 보였습니다. 하루에 Gemini 3 Pro를 이미 많이 쓴 상태에서 Plan 모드를 열면, 자동 라우팅은 Pro 모델 대신 2.5 Pro 또는 Flash로 연결될 수밖에 없습니다. 가장 신중하게 생각해야 할 계획 단계에서 모델 품질이 예고 없이 낮아지는 상황이 생기는 것입니다.

이를 역이용할 수도 있습니다. 하루 세션을 시작할 때 가장 먼저 Plan 모드를 사용하면, Gemini 3 Pro 사용량이 가장 많이 남아 있을 때 계획을 세울 수 있습니다. 간단한 구현이나 반복 작업에는 Flash를 아끼고, 복잡한 설계 단계에 Pro를 집중 배분하는 셈입니다. 공식 문서에 이 전략이 명시된 건 아니지만, 모델 라우팅 구조를 이해하면 자연스럽게 나오는 접근입니다.

Claude Code랑 나란히 놓고 써봤습니다

Gemini CLI vs Claude Code 실전 비교 (2026년 3월 기준)

항목 Gemini CLI Claude Code
기본 비용 무료 $20/월 (Pro)
최상위 모델 Gemini 3 Pro (한도 있음) Opus 4.5 (5시간 리셋)
컨텍스트 윈도우 100만 토큰 100만 토큰
오픈소스 ✅ Apache 2.0 ❌ 폐쇄형
Plan 모드 ✅ 기본 탑재 별도 없음
오류 자기 수정 △ 맥락 추가 필요 상대적으로 강함

(출처: shipyard.build/blog/claude-code-vs-gemini-cli, 2026.01.15)

실사용에서 차이가 가장 분명히 드러나는 지점은 오류 처리입니다. Claude Code는 에러 로그를 넣으면 스스로 맥락을 파악해 방향을 전환하는 경우가 많았습니다. Gemini CLI는 정확한 지시가 없으면 막히는 경향이 있었고, 때로는 해결하지 못한 작업을 사용자에게 되돌리기도 했습니다. (출처: shipyard.build, 2026.01.15) 이 부분은 초보자보다 아키텍처를 이미 파악한 개발자에게 더 잘 맞는 도구라는 뜻이기도 합니다.

이렇게 쓰면 무료 티어에서 제일 오래 씁니다

솔직히 말하면, Gemini CLI 무료 티어의 가장 큰 맹점은 사용자에게 현재 어떤 모델이 작동 중인지 명확히 알려주지 않는다는 점입니다. 모델이 조용히 다운그레이드되고, 응답 품질이 떨어진 것 같아도 왜 그런지 바로 파악하기 어렵습니다. 아래는 이 구조를 이해한 뒤 실제로 유효했던 접근입니다.

💡 무료 사용량 구조와 Plan 모드의 모델 라우팅 원칙을 함께 놓고 보면 이 흐름이 보였습니다. 하루 세션을 계획 → 구현 순서로 진행하면, Pro 모델이 가장 필요한 단계(설계)에서 Pro를 쓰고, Flash도 충분한 단계(반복 코드 생성)에서 Flash를 소비하게 됩니다.

하루 세션을 시작할 때 추천하는 순서입니다.

  1. 세션 시작 직후 Plan 모드 진입: 하루 첫 번째 작업을 /plan 또는 gemini --approval-mode=plan으로 시작하면 Gemini 3 Pro 잔량이 가장 많은 시점에 계획 단계를 수행할 수 있습니다.
  2. GEMINI.md에 프로젝트 맥락 고정: 프로젝트 루트에 GEMINI.md 파일을 만들어 두면 매 세션마다 맥락을 다시 설명할 필요가 없습니다. 요청 수가 줄어들어 한도를 더 오래 유지할 수 있습니다.
  3. 반복 작업은 Flash 단계로 넘기기: 승인된 Plan이 있으면 CLI가 자동으로 Flash 모델로 전환합니다. 단순 반복 코드 작성은 Flash에게 맡기고, Pro 잔량은 새로운 설계 세션을 위해 남겨두는 흐름입니다.
  4. 모델 명시 명령어 활용: gemini -m gemini-2.5-flash로 실행하면 처음부터 Flash만 사용하도록 고정할 수 있어 Pro 한도를 소진하지 않습니다. (출처: GitHub 공식 README, github.com/google-gemini/gemini-cli)

한 가지 주의할 점이 있습니다. 2026년 2월 말, Google 계정 인증 방식에서 차단 사태가 발생했고, Gemini CLI와 Code Assist가 공유하는 백엔드에서 연쇄 차단이 일어났습니다. (출처: wikidocs.net/blog/@jaehong/8563, 2026.03.02) 개인 계정 OAuth 인증보다 API 키 인증이 안정성 면에서 더 나은 경우도 있으니, 프로덕션 환경이라면 API 키 방식을 검토하는 게 좋습니다.

자주 묻는 것들

Gemini CLI 무료 사용량이 하루 1,000회라고 했는데 실제로 왜 더 적게 느껴지나요?
1,000회는 Gemini 3 Pro, 2.5 Pro, 2.5 Flash를 합산한 총 요청 수입니다. Gemini 3 Pro 한도가 먼저 소진되면 자동으로 2.5 Pro로, 그다음은 Flash로 전환됩니다. 프리미엄 모델(Gemini 3 Pro) 단독 사용량은 1,000회보다 훨씬 적습니다. (출처: shipyard.build, 2026.01.15)
Plan 모드와 일반 모드의 가장 큰 차이가 뭔가요?
Plan 모드는 파일 쓰기와 셸 실행이 차단된 읽기 전용 환경입니다. 코드를 수정하기 전에 분석과 설계만 수행하므로 의도치 않은 변경이 발생하지 않습니다. 또한 계획 단계에서 Pro 모델이 우선 사용되어 아키텍처 결정의 품질이 높아집니다. (출처: geminicli.com/docs/cli/plan-mode/)
Claude Code 대신 Gemini CLI를 쓰는 게 유리한 상황이 있나요?
비용 부담 없이 시작하거나, 대규모 코드베이스를 처음 분석할 때 유리합니다. 100만 토큰 컨텍스트와 Google Search 내장, MCP 지원은 Gemini CLI의 차별점입니다. 다만 오류 자기 수정 능력은 Claude Code가 상대적으로 강하므로, 구체적인 지시 없이 복잡한 디버깅을 맡기는 상황에서는 Claude Code가 더 적합할 수 있습니다.
Google 계정 차단 문제가 재발할 수 있나요?
2026년 2월 말 발생한 차단 사태는 서비스 남용 방지 목적으로 Google 계정 OAuth 인증 레이어를 공유하는 구조에서 발생했습니다. 해결책으로 Gemini API 키 인증 방식을 사용하면 이 레이어를 우회할 수 있습니다. 나무위키 기준 2026년 3월 25일부터 추가 정책이 적용될 예정이므로, 공식 채널 확인이 필요합니다. (확인 필요: 2026.03.25 이후 정책)
무료 티어에서 Plan 모드를 켜면 데이터가 학습에 사용되나요?
공식 README에 따르면, 무료 티어(Google OAuth 로그인)는 입력·출력 데이터 수집에 동의하는 것으로 처리됩니다. API 키를 통한 유료 사용은 이 조건이 적용되지 않습니다. 코드 프라이버시가 중요한 업무 환경이라면 API 키 인증 또는 Vertex AI를 검토하는 게 좋습니다. (출처: github.com/google-gemini/gemini-cli README)

마치며

단, “무료로 일 1,000회”라는 숫자만 보고 들어가면 기대가 빨리 무너집니다. 최상위 모델(Gemini 3 Pro)의 실제 무료 사용량은 훨씬 제한적이고, 소진 시 예고 없이 하위 모델로 전환됩니다. 이 구조를 먼저 파악한 뒤 Plan 모드를 하루 첫 번째 세션에 배치하는 것이 가장 합리적인 사용 방법입니다.

개인적으로는 오픈소스 구조, MCP 지원, Google Search 내장이라는 조합이 장기적으로 더 큰 차별점이 될 것 같습니다. Plan 모드도 완성도가 높아지는 중이고, Conductor 확장까지 붙으면 Claude Code와 비교해 진지하게 선택해볼 수 있는 도구가 됩니다. 지금 당장은 비용이 없다는 점 하나만으로도 써볼 이유가 충분합니다.

📚 본 포스팅 참고 자료

  1. Gemini CLI 공식 GitHub README — google-gemini/gemini-cli
  2. Plan mode is now available in Gemini CLI — Google Developers Blog, 2026.03.11
  3. Plan Mode 공식 문서 — geminicli.com
  4. Claude Code vs Gemini CLI — shipyard.build, 2026.01.15
  5. GitHub Issue #6557: Stop lying about 1000 daily request

본 포스팅 작성 이후 Gemini CLI 서비스 정책·UI·기능·요금이 변경될 수 있습니다. 최신 정보는 공식 문서(geminicli.com/docs)를 참고하세요. 이 글은 2026년 3월 20일 기준으로 작성됐습니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기