Gemini CLI Plan 모드, 무료라도 한도가 다릅니다
Plan 모드를 켜는 순간 모델이 자동으로 바뀝니다.
무료 1,000회 한도 안에서 Pro가 소진되는 속도가 달라집니다.
자동 모델 라우팅
YOLO 모드 제한
Conductor 확장
Plan 모드가 뭔지, 결론부터
Gemini CLI Plan 모드는 2026년 3월 11일 구글이 공식 릴리스한 기능입니다. 한마디로 “코드에 손 대기 전에 먼저 읽고 생각만 하는 모드”입니다. (출처: Google Developers Blog, 2026.03.11)
이전까지 Gemini CLI의 가장 큰 약점으로 꼽혔던 게 바로 계획 없이 바로 파일을 수정한다는 점이었습니다. 2025년 11월 한 개발자 블로그에서 “Gemini CLI에는 Plan 모드가 없다. Claude Code는 Shift+Tab 두 번이면 계획을 먼저 세우는데”라고 지적했을 만큼 (출처: Kevin Simper Blog, 2025.11.27), 이 기능의 부재가 Claude Code와의 비교에서 자주 도마에 올랐습니다.
Plan 모드가 활성화되면 에이전트는 파일을 읽기만 하고, 쓰기·수정·실행은 전혀 못 합니다. 대신 계획서를 Markdown 파일로 생성해 승인 후에야 실행 단계로 넘어갑니다. 실수로 파일이 날아가는 상황을 원천 차단합니다.
💡 공식 발표문에서 놓치기 쉬운 부분이 있습니다. Plan 모드가 기본값(enabled by default)으로 켜져 있다고 명시되어 있는데, 이게 “자동으로 Plan 모드로 시작된다”는 뜻은 아닙니다. 기능 자체가 활성화 상태이고 Shift+Tab 순환에 포함된다는 의미입니다.
무료 1,000회, 실제로는 이렇게 쪼개집니다
| 인증 방식 | 일 최대 요청 | Pro 실질 한도 | 비고 |
|---|---|---|---|
| Google 계정 (무료) | 1,000회 | 약 200회 | 나머지 800회는 Flash |
| Google AI Pro | 1,500회 | 별도 표기 없음 | 전체 모델 풀 공유 |
| Google AI Ultra | 2,000회 | 별도 표기 없음 | 전체 모델 풀 공유 |
| API 키 (무료) | 250회 | Flash 전용 | Pro 사용 불가 |
(출처: Gemini CLI 공식 할당량 문서)
문제는 Plan 모드의 자동 모델 라우팅에 있습니다. 공식 문서에 딱 이렇게 나옵니다. “Plan 모드에서는 Gemini 3.1 Pro 같은 고추론 Pro 모델로 요청을 라우팅한다.” (출처: Gemini CLI Plan Mode 문서) 계획 단계에서 Pro가 소모되고, 승인 후 구현 단계에서 Flash로 자동 전환됩니다.
⚠️ 실사용 주의: Google 계정 무료 티어에서 Gemini 3.1 Pro 한도는 하루 약 200회입니다. (출처: Reddit r/GeminiCLI, 2026.03.08) Plan 모드를 반복적으로 사용하면 하루 이른 오전에 Pro 한도가 소진되고, 이후 계획 단계도 Flash로 처리됩니다. 계획의 품질이 달라질 수 있습니다.
실질적으로 Plan 모드 1회 실행이 단일 프롬프트 1회와 같지 않습니다. 코드베이스를 탐색하는 동안 read_file, grep_search 같은 도구 호출이 여러 번 발생합니다. 실제 복잡한 작업 하나에 5~15회의 API 호출이 소모됩니다. (출처: termdock.com, 2026.03.16)
켜는 방법 3가지 — 의외로 간단합니다
공식 문서에 진입 방법이 3가지 나옵니다. 상황에 따라 골라 쓰면 됩니다.
① 키보드 단축키 — 가장 빠름
Shift+Tab을 누르면 Default → Auto-Edit → Plan 순서로 모드가 순환됩니다. 에이전트가 작업 중이거나 확인 창이 열려 있으면 Plan은 순환에서 빠집니다.
② 명령어 — 목표와 함께 바로 진입
인터랙티브 창에서 /plan [목표]를 입력합니다.
/plan implement authentication with JWT
목표를 함께 입력하면 Plan 모드 전환과 동시에 프롬프트가 제출됩니다.
③ 실행 플래그 — 기본값으로 고정
항상 Plan 모드로 시작하고 싶다면 실행 옵션을 씁니다.
gemini --approval-mode=plan
또는 /settings에서 “Default Approval Mode”를 Plan으로 고정할 수 있습니다.
Plan 모드를 아예 쓰지 않으려면 /settings에서 “Plan”을 검색해 토글을 끄면 됩니다. 그러면 Shift+Tab 순환에서 제거되고, enter_plan_mode 도구 자체가 해제됩니다. (출처: Google Developers Blog, 2026.03.11)
Plan 모드 안에서 할 수 있는 것과 없는 것
공식 문서의 도구 제한 목록을 직접 확인했습니다. 생각보다 구체적입니다.
✅ 가능한 작업
- 파일 읽기 (
read_file) - 디렉터리 탐색 (
list_directory) - 패턴 검색 (
grep_search) - Google 웹 검색 (
google_web_search) - 읽기 전용 MCP 도구
- 질문 요청 (
ask_user) - 계획서(.md) 파일 작성
❌ 불가능한 작업
- 소스 파일 수정
- 셸 명령 실행
- 쓰기 MCP 도구
- YOLO 모드 진입
- 계획서 외 파일 생성
주목할 점이 하나 있습니다. Plan 모드에서 YOLO 모드 진입이 불가합니다. 공식 문서에서 “enter_plan_mode 도구는 YOLO 모드일 때 사용 불가”라고 명시되어 있습니다. (출처: Gemini CLI Plan Mode 공식 문서) 반대로 YOLO 모드 상태에서는 Plan 모드로 전환 자체가 막힙니다. 두 모드는 함께 쓸 수 없습니다.
단, 한 가지 예외가 있습니다. CI/CD 같은 비대화형 환경에서 Plan 모드로 실행하면, 계획 승인 후 구현 단계에 자동으로 YOLO 모드로 전환됩니다. 파이프라인에서는 사람이 직접 승인할 수 없으니 정책 엔진이 자동으로 처리하는 방식입니다.
공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다
💡 구글 공식 블로그가 강조하는 “무료 Plan 모드”와 실제 사용자들이 겪는 흐름 사이에 간극이 있습니다. 두 자료를 교차해보니 아래 두 가지가 선명하게 드러났습니다.
① “무료 1,000회”가 Plan 모드에선 사실상 절반입니다
구글은 Plan 모드를 “무료로 쓸 수 있는 안전한 탐색 환경”이라고 발표했습니다. 그런데 Plan 모드는 Gemini 3.1 Pro를 자동 호출합니다. 무료 티어에서 Pro 한도는 하루 약 200회입니다. (출처: Reddit r/GeminiCLI, 2026.03.08) 200회 소진 후에는 Flash로 내려가고, 계획의 추론 품질이 달라집니다. “무료라서 마음껏 쓸 수 있다”는 인식과 실제 동작이 맞지 않습니다.
② Plan 모드가 Claude Code 대체재가 되려면 조건이 있습니다
일부 커뮤니티에서 “이제 Gemini CLI가 Claude Code와 동등해졌다”는 평이 나오지만, 이건 선을 그을 필요가 있습니다. 비교 자료를 보면 수치가 나옵니다. Gemini CLI는 하루 1,000 API 호출이 실제 80~150개의 프롬프트에 해당하고, 단순 탐색·읽기·테스트 작성에서는 Claude Code의 60~70% 작업을 대체할 수 있습니다. (출처: termdock.com, 2026.03.16) 반면 다수 파일에 걸친 아키텍처 리팩토링, 복잡한 동시성 디버깅, 20개 이상 파일 변경은 현재 Gemini CLI의 Plan 모드만으로는 한계가 있다고 같은 자료가 밝힙니다. Claude Code Pro($20/월)를 유지하면서 단순 작업을 Gemini CLI로 돌리면 연간 약 $960을 절감할 수 있다는 계산도 함께 나옵니다.
솔직히 말하면, Plan 모드 추가로 Gemini CLI가 한 단계 올라선 건 맞습니다. 그런데 “이제 Claude Code 없어도 된다”고 보기엔 이릅니다. 복잡도 높은 작업에서 Pro 한도 소진 후의 품질 저하는 직접 써봐야 체감되는 부분입니다.
Conductor 확장으로 Plan 모드 극대화하기
Plan 모드와 함께 출시된 Conductor는 공식 GitHub 확장 프로그램으로, 복잡한 멀티스텝 개발 흐름에서 Plan 모드를 오케스트레이터처럼 활용합니다. (출처: github.com/gemini-cli-extensions/conductor)
Conductor가 하는 역할은 명확합니다. 작업을 트랙 단위로 분리하고, 각 트랙마다 Plan 모드에서 사전 탐색을 강제합니다. ask_user로 아키텍처 선택지를 제시하고, 결정이 끝나면 exit_plan_mode로 구현 단계로 넘어갑니다. 계획 결과물은 conductor/ 디렉터리에 저장되어 재사용됩니다.
구글은 Conductor를 조만간 Gemini CLI 내장 모드로 통합할 계획이라고 공식 블로그에서 밝혔습니다. (출처: Google Developers Blog, 2026.03.11) 지금은 확장으로 별도 설치해야 하지만, 정식 내장 후엔 설치 없이 쓸 수 있게 됩니다.
💡 현재 Conductor를 Plan 모드와 함께 쓰면 계획 단계에서 Pro 호출이 더 많이 발생합니다. 트랙이 여러 개일수록 Pro 200회 한도 소진이 빠릅니다. 복잡한 마이그레이션이나 대형 기능 구현에 쓰기 전에 /stats model로 남은 Pro 잔여량을 먼저 확인하는 게 좋습니다.
Q&A — 자주 나오는 질문 5가지
마치며
그런데 막상 써보면 마주치는 현실이 있습니다. Plan 모드 자동 모델 라우팅이 Pro를 당깁니다. 무료 티어에서 Pro는 하루 약 200회고, 복잡한 계획 하나에 수십 회가 소모될 수 있습니다. “무료라서 마음껏”보다 “Pro 잔여량을 확인하면서”가 더 정확한 접근입니다.
개인적으로는, 단순 탐색과 읽기 위주 작업에 Plan 모드를 적극 활용하고, 복잡도 높은 구현은 Claude Code 조합을 유지하는 흐름이 현재로선 가장 실용적이라고 봅니다. Conductor가 정식 내장되면 이 평가가 바뀔 수 있습니다.
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Gemini CLI는 지속적으로 업데이트되는 오픈소스 도구입니다. 한도 수치·모델명·기능은 Google의 정책에 따라 예고 없이 변경될 수 있으므로, 최신 정보는 공식 문서를 직접 확인해 주세요. 본 포스팅 기준 버전: Gemini CLI (2026.03.11 Plan Mode 출시 기준).











댓글 남기기