Gemini CLI 무료, Pro 쓰던 게 아니었습니다

Published on

in

Gemini CLI 무료, Pro 쓰던 게 아니었습니다

2026.03.21 기준
Gemini CLI v0.1.x 기준
3월 25일 정책 변경 예정

Gemini CLI 무료, Pro 쓰던 게 아니었습니다

구글이 어제(2026.03.19) 공식 발표했습니다. 3월 25일부터 Gemini CLI 무료 사용자는 Pro 모델을 쓸 수 없습니다. Flash만 가능합니다. 그런데 사실 이미 그랬습니다. 공식 문서에 적힌 “하루 1,000 요청”은 Pro에 해당하는 수치가 아닙니다.

1,000회
무료 일일 한도 (Flash 기준)
$19.99
Pro 모델 쓰려면 최소 월 구독료
3.25
Pro 무료 제공 완전 차단 D-Day

“1,000 요청 무료”라는 말, 조건이 있었습니다

Gemini CLI를 소개하는 유튜브나 블로그에는 “하루 1,000 요청 무료”라는 말이 자주 등장합니다. 맞는 말이긴 한데, 빠진 맥락이 있습니다. 그 1,000 요청은 Flash 모델에 대한 한도입니다. Pro 모델은 처음부터 별도 제한이 있었고, 실제 사용자들은 25~100회 요청만에도 Pro 한도에 걸렸습니다.

💡 공식 GitHub 토론(#4122)에 직접 나와 있습니다: “The Gemini CLI free quota is typically 1,000 requests per day and up to 60 RPM on Flash. Flash is not a heavy lifter for coding applications. You may get a small number of requests on Gemini 2.5 Pro, but Pro is a paid model.” — Gemini CLI 팀 공식 답변 (2025.07, 출처: github.com/google-gemini/gemini-cli/discussions/4122)

Pro 모델 무료 접근은 “실험적으로 일부 제공”하는 형태였지, 1,000 요청 전부가 Pro에 보장된 게 아니었습니다. 문서엔 한 줄도 명확히 적혀 있지 않았고, 구글 팀도 “혼란을 드려 죄송하다”고 직접 인정했습니다. 공식 문서에서 별도 이유를 밝히지 않은 채 운영되어 온 정책이었습니다.

이게 단순한 실수가 아닌 이유가 있습니다. 구글은 무료 Gemini CLI의 OAuth 인증을 통해 서드파티 도구들이 Pro 할당량을 우회해서 쓰고 있다는 걸 파악하고 있었고, 3월 19일 발표는 그 대응의 일환입니다. (출처: KuCoin News, 2026.03.19)

▲ 목차로 돌아가기

인증 방식에 따라 Gemini CLI 한도가 완전히 달라집니다

Gemini CLI는 로그인 방식이 세 가지입니다. 어떤 방식으로 인증하느냐에 따라 한도 자체가 다릅니다. 같은 “무료 사용자”라도 숫자가 달라서 헷갈리는 경우가 많습니다.

인증 방식 일일 요청 한도 분당 한도 사용 가능 모델 (3.25 이후)
Google 계정 로그인 (개인) 1,000회 60 RPM Flash만 가능 (Pro 차단)
Gemini API Key (무료) 250회 10 RPM Flash만 가능
Vertex AI Express Mode 가변 가변 90일 무료, 이후 청구

출처: Gemini CLI 공식 문서 — Quotas and pricing (geminicli.com/docs/resources/quota-and-pricing/)

눈에 띄는 건 API Key 인증입니다. 같은 무료임에도 일일 한도가 250회로 훨씬 낮습니다. 터미널에서 API Key 방식으로 쓰고 있다면 1,000회가 아니라 250회가 실제 한도입니다. 구글 계정 로그인 방식과 4배 차이입니다.

Vertex AI Express Mode는 별도 결제 설정 없이 쓸 수 있지만, 90일이 지나면 자동으로 청구 설정을 요구합니다. 기간 한도가 있는 무료라는 점에서 일반적인 “무료 한도”와 다릅니다. 90일이 넘도록 청구 설정을 안 하면 접근이 막힙니다.

▲ 목차로 돌아가기

3월 25일부터 무료 사용자에게 달라지는 것들

구글의 Ryan J. Salva(Head of Gemini CLI, Senior Product Director of Developer Experience)가 2026.03.18 GitHub 공식 토론에 올린 서비스 업데이트 발표에 따르면, 세 가지가 바뀝니다.

⚠️ 2026.03.25부터 시행되는 3가지 변경사항

  1. 무료 사용자는 Pro 모델 접근 완전 차단. Gemini Flash 모델만 사용 가능. Pro·Ultra 구독($19.99/월 이상) 필요.
  2. 트래픽 우선순위가 라이선스 유형별로 달라짐. 무료 사용자는 피크 타임에 접근 제한 가능성.
  3. 어뷰징 탐지 강화. Gemini CLI의 OAuth 인증을 이용해 서드파티 소프트웨어에 연결하는 행위 적발 시 계정 제한.

출처: GitHub Discussions #22970, google-gemini/gemini-cli (2026.03.18)

세 번째 항목이 특히 중요합니다. Gemini CLI의 OAuth 인증은 OpenClaw, Antigravity 등 서드파티 AI 코딩 도구들이 구글 Pro 모델을 무료로 우회해서 사용하는 창구로 쓰여왔습니다. 실제로 2026년 2월에도 OpenClaw 사용자들이 구글에 의해 계정 제한을 받은 사례가 있습니다. (출처: Hacker News #47115805, 2026.02.23)

Antigravity(구글의 코딩 에이전트 플랫폼)을 통한 접근도 마찬가지입니다. 유료 구독을 Gemini CLI 이외의 경로로 우회하는 방식은 이번 정책 강화의 직접적인 단속 대상입니다. 툴 이름만 달라도 백엔드에서 Gemini CLI OAuth를 쓰고 있다면 해당됩니다.

▲ 목차로 돌아가기

유료 구독해도 Gemini CLI가 막히는 경우가 있습니다

돈을 내도 막히는 상황이 보고되고 있습니다. Google AI Pro($19.99/월) 구독자들이 2026년 2월부터 Gemini 3.1 Pro를 사용 중 주간 한도에 걸리는 문제를 겪고 있습니다. Google AI 공식 개발자 포럼에는 “한 번도 Gemini 3.1을 쓴 적이 없는데 주간 할당량이 잠겼다”는 제목의 스레드가 3일 전에 올라왔습니다.

💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다: 공식 문서에는 AI Pro 구독 시 Gemini Code Assist 기준 1,500 요청/일이라고 적혀 있습니다. 그런데 실제 사용자는 246회 Pro 요청(+ 16회 Flash + 1회 Flash-Lite = 263회)만에 한도 초과 오류를 받았습니다. 1,500회의 약 17% 수준입니다. 공식 문서에서 이유를 밝히지 않고 있습니다.

원인으로 추정되는 건 두 가지입니다. 첫 번째는 Pro 모델 전용 별도 할당량이 존재한다는 것입니다. Gemini CLI에서 “하루 1,500 요청”은 Flash와 Pro를 합산한 전체 요청 수로 카운트되지 않을 가능성이 큽니다. 두 번째는 단일 프롬프트가 내부적으로 여러 번의 API 호출을 발생시킨다는 점입니다. GitHub 팀의 답변에서도 이 점을 직접 언급했습니다.

Ultra 구독자($249.99/월)도 “주간 할당량을 2시간 만에 다 썼다”는 사례가 Reddit에서 확인됩니다. 구독료 대비 실사용 가능 시간이 구독 내용에 명시된 한도보다 훨씬 짧을 수 있습니다.

▲ 목차로 돌아가기

Claude Code, Codex와 무료 한도 직접 비교해봤습니다

터미널 기반 AI 코딩 도구 세 가지를 무료 한도 기준으로 나란히 놓았습니다. 3월 25일 이후 기준입니다.

도구 무료 모델 수준 무료 일일 한도 유료 최저가
Gemini CLI Flash만 가능 (3.25~) 약 1,000회 $19.99/월
OpenAI Codex CLI ChatGPT Plus 필요 없음 (유료 전용) $20/월
Claude Code Claude 모델 (Pro 필요) 없음 (유료 전용) $20/월

출처: 각 공식 문서 및 nxcode.io 비교 리포트 (2026.03.11), deployhq.com 비교 글 기준

숫자만 보면 Gemini CLI가 여전히 무료 한도 면에서 앞섭니다. 하루 1,000회는 Claude Code나 Codex가 아예 제공하지 않는 수치입니다. 문제는 Flash 모델로만 쓸 때 코딩 품질입니다. GitHub 공식 답변에서도 “Flash is not a heavy lifter for coding applications”라고 직접 표현했습니다. Flash가 빠르긴 하지만, 복잡한 리팩토링이나 멀티 파일 수정 작업에서는 Pro보다 결과물이 눈에 띄게 낮습니다.

솔직히 말하면, “무료 1,000회”라는 숫자는 코딩 작업 기준으로 체감이 다릅니다. 프롬프트 1회가 내부적으로 수십 번의 API 호출을 발생시키는 구조 때문에, 실제 세션 기준으로는 10~15회 세션이면 하루 한도가 소진될 수 있습니다.

▲ 목차로 돌아가기

무료로 최대한 쓰려면 지금 당장 이렇게 하세요

3월 25일 이전까지, 아직 무료로 Gemini 3.1 Pro를 쓸 수 있는 사흘이 남았습니다. 그 이후를 대비해 지금 당장 할 수 있는 것들을 정리했습니다.

🔧 Gemini CLI 무료 한도 최적화 체크리스트

  • 인증 방식 확인: Google 계정 로그인인지 API Key 로그인인지 확인. API Key 방식이면 하루 한도가 250회로 줄어듭니다.
  • /settings에서 “Preview Features” 활성화: 공식 릴리스 노트에 따르면 이 토글을 켜면 Free Tier 사용자도 Gemini 3 Pro·Flash에 접근 가능합니다. 단, 3.25 이후 유지 여부는 미정입니다.
  • /stats model 명령어로 현재 사용량 확인: 세션 중 토큰·요청 수를 실시간 확인 가능합니다. 한도 초과 전에 미리 감지할 수 있습니다.
  • Plan Mode 활용: 2026.03.11 추가된 Plan Mode(/plan 또는 Shift+Tab)는 읽기 전용으로 실행되므로 실제 코드 변경 없이 분석·설계가 가능합니다. 토큰 소비를 줄이는 데 효과적입니다.
  • Vertex AI Express Mode 고려: 결제 설정 없이 90일 무료 사용 가능. 기간 내에는 Pro 모델 접근도 일부 가능합니다.

3월 25일 이후에도 무료로 Pro 수준의 코딩을 원한다면, Gemini CLI 단독보다 GitHub Copilot Free(월 2,000 completions + 50 premium requests)와 병행하는 방식이 현재로선 무료 커버리지가 가장 넓습니다. (출처: nxcode.io, 2026.03.11 — “Best free tier for CLI work: Gemini CLI (1,000 req/day, mostly Flash) combined with Copilot Free”)

▲ 목차로 돌아가기

Q&A

Q1. Gemini CLI는 지금 당장 무료로 쓸 수 있나요?

네, 가능합니다. Google 계정으로 로그인하면 하루 1,000회 Flash 모델 요청이 무료입니다. 다만 3월 25일 이전까지는 Pro 모델도 제한적으로 가능하지만, 그 이후엔 Flash만 무료로 제공됩니다. API Key 방식으로 인증하면 무료 한도는 하루 250회로 줄어듭니다.

Q2. 구글 계정만 있으면 바로 Gemini CLI를 쓸 수 있나요?

Node.js가 설치된 환경이라면 npm install -g @google/gemini-cli로 설치 후 gemini 명령어로 실행하면 됩니다. 처음 실행 시 브라우저 기반 OAuth 인증 흐름이 시작되고, 구글 계정으로 로그인하면 됩니다. API Key 없이도 무료 사용이 가능합니다.

Q3. Plan Mode는 무료 사용자도 쓸 수 있나요?

네. 2026.03.11 공식 블로그 발표에 따르면 Plan Mode는 모든 사용자에게 기본 활성화된 기능입니다. /plan을 입력하거나 Shift+Tab으로 진입할 수 있습니다. Plan Mode는 읽기 전용으로 실행되며, 파일을 수정하지 않아 토큰 소비를 줄이는 데 도움이 됩니다. 단, Plan Mode 중에도 Pro 모델이 사용되므로 3.25 이후 무료 사용자는 Flash로 Plan Mode를 실행하게 됩니다.

Q4. OpenClaw나 Antigravity를 통해 Gemini를 쓰면 이번 제한에 걸리나요?

걸릴 가능성이 높습니다. 이번 정책 변경의 핵심 목적 중 하나가 서드파티 소프트웨어의 OAuth 우회 사용을 막는 것입니다. 공식 발표(GitHub Discussions #22970)에서 “non-compliant accounts will be flagged”라고 명시했습니다. OpenClaw나 Antigravity가 Gemini CLI OAuth를 백엔드로 사용하는 경우 계정 제한 대상이 될 수 있습니다.

Q5. 현재 내 사용량은 어떻게 확인하나요?

Gemini CLI 세션 내에서 /stats model 명령어를 입력하면 현재 세션의 토큰 사용량과 모델별 요청 횟수, 남은 한도 정보를 확인할 수 있습니다. 세션 종료 시에도 사용량 요약이 자동으로 출력됩니다. (출처: geminicli.com/docs/resources/quota-and-pricing/)

▲ 목차로 돌아가기

마치며

Gemini CLI는 여전히 무료 코딩 도구 중 한도 수치가 가장 너그러운 편입니다. 하루 1,000회라는 숫자 자체는 Claude Code나 Codex가 제공하지 않는 수준입니다. 하지만 그 1,000회가 전부 Pro 요청에 해당하지 않는다는 걸 처음부터 명확히 밝히지 않았다는 점은 짚고 넘어가야 합니다.

3월 25일 이후 무료 사용자에게 Flash만 남는 건 아쉽지만, 이 부분은 처음부터 구조상 예고된 수순이었습니다. 서드파티 우회 사용이 광범위하게 이루어지고 있었고, Pro 모델 무료 제공은 실질적으로 지속 불가능한 수준이었습니다. 유료 AI Ultra 구독자도 2시간 만에 주간 할당량이 소진되는 상황이었으니까요.

Flash 모델의 실제 코딩 품질이 개선되고 있는 건 분명합니다. Gemini 3.1 Flash는 이전 세대보다 속도와 컨텍스트 처리 면에서 확실히 좋아졌습니다. Plan Mode를 활용해 분석→설계→구현 흐름을 나누면 Flash 한도 안에서도 꽤 실용적인 작업이 가능합니다. 무료로 계속 쓰되, 지금부터는 한도를 아끼며 쓰는 방식으로 접근하는 게 현실적입니다.

본 포스팅 참고 자료

  1. Google Developers Blog — Plan mode is now available in Gemini CLI (2026.03.11) developers.googleblog.com
  2. Gemini CLI 공식 문서 — Quotas and pricing geminicli.com/docs/resources/quota-and-pricing/
  3. GitHub Discussions #22970 — Service update: mitigating abuse and prioritizing traffic (2026.03.18) github.com/google-gemini/gemini-cli/discussions/22970
  4. GitHub Discussions #4122 — Clarification on Daily Request Limit github.com/google-gemini/gemini-cli/discussions/4122
  5. KuCoin News — Gemini CLI to Limit Free Users to Flash Model Starting March 25 (2026.03.19)
  6. Google AI Developer Forum — weekly rate limit even with ZERO usage on Gemini 3.1 (2026.03.17)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Gemini CLI는 수시로 업데이트되는 서비스로, 본문의 수치와 정책은 2026.03.21 기준이며 이후 달라질 수 있습니다. 최신 정보는 공식 문서를 직접 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기