Gemini CLI 최신
⏰ D-5 정책 변경
Gemini CLI 무료, 3월 25일부터 이게 막힙니다
지금 이 글을 읽는 시점에서 Gemini CLI를 무료로 쓰고 있다면, 5일 뒤부터 상황이 달라집니다. Google이 2026년 3월 18일 GitHub 공식 Discussion을 통해 발표한 내용에 따르면, 3월 25일부터 무료 사용자는 Gemini Pro 모델에 접근할 수 없게 됩니다. Flash 모델만 남습니다.
3월 25일, 정확히 뭐가 바뀌나요?
Google의 Gemini CLI 제품 책임자인 Ryan J. Salva가 2026년 3월 18일 GitHub 공식 Discussion(#22970)에 올린 공지에는 세 가지 변경 사항이 담겨 있습니다. 그중 가장 직접적으로 체감되는 것이 바로 이것입니다.
📌 공식 공지 핵심 3가지 (2026.03.18, GitHub Discussion #22970)
① 모델 제한: 2026년 3월 25일부터 무료 티어 사용자는 Gemini Pro 모델 접근 불가. Flash 모델만 사용 가능.
② 트래픽 우선순위: 라이선스 유형과 계정 상태에 따라 트래픽 처리 우선순위가 달라짐. 피크 타임에는 무료 사용자가 용량 제한에 걸릴 가능성.
③ 남용 감지 강화: 제3자 소프트웨어에서 Gemini CLI OAuth 인증을 무단으로 사용하는 행위를 탐지하고 차단하는 시스템 강화.
정리하면, 지금까지 무료로 Gemini 2.5 Pro나 Gemini 3 Pro를 터미널에서 쓰고 있었다면 5일 후부터는 그게 안 됩니다. Flash만 남습니다. (출처: GitHub google-gemini/gemini-cli Discussion #22970)
로그인 방식에 따라 달라지는 구조
Gemini CLI는 인증 방식이 세 가지입니다. 어떤 방식으로 로그인하느냐에 따라 한도와 접근 가능한 모델이 완전히 달라집니다. 이 부분을 모르고 쓰는 사람이 많아서 3월 25일 이후 혼란이 생길 가능성이 높습니다.
| 인증 방식 | 일일 요청 한도 | 분당 한도 | 3/25 이후 Pro 접근 |
|---|---|---|---|
| Google 계정 로그인 (무료) | 1,000회 | 60회 | ❌ 차단 |
| Gemini API Key (무료 티어) | 250회 | 10회 | ❌ 차단 |
| Google AI Pro ($19.99/월) 로그인 | 높음 (확장) | 확장 | ✅ 유지 |
| Google AI Ultra ($249.99/월) 로그인 | 최고 수준 | 최고 수준 | ✅ 유지 |
💡 공식 발표문과 실제 인증 흐름을 같이 놓고 보니 이런 차이가 보였습니다. “무료 사용자”라는 게 단순히 구독 안 한 사람이 아닙니다. Gemini API Key를 발급받아 쓰던 사람도 무료 티어면 동일하게 Pro 모델이 차단됩니다. API Key를 유료로 전환하면 모델 접근이 가능하지만, 이때는 토큰당 과금 방식으로 바뀌어 비용 구조가 완전히 달라집니다.
Flash로 코딩해도 됩니까 — 공식 수치로 봤습니다
여기서 핵심 질문이 나옵니다. “Pro 모델이 막히면 Flash로 코딩하는 게 의미가 있느냐”는 겁니다. 막상 수치를 놓고 보면 생각과 다릅니다.
💡 “Flash가 Pro보다 코딩을 잘한다”는 게 수치로 확인됩니다
SWE-bench Verified(실제 GitHub 이슈를 기반으로 코딩 능력을 측정하는 업계 표준 벤치마크)에서 Gemini 3 Flash는 78.0%를 기록했고, Gemini 3 Pro는 76.2%였습니다. 즉, 코딩 기준으로는 Flash가 앞섭니다. (출처: Vertu, Gemini 3 Flash vs Pro 분석, 2025.12.23)
1.8%p 차이라서 통계적으로 작아 보일 수 있지만, 이 차이가 일관되게 유지되고 있다는 점이 중요합니다. LiveCodeBench Elo에서도 Flash가 Pro보다 높았고, Toolathlon(에이전트 도구 활용 능력)에서도 Flash가 49.4%로 Pro를 앞섰습니다.
속도 차이도 현실적으로 다가옵니다. Flash는 약 218토큰/초, Pro는 약 73토큰/초로 Flash가 3배 빠릅니다. 코딩 작업 100회 반복 기준으로 하루에 약 30분의 대기 시간 차이가 납니다. 개발 사이클이 짧아질수록 이 차이는 커집니다.
단, Flash에도 주의해야 할 지점이 있습니다. Pro에서 보고된 코드 무작위 삭제 버그(GitHub 이슈 기준 50건 이상 접수)는 Flash에서는 보고 빈도가 낮지만, Flash 역시 긴 컨텍스트에서 지시를 잊는 경우가 간혹 발생합니다. 이 부분은 확인이 필요합니다.
| 항목 | Gemini 3 Flash | Gemini 3 Pro |
|---|---|---|
| SWE-bench Verified | 78.0% | 76.2% |
| 생성 속도 | 218토큰/초 | ~73토큰/초 |
| API 입력가(1M 토큰) | $0.50 | $2.00~$4.00 |
| 코드 무작위 삭제 버그 | 보고 드뭄 | GitHub 50건+ 접수 |
출처: Gemini API 공식 요금 페이지 (ai.google.dev/gemini-api/docs/pricing), Vertu Flash vs Pro 분석 (2025.12.23)
$19.99 AI Pro, 실제로 CLI에서 뭐가 달라지나
Google AI Pro 구독($19.99/월)이 Gemini CLI 사용에 실제로 어떤 영향을 주는지는 Google One 공식 페이지를 직접 확인해야 알 수 있습니다. 단순히 Pro 모델 접근 권한이 생기는 것 외에도 달라지는 게 있습니다.
💡 한도가 “CLI와 IDE에서 공유”된다는 점, 기존 글에서는 잘 안 다룹니다
공식 문서(developers.google.com/gemini-code-assist/resources/faqs)에 명시된 내용에 따르면, Google AI Pro/Ultra를 구독하면 Gemini Code Assist(IDE 플러그인)와 Gemini CLI의 일일 한도가 함께 올라갑니다. 그리고 이 한도는 CLI와 IDE 플러그인 사이에서 공유됩니다. VS Code나 JetBrains에서 AI Pro 구독 계정으로 코드 작업을 많이 했다면, 같은 날 CLI 한도가 줄어 있습니다. (출처: Gemini Code Assist FAQ, Google Developers 공식)
이 구조는 실무에서 꽤 중요합니다. IDE와 CLI를 모두 쓰는 개발자라면 예상보다 빨리 한도에 도달할 수 있습니다. 정확한 일일 한도 숫자는 Google이 공식적으로 공개하지 않고 “높음”/”최고 수준”으로만 표기하고 있습니다. 구체적 수치는 확인 필요 상태입니다.
부가적으로 AI Pro 구독에는 Google Cloud 크레딧 월 $10과 2TB 스토리지가 포함됩니다. 이 크레딧을 통해 Vertex AI Express Mode(90일 무료 이후 별도 과금)나 Gemini API 유료 티어로 넘어가는 다리로 쓸 수 있습니다.
그러면 무료 Flash만으로 실무 코딩이 가능한가
솔직히 말하면 “대부분의 경우는 된다”입니다. SWE-bench 기준 78%는 실제 프로덕션 레포 이슈를 처리하는 능력을 측정한 수치입니다. 다만 복잡한 멀티파일 아키텍처 설계나 긴 컨텍스트를 유지하면서 이어가야 하는 작업이라면 Flash도 한계가 있을 수 있습니다. 이 부분은 작업 유형에 따라 직접 테스트해보는 게 맞습니다.
Pro 모델 꼭 써야 한다면, 이 방법이 있습니다
무료로 Pro 모델을 계속 쓸 방법은 3월 25일 이후 사실상 없습니다. 다만 비용을 최소화하면서 Pro 모델을 접근하는 경로가 몇 가지 있습니다.
경로 1. Vertex AI Express Mode (90일 한시적 무료)
Vertex AI를 Express Mode로 설정하면 처음 90일간 Pro 모델을 포함해 사용할 수 있습니다. Gemini CLI의 세 번째 인증 방식으로, 90일 이후에는 결제를 활성화해야 합니다. 지금 막 시작한다면 9월 중순까지 쓸 수 있습니다. (출처: Google Cloud Vertex AI Express Mode 공식 문서)
경로 2. Gemini API Key 유료 전환 (토큰당 과금)
AI Studio에서 API Key를 발급하고 유료 결제를 활성화하면 Pro 모델에 접근됩니다. Gemini 2.5 Flash 기준 입력 $0.30/1M 토큰, 출력 $2.50/1M 토큰입니다. 가벼운 개인 프로젝트 수준이라면 월 $5 이하로 관리될 수 있습니다. 단, 사용량이 늘면 비용이 예측 불가하게 올라갈 수 있어 한도 설정이 필수입니다. (출처: Gemini API 공식 요금 페이지)
경로 3. Google AI Pro 구독 ($19.99/월)
가장 직접적인 방법입니다. 구독 후 Google 계정으로 CLI에 로그인하면 Pro 모델 접근과 함께 일일 한도가 올라갑니다. 단, Gemini Code Assist(IDE)와 한도를 공유한다는 점은 앞서 언급한 대로 유의해야 합니다.
남용 방지라는데, 실제 피해는 누가 입나
이번 정책 변경의 공식 이유는 “남용 방지”와 “서비스 품질 유지”입니다. 실제로 일부 사용자들이 Gemini CLI의 OAuth 인증을 제3자 앱에서 재활용하거나, 대량 자동화 워크플로에 무료 티어를 사용해 온 사례가 있었습니다.
💡 이번 변경이 “남용자”만 걸러내지 않는다는 점이 커뮤니티에서 지적됩니다
GitHub Discussion #22970에 달린 댓글 중 주목할 만한 반응이 있습니다. AI 교육 세션을 운영하며 Gemini CLI를 무료로 홍보해 온 한 사용자는 “이 제한으로 프로 구독자들마저 실제 작업을 하기 어려워졌다”며, 이 제한이 직접 Google의 간접 수익 경로를 막는다고 지적했습니다. 일부 Ultra 구독자들도 주간 한도가 2시간 작업만에 소진된다는 경험을 Reddit에 공유했습니다. (출처: GitHub Discussion #22970, 커뮤니티 댓글 종합)
이 변경이 실질적으로 가장 영향을 주는 그룹은 Pro 모델을 일상 코딩 도구로 무료 티어에서 써오던 개발자들입니다. 취미 프로젝트, 1인 개발, 학습 목적으로 Gemini CLI를 쓰던 사람들이 갑작스럽게 유료 전환을 고민해야 하는 상황에 놓였습니다.
그렇다고 무조건 나쁜 소식만은 아닙니다. Flash로도 코딩 성능이 충분하다는 걸 수치로 확인했고, 무료 티어에서 Flash 하루 1,000회 한도는 개인 개발자 기준 하루 작업량으로 부족하지 않은 경우가 많습니다.
Q&A
Q. 3월 25일 이후에도 무료로 Gemini CLI를 쓸 수 있나요?
쓸 수 있습니다. 다만 Gemini Flash 모델만 사용 가능합니다. 하루 1,000회 요청(분당 60회) 한도는 유지됩니다. Pro 모델이 필요 없다면 무료 사용에는 지장이 없습니다.
Q. Flash 모델로도 실제 코딩 작업이 가능한가요?
SWE-bench Verified 기준 Gemini 3 Flash가 78%로 Pro(76.2%)를 앞섭니다. 일반적인 코딩 작업, 버그 수정, API 통합, UI 컴포넌트 작업에는 충분합니다. 다만 대규모 리팩토링이나 매우 긴 컨텍스트 유지가 필요한 작업은 직접 테스트해보는 게 좋습니다.
Q. Gemini API Key를 유료로 바꾸면 Pro 모델을 쓸 수 있나요?
네, AI Studio에서 API Key의 결제를 활성화하면 Pro 모델에 접근됩니다. 다만 이 방식은 토큰당 과금으로 바뀌어 고정 비용 예측이 어렵습니다. AI Studio나 Google Cloud Console에서 월 한도를 설정해두는 것이 필수입니다.
Q. Google AI Pro 구독하면 CLI 한도가 정확히 얼마나 늘어나나요?
공식적으로 정확한 숫자는 공개되지 않습니다. Google One 공식 페이지 기준 “높음(확장)”으로만 표기됩니다. 다만 Gemini Code Assist Standard(1,500회/일)나 Enterprise(2,000회/일) 한도와 유사한 범위인 것으로 커뮤니티에서 추정되고 있습니다. 정확한 수치 공개는 확인 필요 상태입니다.
Q. Vertex AI Express Mode와 Google AI Pro 중 뭐가 더 낫나요?
목적이 다릅니다. Vertex AI Express Mode는 90일 한시 무료지만 이후에는 사용량 기반 과금으로 전환됩니다. Google AI Pro는 월 $19.99 고정 비용이지만 예측 가능한 한도가 주어지고, Gemini 앱·Jules·2TB 스토리지 등 부가 혜택이 따라옵니다. 장기적으로 CLI를 코딩 도구로 쓸 계획이라면 AI Pro 쪽이 비용 예측이 쉽습니다.
마치며
이번 정책 변경을 정리하면 이렇습니다. 3월 25일부터 Gemini CLI 무료 사용자는 Pro 모델을 쓸 수 없습니다. 그런데 막상 수치를 보면 Flash가 코딩 성능 면에서 Pro보다 낫습니다. 단순히 “무료가 막혔다”는 문제보다, “어차피 Flash가 더 잘 하는데 굳이 Pro를 써야 하는 상황이 있느냐”를 따지는 게 더 현실적인 접근입니다.
Flash 무료 티어로 충분한 사람은 그냥 계속 쓰면 됩니다. Pro 모델이 실제로 필요한 작업을 하는 사람은 Vertex AI Express Mode(90일 무료)나 API Key 유료 전환, 또는 AI Pro 구독 중 자신에게 맞는 경로를 선택하면 됩니다.
개인적으로는 Gemini CLI가 무료로 Pro 모델을 제공하던 구조가 오히려 특이한 케이스였다고 봅니다. 그 구조가 정상화되는 과정이라고 이해하는 게 맞습니다. 관건은 Flash의 품질이 실제로 충분한가인데, 적어도 공식 벤치마크 수치로는 그렇습니다.
📚 본 포스팅 참고 자료
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Gemini CLI 및 Google AI 요금제 관련 정책은 Google의 결정에 따라 예고 없이 달라질 수 있습니다. 중요한 의사결정 전에는 위 참고 자료의 공식 원문을 직접 확인하시기 바랍니다.


댓글 남기기