Gemini CLI 정책 변경
3월 25일 시행
Gemini CLI 무료 제한,
Flash가 더 빠를 수 있습니다
구글이 3월 19일 GitHub 공식 토론에 올린 공지 하나가 개발자 커뮤니티를 뒤흔들었습니다.
3월 25일부터 Gemini CLI 무료 사용자는 Pro 모델을 쓸 수 없습니다.
Flash 모델만 남습니다. 그런데 공식 벤치마크 수치를 들여다보면, 이게 꼭 나쁜 소식만은 아닙니다.
Flash가 SWE-bench에서 Pro를 78% vs 76.2%로 앞섭니다.
정확히 무엇이 바뀌고, 어떻게 대응하면 되는지 공식 문서와 GitHub 원문에서 직접 확인했습니다.
3월 25일 정책 변경, 정확히 무엇이 달라지나
구글 개발자 경험 시니어 프로덕트 디렉터 Ryan J. Salva가 2026년 3월 19일 GitHub 공식 토론(#22970)에 공지를 올렸습니다.
제목은 “서비스 업데이트: 남용 방지 및 트래픽 우선순위 조정”입니다.
정책 변경 내용은 세 가지로 정리됩니다.
📌 3월 25일 시행 3가지 변경 사항 (출처: GitHub google-gemini/gemini-cli 토론 #22970)
- 모델 접근 제한: 무료 사용자는 Gemini Pro 모델 접근 불가 → Flash 모델만 사용 가능
- 트래픽 우선순위: 라이선스 유형과 계정 상태에 따라 트래픽 할당 순위가 달라짐. 피크 시간대 무료 유저 용량 제한 가능
- 남용 탐지 강화: 서드파티 소프트웨어에서 Gemini CLI OAuth 인증을 무단으로 연동하는 경우 계정 정지 가능
배경을 보면 구글이 왜 이 시점에 움직였는지 이해됩니다.
개발자 커뮤니티 일부에서 대량 계정을 등록해 프록시 방식으로 무료 Pro 할당량을 제3자 소프트웨어에 무한정 흘려보내는 방식이 자리잡혔습니다.
Salva는 공지에서 “투명하게 알린다”는 표현을 썼는데, 실제 커뮤니티 반응은 상당히 거셉니다.
Reddit r/Bard 스레드에서 한 사용자는 “Ultra 구독자도 주간 할당량을 2시간 만에 소진한다”고 토로했고, 또 다른 사용자는 “이걸로 끝났다”는 반응을 보였습니다.
Pro 모델을 계속 쓰려면 Google AI Pro(월 $19.99) 또는 Google AI Ultra(월 $249.99)를 구독해야 합니다.
구글은 또한 AI Studio 또는 Vertex AI에서 개인 API 키를 발급받아 사용하면 할당량과 요금을 직접 관리할 수 있다고 안내하고 있습니다.
출처: GitHub google-gemini/gemini-cli 토론 #22970 (2026.03.19 공개)
Flash만 남는다는데, 코딩 성능은 어떻게 되나
공지를 읽은 대부분의 반응은 “무료 유저가 더 나쁜 모델로 강등당했다”는 것이었습니다.
그런데 벤치마크 수치를 직접 들여다보면 이 전제가 흔들립니다.
💡 공식 발표 수치와 실제 사용 흐름을 나란히 놓고 보니 이런 차이가 보였습니다
반면 Pro는 76.2%입니다. 더 비싸고 무거운 모델이 더 저렴하고 빠른 모델에 1.8% 뒤진 겁니다.
이 수치가 의미하는 건 단순합니다 — Flash가 코딩 작업에서 사실상 더 잘 동작합니다.
Flash vs Pro 벤치마크 직접 비교 (Gemini 3 계열 기준, 2025.12 데이터)
| 벤치마크 | Gemini 3 Flash | Gemini 3 Pro | 우위 |
|---|---|---|---|
| SWE-bench Verified | 78.0% | 76.2% | Flash +1.8% |
| LiveCodeBench Elo | 더 높음 | 낮음 | Flash +541 |
| Toolathlon (에이전트) | 49.4% | 더 낮음 | Flash |
| 응답 속도 | 218 토큰/초 | 약 73 토큰/초 | Flash 3배 빠름 |
| 코드 삭제 버그 | 거의 없음 | GitHub 이슈 50건+ | Flash |
출처: vertu.com 벤치마크 분석 (2025.12.23), GitHub gemini-cli 이슈 트래커
여기서 한 가지 더 짚어야 할 것이 있습니다.
Pro 모델은 GitHub에 코드 삭제 관련 이슈가 50건 이상 등록되어 있는 상태입니다.
개발자들이 보고한 내용을 보면 “관련 없는 코드까지 통째로 지운다”, “테스트 파일이 사라졌는데 모델은 왜 없냐고 물어본다”는 식입니다.
Flash는 이런 신뢰성 문제가 상대적으로 훨씬 적습니다.
물론 Flash가 모든 면에서 Pro를 앞서는 건 아닙니다.
복잡한 추론이 필요한 작업, 멀티모달 처리, 장문 문서 분석에서는 Pro가 여전히 유리합니다.
하지만 Gemini CLI의 주요 사용 목적인 코딩·디버깅·리팩토링 영역에서만 보면, Flash 제한이 실사용에 큰 타격을 주지 않는다는 결론이 나옵니다.
무료로 계속 쓰고 싶다면 이 방법이 있습니다
정책 변경 이후에도 Gemini CLI를 무료로 쓰는 방법은 사라지지 않습니다.
구글이 공지에서 직접 권장한 경로도 있습니다.
정리하면 세 가지 선택지가 남습니다.
Flash 모델로 그대로 사용 (무료 유지)
분당 60회, 하루 1,000회 한도는 그대로 유지됩니다. Flash 모델 코딩 성능이 Pro를 앞서는 점을 감안하면, 일반적인 개발 업무에서는 이 선택지가 실용적입니다.
단, 3월 25일 이후에는 트래픽 과부하 시 무료 유저가 먼저 제한됩니다.
Google AI Studio에서 개인 API 키 발급 후 연결
구글이 공지에서 직접 권장한 방법입니다. AI Studio에서 발급한 키를 Gemini CLI에 등록하면 할당량과 요금을 내가 직접 관리할 수 있습니다.
무료 등급 키도 존재하며 (분당 60회, 하루 1,000회), 단 학습 데이터 활용에 동의해야 합니다.
Pro 모델이 필요하다면 유료 Pay-As-You-Go 키를 쓰면 됩니다.
Google AI Pro 구독 ($19.99/월)
CLI에서 Pro 모델을 계속 쓰려면 이 구독이 필요합니다. Ultra($249.99/월)는 더 높은 할당량이 필요한 헤비 유저 대상입니다.
다만 Reddit에서 Ultra 구독자조차 주간 할당량을 2시간 만에 소진한다는 보고가 있었다는 점은 구독 전 참고할 필요가 있습니다.
⚠️ 주의: 이 사용은 3월 25일 이후 계정 정지 가능
서드파티 소프트웨어에서 Gemini CLI의 OAuth 인증을 무단으로 연동해 공유 할당량을 우회하는 방식은
남용 탐지 시스템에 감지되면 계정이 정지될 수 있습니다.
구글이 명시적으로 “정책 위반 사례”로 지목했습니다.
(출처: GitHub 공식 공지 #22970)
Pro 모델이 진짜 필요한 사람은 따로 있습니다
Flash가 코딩에서 앞선다고 해서 Pro가 필요 없다는 말이 아닙니다.
Flash가 약한 구간이 분명히 존재하기 때문입니다.
아래 상황에서는 Pro 구독을 진지하게 고려할 필요가 있습니다.
💡 Flash 제한이 실제로 느껴지는 작업 유형이 있습니다
- 멀티모달 분석이 필요한 경우: 설계도·ERD·UI 스크린샷을 코드와 함께 분석할 때 Pro의 이미지 추론이 Flash보다 깊습니다.
- 1M 토큰 전체를 활용하는 프로젝트: 대규모 레거시 코드베이스를 통째로 분석하는 경우, Flash는 장문 컨텍스트 처리에서 Pro 대비 품질 저하가 보고됩니다.
- Gemini 3.1 Pro 기반 추론이 필요한 경우: ARC-AGI-2에서 77.1%(이전 버전 대비 2배 이상 향상)를 기록한 Gemini 3.1 Pro의 추론 능력은 Flash와 격차가 납니다. (출처: 구글 공식 블로그 2026.02.19)
- 비코딩 작업 비중이 높은 경우: 논리 분석, 학술 문서 요약, 복잡한 수학 추론에서는 Pro가 여전히 우위입니다.
반대로 말하면, 대부분의 스타트업 개발자나 1인 개발자가 Gemini CLI를 쓰는 방식 — 로컬 코드 디버깅, 함수 작성, 리팩토링, PR 리뷰 자동화 — 에는 Flash가 충분하다는 뜻입니다.
비용 부담 없이 하루 1,000회를 Flash로 쓰는 것이, 월 $19.99를 내고 제한된 할당량으로 Pro를 쓰는 것보다 실용적일 수 있습니다.
Claude Code·Codex와 지금 어떻게 다른가
나무위키 Gemini 문서에는 이런 문장이 있습니다: “Claude Code와 Codex는 무료 사용이 불가능하다는 단점이 있다. Gemini CLI는 무료 사용도 가능하고, 사용 제한 자체도 타 서비스 대비 여유롭다.”
이 문장이 3월 25일 이후에도 여전히 유효한지 짚어봐야 합니다.
| 항목 | Gemini CLI (3월 25일 이후) | Claude Code | OpenAI Codex |
|---|---|---|---|
| 무료 사용 | 가능 (Flash만) | 불가 (Pro 이상 필요) | 불가 (Plus 이상 필요) |
| 무료 한도 | 분당 60회 / 일 1,000회 | 없음 (유료만) | 없음 (유료만) |
| 코딩 벤치마크 (SWE-bench) | Flash 78% / Pro 76.2% | Sonnet 4.5 77.2% | GPT-5.2 약 79% |
| 학습 데이터 활용 (무료) | 있음 (API 키 없을 때) | 없음 | 없음 |
| 유료 최저 구독료 | $19.99/월 (AI Pro) | $20/월 (Pro) | $20/월 (Plus) |
출처: 각 서비스 공식 문서, GitHub 비교 분석 (2026.03 기준). 수치는 약 표기 적용.
정리하면 3월 25일 이후에도 Gemini CLI는 여전히 세 도구 중 유일하게 무료 한도를 유지합니다.
경쟁 도구 대비 실질적인 우위가 사라진 것이 아니라, Pro 모델 무상 제공이라는 예외적인 혜택이 종료된 것에 가깝습니다.
일반 개발 업무를 Flash로 처리한다면, 무료라는 기본 전제는 그대로입니다.
다만 학습 데이터 활용 동의 조건은 짚고 넘어가야 합니다.
이 부분이 불편하다면 AI Studio에서 무료 API 키를 발급받아 연결하면 학습 사용을 끄는 옵션이 생깁니다.
Google One Premium 구독자도 헷갈리는 이유
GitHub 이슈 #23049에는 “저는 Google One Premium 유료 구독자인데, 3월 25일 이후에도 Pro 모델을 쓸 수 있나요?”라는 질문이 올라왔습니다.
이것이 현재 커뮤니티에서 가장 많이 나오는 혼란입니다.
⚡ 현재까지 구글이 공식 답변을 내놓지 않은 부분입니다
공지에서 말한 “유료 구독(paid subscription)”이 Google One Premium을 포함하는지,
아니면 오직 Google AI Pro/Ultra만을 의미하는지가 명확하지 않습니다.
GitHub 이슈 #23049의 질문에 대한 공식 답변은 이 글 작성 시점(2026.03.21)까지 등록되지 않은 상태입니다.
Google One Premium으로 Gemini Advanced를 쓰던 사용자라면, 3월 25일 이전에 직접 확인이 필요합니다.
헷갈리는 이유는 구글의 AI 서비스 구독 체계가 복잡하기 때문입니다.
Google One(클라우드 스토리지 중심) → Gemini Advanced 포함 번들 → Google AI Pro/Ultra(AI 전용) 순으로 계층이 분리되었는데, 이 구조가 Gemini CLI 정책에 어떻게 적용되는지가 아직 불투명합니다.
가장 안전한 선택지는 AI Studio에서 개인 API 키를 발급받아 CLI에 직접 연결하는 방법입니다.
이렇게 하면 구독 체계와 무관하게 할당량을 직접 통제할 수 있습니다.
💡 구독 등급별 Gemini CLI 한도 정리 (나무위키 인용, 2026.03.20 기준)
| 요금제 | 분당 요청(RPM) | 하루 요청(RPD) | Pro 모델 (3/25 이후) |
|---|---|---|---|
| 무료 | 60 | 1,000 | ❌ 사용 불가 |
| Google AI Pro | 120 | 1,500 | ✅ 가능 |
| Google AI Ultra | 120 | 2,000 | ✅ 가능 |
출처: 나무위키 Gemini(인공지능 모델) 문서 (2026.03.20 수정본) / Google One Premium 포함 여부는 공식 확인 필요
Q&A — 자주 묻는 질문 5개
Q1. 3월 25일 이후 Gemini CLI를 열면 아무 변화가 없던데, 정상인가요?
정책 시행 전에는 무료 유저도 여전히 Pro 모델을 쓸 수 있습니다. 3월 25일 이후 자동으로 Flash 전용으로 전환됩니다. 아무 설정을 하지 않아도 되며, CLI가 자동으로 사용 가능한 모델로 전환됩니다. Pro 모델로 강제 지정해 둔 경우에만 오류가 발생할 수 있습니다.
Q2. Flash 모델로도 코딩 실력이 충분한가요?
SWE-bench Verified 기준으로 Gemini 3 Flash는 78.0%, Pro는 76.2%입니다. 일반적인 함수 작성, 디버깅, 리팩토링에서는 Flash가 오히려 더 빠르고 안정적입니다. 단, 복잡한 멀티모달 분석이나 긴 컨텍스트 처리에서는 Pro가 여전히 유리합니다. (출처: vertu.com 벤치마크 분석, 2025.12.23)
Q3. API 키를 등록하면 학습 데이터 활용을 막을 수 있나요?
예. AI Studio 또는 Vertex AI에서 발급받은 API 키를 Gemini CLI에 등록하면 OAuth 방식을 대체합니다. 유료 Pay-As-You-Go 방식의 키를 쓰면 학습 데이터 활용에서 제외됩니다. 무료 AI Studio 키도 존재하나 이 경우에는 여전히 학습에 활용될 수 있습니다. (출처: 나무위키 Gemini CLI 항목)
Q4. AI Pro 월 $19.99와 AI Ultra 월 $249.99, 어떻게 선택하나요?
AI Pro는 하루 1,500회, Ultra는 2,000회로 한도 차이가 크지 않습니다. Reddit 커뮤니티에서는 Ultra 구독자도 주간 할당량을 2시간 만에 소진하는 경우가 있다는 보고가 있었습니다. Pro로 시작해서 한도에 걸리는 빈도를 확인한 뒤 Ultra로 전환하는 것이 합리적입니다.
Q5. 서드파티 앱에 Gemini CLI OAuth를 연동해 쓰던 경우 어떻게 되나요?
구글이 이 방식을 “정책 위반 사례”로 명시했습니다. 3월 25일 이후 남용 탐지 시스템이 강화되며 감지 시 계정 정지 가능성이 있습니다. 공식 권장 방법은 개인 API 키를 발급받아 연결하는 것입니다. (출처: GitHub 공식 공지 #22970)
마치며 — 솔직한 총평
3월 25일 Gemini CLI 정책 변경을 한 문장으로 요약하면 이렇습니다 — “공짜로 최고 모델을 쓰는 시대가 끝났다.”
OpenAI, Anthropic 모두 이미 같은 방향으로 움직인 상황에서 구글만 예외일 수는 없었습니다.
그러나 막상 수치를 들여다보면 상황이 단순하지 않습니다.
Flash가 코딩 벤치마크에서 Pro를 앞서고, Pro는 코드 삭제 버그로 GitHub에 50건 이상의 이슈가 쌓인 상태입니다.
“Flash로 제한당했다”는 표현이 적절한지 다시 생각해볼 필요가 있습니다.
개인적으로는 세 가지 변화 중 트래픽 우선순위 조정이 가장 체감 영향이 클 것으로 봅니다.
피크 타임에 무료 유저가 먼저 제한된다는 조항은, 아침 업무 시간대에 CLI 응답이 늦어지거나 끊기는 형태로 나타날 가능성이 있기 때문입니다.
이 부분은 3월 25일 이후 실사용 후기가 쌓여야 정확히 파악됩니다.
결론은 이렇습니다. 코딩 중심 작업에서는 Flash로도 충분히 씁니다.
Pro가 필요한 복잡한 추론이나 멀티모달 작업이 있다면 AI Studio API 키로 전환하거나 AI Pro를 고려하면 됩니다.
그리고 OAuth 우회 방식을 쓰던 경우라면, 지금 바로 정리하는 것이 맞습니다.
본 포스팅 참고 자료
- GitHub google-gemini/gemini-cli 공식 토론 #22970 — https://github.com/google-gemini/gemini-cli/discussions/22970 (2026.03.19 공개)
- Gemini API 공식 모델 문서 — https://ai.google.dev/gemini-api/docs/models?hl=ko (2026.03.10 업데이트)
- Phemex 뉴스 — Gemini CLI Flash 모델 제한 공지 — phemex.com/ko/news/article/… (2026.03.19)
- Vertu — Gemini 3 Flash vs Pro 코딩 벤치마크 분석 — vertu.com/lifestyle/… (2025.12.23)
- 나무위키 Gemini(인공지능 모델) 문서 — namu.wiki/w/Gemini(인공지능모델) (2026.03.20 수정)
본 포스팅은 2026년 3월 21일 기준 공개된 공식 자료를 바탕으로 작성되었습니다.
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다.
최신 정보는 Gemini CLI 공식 GitHub 및 Google AI for Developers에서 확인하시기 바랍니다.


댓글 남기기