Gemini CLI v0.22.x 기준
Gemini CLI 무료 제한, 이 조건엔 오히려 API 키가 낫습니다
3월 25일부터 Gemini CLI 무료 티어에서 Pro 모델이 완전히 차단됐습니다. Flash 전용으로 내려앉은 무료 사용자, 그리고 유료 구독자도 똑같이 429 오류에 걸리는 지금 상황 — 공식 GitHub 공지와 실제 수치를 기준으로 정리했습니다.
3월 25일에 정확히 무슨 일이 생겼나 — 공식 공지 원문 해석
Gemini CLI 공식 GitHub 저장소의 maintainer ryanjsalva가 3월 18일 올린 공지가 3월 25일부터 발효됐습니다. 제목은 “Service update: mitigating abuse and prioritizing traffic”이고, 핵심 변경 사항은 세 가지입니다.
📌 공식 공지 핵심 3가지 (출처: GitHub Discussions #22970, 2026.03.18)
- 남용 감지 강화: 서드파티 소프트웨어로 Gemini CLI OAuth를 사용하는 등 약관 위반 패턴이 감지되면 계정 정지 가능.
- 트래픽 우선순위: 라이선스 유형과 계정 상태에 따라 트래픽 처리 순위 차등 적용. 구체적 기준은 공개되지 않았습니다.
- 무료 티어 모델 제한: 2026년 3월 25일부터 Pro 모델은 유료 구독자 전용. 무료 사용자는 Flash 모델만 사용 가능.
이 변경이 조용히 넘어가지 못한 건 타이밍 때문입니다. Gemini 3.1 Pro가 2월 19일에 출시됐는데, 무료 사용자는 이 최신 Pro 모델을 단 한 번도 무료로 못 써보고 Flash로 내려앉은 셈이 됐습니다.
공지 직후 GitHub에는 259개의 댓글이 달렸고, 가장 많이 추천받은 반응은 “these changes may require some planning = Switch to Codex”였습니다. 개발자들의 체감 온도가 어느 정도인지 직접 알 수 있습니다.
유료를 내도 429가 뜨는 이유가 있습니다
💡 공식 공지와 실제 사용자 보고를 같이 놓고 보니 이런 차이가 보였습니다.
매달 구독료를 내는 Google AI Pro 사용자들이 3월 25일 이후 GitHub에 쏟아낸 불만의 핵심은 이겁니다: “유료인데 왜 무료랑 똑같이 막히나?”
GitHub Issue #23900에는 “3월 24일까지는 완벽하게 됐다. 25일부터 갑자기 모든 요청에 429가 뜨고 응답도 매우 느려졌다”는 AI Pro 구독자의 보고가 올라왔습니다. HuggingFace 포럼에 3월 26일 올라온 분석에는 “유료 사용자도 무료 사용자와 동일한 경험을 하고 있다. 이것은 시스템적 실패”라는 결론이 나옵니다. (출처: HuggingFace Discuss, Google Gemini CLI’s Rate Limiting Crisis, 2026.03.26)
왜 이런 일이 생기냐면, 공지에 적힌 “라이선스 유형에 따른 우선순위”의 구체적인 기준이 공개돼 있지 않습니다. 트래픽 폭주 시 어느 요금제까지 보호받는지 구글이 공식 답변을 내놓지 않은 부분입니다.
더 당혹스러운 건 모델 자동 다운그레이드 문제입니다. Pro 모델이 한도에 걸리면 CLI가 사용자에게 알리지 않고 자동으로 Flash로 전환합니다. 코드를 다 짜고 나서야 Flash로 생성됐다는 걸 알게 되는 경우가 생깁니다. GitHub Issue #1847에서는 개발자들이 “이 자동 전환 동작은 기본값이 아니라 선택 가능한 옵션이어야 한다”고 강하게 주장하고 있습니다. (출처: github.com/google-gemini/gemini-cli/issues/1847)
정리하면, 무료 사용자에게는 Pro 접근이 막혔고, 유료 사용자에게는 “우선순위”가 보장된다고 했지만 실제로는 트래픽 폭주 시 구별이 없는 상황입니다. 유료 구독자 입장에서 납득하기 어렵습니다.
Flash 모델 150회, 실제로 얼마나 버티나
공식 나무위키 수치로는 무료 기준 분당 60회, 하루 1,000회입니다. 그런데 GitHub에서 한 사용자(@sigmaSd)가 “요즘은 1,000회가 아닌 것 같다. 250회도 안 된다”고 지적했고, maintainer가 Pro 사용 시 전체 카운트에 합산된다는 점을 시인했습니다. 또 다른 사용자(@Jufralice)는 “Flash 모델 기준으로는 실제 150회/일”이라고 명시했습니다. (출처: GitHub Discussions #22970 댓글, 2026.03.19)
| 항목 | 공식 발표 수치 | 실사용 보고 수치 |
|---|---|---|
| 무료 일일 요청 한도 | 약 1,000회 | 약 150~250회 |
| 무료 분당 요청 한도 | 60회/분 | 60회/분 (유지) |
| 무료 사용 가능 모델 | 3월 25일 이전: Pro+Flash | 3월 25일 이후: Flash만 |
| 유료(AI Pro) 일일 한도 | 약 1,500회 | 트래픽 폭주 시 동일 오류 |
출처: 나무위키 Gemini 모델 항목 (2026.03.27), GitHub Discussions #22970
Claude Code나 OpenAI Codex는 애초에 무료 구독 없이는 CLI 자체를 못 쓰는 구조입니다. Gemini CLI가 경쟁 우위로 내세운 유일한 차별점이 “무료로 Pro까지 쓸 수 있다”는 것이었는데, 그게 사라진 겁니다.
Flash 전용 150회라는 건, 함수 하나를 짜다 막히고, 디버깅 한두 번 하면 하루 치가 끝난다는 뜻입니다. 진지한 개발 세션에서 버티기 어렵습니다.
AI Studio API 키가 지금 상황에선 더 나은 이유
💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다.
Gemini CLI 공식 공지에 조용히 적혀있지만 잘 주목받지 못한 문장이 있습니다: “to get direct control over your own quotas and billing, use Gemini CLI with your own paid API key from AI Studio or Vertex AI.” (출처: GitHub Discussions #22970, ryanjsalva, 2026.03.18)
이게 무슨 의미냐면, 구글 OAuth 계정 인증 방식이 아닌 개인 API 키를 CLI에 등록하면 별도의 개인 할당량이 적용됩니다. 공유 인프라가 아닌 나만의 할당량 풀로 작동한다는 뜻입니다.
AI Studio API 키의 무료 등급 한도는 Gemini 1.5 Pro 기준 RPM 2회, RPD 50회입니다. 적어 보이지만 결정적인 차이가 하나 있습니다 — Pro 모델에 직접 접근 가능합니다. (출처: ai.google.dev/gemini-api/docs/rate-limits, 2025.02 기준 페이지)
💡 AI Studio API 키 등록 방법 (3단계)
- aistudio.google.com 접속 → “Get API key” 클릭
- 터미널에서
gemini config set api_key <YOUR_KEY>실행 - 모델 선택:
gemini config set model gemini-2.5-pro
무료 API 키는 RPD 50회라 하루 사용량이 매우 적지만, 결제 계정을 연결하면 RPM이 1,000회까지 올라가고 일일 한도도 사라집니다. Google Cloud 300달러 무료 크레딧을 활성화하면 초반에는 사실상 무료로 Pro 모델을 쓸 수 있는 구조입니다.
특히 혼자 개발하는 경우에는 OAuth 계정 공유 풀을 쓰는 무료 CLI보다 개인 API 키가 더 안정적입니다. 공유 트래픽 폭주에 영향을 받지 않습니다.
Google AI Plus 구독자가 가장 애매한 위치에 있습니다
이번 정책 변경에서 사각지대가 생겼습니다. 공지에는 “Pro 또는 Ultra 구독자는 Pro 모델 접근 가능”이라고 나와 있는데, Google AI Plus(월 200GB, AI Pro보다 저렴한 요금제)는 어떻게 되는지 명시가 없습니다.
GitHub에서 사용자 @robinhaggqvist가 “Plus는 무료도 아니고 Pro/Ultra도 아닌데, 어떻게 되는 거냐”고 질문했고, 이에 대한 공식 답변은 아직 나오지 않았습니다. (출처: GitHub Discussions #22970, 2026.03.20)
구글 공식 요금제 비교표를 직접 확인해보면, AI Plus 기준 “Gemini Code Assist 및 Gemini CLI: Flash 및 Pro 모델 전반에서의 일일 모델 요청”이 “제한(Limited)”으로 표기돼 있습니다. Plus는 Pro보다 낮은 수준이지만 무료보다는 접근이 있다는 뜻인데, 정확한 수치는 공개되지 않았습니다. (출처: one.google.com/intl/ko_kr/about/google-ai-plans/, 2026.03.29 기준)
⚠️ Plus 구독자에게 필요한 사항
CLI에서 gemini model list 실행 후 현재 인식되는 모델 목록을 직접 확인할 것. Pro 모델이 목록에 있으면 접근 가능한 상태입니다.
매달 돈을 내고 있는데 내가 어떤 모델을 쓸 수 있는지 명확하지 않다는 건 분명한 문제입니다. 이 부분은 구글이 빠르게 정리해야 할 사항인데, 현재로서는 직접 테스트해보는 것 외에 확인할 방법이 없습니다.
지금 선택지를 정리하면 이렇습니다
상황을 정리하면 현재 Gemini CLI 사용자가 선택할 수 있는 경로는 네 가지입니다.
무료 유지 (Flash)
일일 실사용 한도 약 150회. 가벼운 작업이나 테스트에만 적합.
AI Studio API 키 (무료)
Pro 모델 접근 가능. RPD 50회로 적지만 300달러 크레딧 활용 가능.
Google AI Pro 구독
Pro 모델 접근 + 더 높은 한도. 단, 피크 시간대 429 오류 여전히 발생 가능.
타 서비스 전환
Claude Code(Pro 구독 필요), Codex 등. 안정성 우선 시 고려할 만합니다.
솔직히 말하면, 지금 이 시점에서 가장 실속 있는 선택은 API 키 방식입니다. 구독 없이도 Pro 모델을 쓸 수 있고, 개인 할당량이라 공유 트래픽에 영향받지 않습니다. 처음 설정이 약간 번거롭지만 한 번만 해두면 됩니다.
다만 Flash 모델만으로도 충분한 작업이라면 굳이 바꿀 이유가 없습니다. Flash와 Pro의 실제 코딩 품질 차이는 복잡한 추론이 필요한 작업에서 드러납니다. 간단한 함수 작성이나 텍스트 처리라면 Flash도 충분합니다.
Q&A
마치며
Gemini CLI가 Claude Code나 Codex와 달랐던 이유는 딱 하나, 무료로 최신 Pro 모델을 쓸 수 있다는 점이었습니다. 그게 3월 25일부로 없어졌습니다.
이 변경이 단순히 무료 사용자에게만 영향을 주는 게 아니라는 게 지금 논란의 핵심입니다. 유료 구독자도 공유 인프라 문제를 똑같이 겪고 있고, Google AI Plus 사용자는 자신이 어느 위치인지도 불명확한 상황입니다.
HuggingFace 포럼의 표현을 빌리면 “모델 성능이 좋다는 것과 그 모델을 안정적으로 쓸 수 있다는 건 다른 이야기”입니다. 지금 Gemini CLI는 전자는 맞지만 후자는 맞지 않습니다.
개인적으로는, 무료 사용자라면 지금 당장 AI Studio API 키를 CLI에 등록해두는 게 가장 실용적인 대응입니다. 구독을 고려 중이라면, 429 오류 문제가 구조적으로 해결되는지를 좀 더 지켜보고 결정하는 게 낫습니다.
본 포스팅 참고 자료
- Gemini CLI 공식 GitHub 공지 — Service update: mitigating abuse and prioritizing traffic
https://github.com/google-gemini/gemini-cli/discussions/22970 - Google One 공식 AI 요금제 비교 페이지
https://one.google.com/intl/ko_kr/about/google-ai-plans/ - Gemini API 비율 제한 공식 문서 (Google AI for Developers)
https://ai.google.dev/gemini-api/docs/rate-limits?hl=ko - HuggingFace Discuss — Google Gemini CLI’s Rate Limiting Crisis
https://discuss.huggingface.co/t/google-gemini-clis-rate-limiting-crisis - 나무위키 Gemini(인공지능 모델) — CLI 섹션 (2026.03.27)
https://namu.wiki/w/Gemini(인공지능_모델)
※ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 본문 내 수치와 정책은 2026년 3월 29일 기준으로 확인된 공식 자료를 바탕으로 작성됐으며, Gemini CLI 업데이트에 따라 달라질 수 있습니다.











댓글 남기기