오늘 적용
Gemini CLI 무료 제한, Pro 없어진 게 손해가 아닌 이유
오늘(2026.03.25)부터 Gemini CLI 무료 사용자는 Pro 모델 접근이 차단됩니다. Flash 모델만 남습니다. 개발자 커뮤니티는 반발하고 있지만, 수치를 실제로 들여다보면 이야기가 좀 다릅니다.
오늘부터 실제로 뭐가 바뀌었나
결론부터 말씀드리면 세 가지입니다. 구글 AI 무료 계정으로 Gemini CLI를 사용하면 이제 Gemini Pro 계열 모델(Gemini 3 Pro, Gemini 3.1 Pro 포함)에 접근이 안 됩니다. Flash 모델만 남습니다. 두 번째로, 트래픽이 몰리는 시간대에 무료 사용자는 우선순위에서 밀려 아예 사용이 차단될 수 있습니다. 세 번째로, OpenClaw처럼 서드파티 소프트웨어에서 Gemini CLI의 OAuth를 우회해서 쓰는 방식이 감지되면 계정 정지 대상이 됩니다.
이 변경 사항은 2026년 3월 19일, 구글 Developer Experience 시니어 프로덕트 디렉터 Ryan J. Salva가 GitHub 공식 Discussion(#22970)에 공지한 내용입니다. 공지 이후 약 일주일 만인 오늘 실제 적용이 됐습니다. (출처: Gemini CLI GitHub 공식 공지 #22970)
💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다 — 무료 한도가 “하루 1,000 요청”이라고 공식 문서에 나와 있지만, GitHub 이슈에서 실제 사용자들은 이미 하루 150~250개 수준으로 체감 한도가 줄어들었다고 보고하고 있습니다. 공식 README는 아직 업데이트되지 않았습니다.
Flash로만 쓰게 되는 게 반드시 나쁜 것은 아닙니다. 그 이유는 아래 섹션 3에서 수치로 설명합니다.
변경 배경 — 구글 공식 발표문 요약
공식 발표문에서 구글이 명시한 이유는 두 가지입니다. “서비스 남용 방지(mitigating abuse)”와 “트래픽 우선순위 적용(prioritizing traffic)”입니다. 솔직히 말하면, 짐작되는 맥락이 있습니다. 개발자 커뮤니티에서는 Gemini CLI의 OAuth 인증을 타사 도구에 연결해 무료 Pro 모델을 사실상 무제한으로 우회해 쓰는 방식이 퍼져 있었습니다. ‘OpenClaw’라는 서드파티 도구가 대표적입니다.
실제로 GitHub 토론 스레드에는 “오픈클로 사용자만 차단하면 되는데 왜 다들 피해보냐”는 반응이 많습니다. 구글이 공식 답변에서 개별 사유를 밝히지 않은 부분입니다. 정책 변경의 세부 항목은 아래와 같습니다.
| 항목 | 변경 전 | 변경 후 (2026.03.25~) |
|---|---|---|
| 무료 사용자 모델 접근 | Pro + Flash 혼용 | Flash 모델만 가능 |
| 무료 일일 요청 한도 | 1,000 RPD (공식 문서 기준) | 실사용 기준 약 150~250개 |
| 트래픽 우선순위 | 별도 없음 | 무료 사용자 최하위 |
| 서드파티 OAuth 우회 | 암묵적 허용 | 감지 시 계정 정지 |
(출처: Gemini CLI 공식 GitHub Discussion #22970, 2026.03.19 공지)
Flash만 남았는데 코딩은 오히려 더 잘 된다는 수치
많은 분들이 “Pro 못 쓰게 됐으니 성능이 떨어진다”고 생각하실 텐데, 코딩 작업 기준으로는 그렇지 않습니다. Gemini 3 Flash는 SWE-bench Verified(실제 GitHub 이슈를 AI가 해결하는 벤치마크)에서 78.0%를 기록했고, Gemini 3 Pro는 76.2%입니다. Flash가 1.8%포인트 더 높습니다. (출처: Vertu 벤치마크 비교 분석, 2025.12.23)
이게 코딩에서 중요한 이유는 SWE-bench가 단순한 코드 생성 테스트가 아니라, 실제 프로덕션 저장소의 버그를 여러 파일을 수정해서 고치는 방식이기 때문입니다. 실무와 가장 가까운 벤치마크입니다.
💡 속도도 같이 보면 더 명확합니다 — Flash는 초당 약 218토큰, Pro는 약 73토큰을 처리합니다. 코딩 루프 100번 기준으로 하루 약 30분의 대기 시간 차이가 납니다. 성능도 좋고 속도도 빠릅니다.
| 벤치마크 | Gemini 3 Flash | Gemini 3 Pro | 비고 |
|---|---|---|---|
| SWE-bench Verified | 78.0% | 76.2% | Flash 우세 |
| 처리 속도 (TPS) | 약 218토큰/초 | 약 73토큰/초 | Flash 약 3배 |
| 코드 임의 삭제 이슈 | 거의 없음 | 다수 보고됨 | Flash 안정적 |
| API 토큰 비용 (입력 1M) | $0.50 | $2.00 | Flash 75% 저렴 |
(SWE-bench 출처: Vertu 벤치마크 분석, 2025.12.23 / 가격 출처: Gemini API 공식 가격 문서)
Pro 사용자들이 GitHub에 올린 이슈를 보면 “요청한 것과 관계없는 코드를 통째로 삭제했다”는 사례가 2025년 11월 이후로만 50건 이상 접수됐습니다. Flash는 이런 보고가 훨씬 드뭅니다. 코딩 업무라면 Flash 전환이 나쁘지 않습니다.
요금제별 실제 차이 — Plus 가입해도 “Limited” 취급
이 부분이 가장 헷갈리는 지점입니다. 구글의 요금제는 현재 Plus($13.99/월), Pro($19.99/월), Ultra($249.99/월) 세 가지입니다. 개발 작업을 많이 한다면 Pro 이상부터 의미가 있습니다. 이유는 공식 요금제 비교 페이지에 있습니다.
Google One 공식 페이지의 요금제 비교표를 보면, Gemini CLI와 Gemini Code Assist의 항목이 Plus에는 “Limited”로 표기됩니다. Pro는 “Higher”, Ultra는 “Highest”입니다. 월 구독료를 내고 있어도 Plus 구독자는 CLI 사용에서 상위 두 등급보다 제한됩니다. (출처: Google One 공식 요금제 페이지)
💡 Plus 구독자가 Pro 구독자보다 싸다는 게 당연해 보이지만, 문제는 공지가 이 부분을 명확히 설명하지 않았다는 겁니다. GitHub에서 “나는 유료 구독자인데 Pro 모델 못 쓰는 게 맞나요?”라는 질문이 쏟아진 이유입니다. 구글이 공식 답변을 내놓지 않은 부분입니다.
| 요금제 | 월 구독료 | Gemini CLI 한도 | Pro 모델 접근 | Antigravity |
|---|---|---|---|---|
| 무료 | $0 | Flash만 (약 150~250회) | ❌ | 제한 |
| AI Plus | $13.99 | Limited | △ 한정적 | Limited |
| AI Pro | $19.99 | Higher | ✅ | Higher |
| AI Ultra | $249.99 | Highest | ✅ 최대 | Highest |
(출처: Google One 공식 요금제 비교 페이지, 2026.03.25 기준)
CLI와 Antigravity를 개발 업무에 쓴다면 Pro가 최소 기준입니다. Plus는 Gemini 앱 자체 사용 목적에는 괜찮지만, 터미널 코딩 작업에는 분명한 한계가 있습니다.
무료로 계속 쓸 수 있는 방법은 있나
있습니다. 구글이 공식 권장하는 방법이 있습니다. Google AI Studio에서 개인 API 키를 발급받아 Gemini CLI에 등록하는 방식입니다. 이 경우 Gemini API 무료 등급이 적용되어 Gemini 3 Flash 기준으로 분당 15 요청(RPM), 하루 1,500 요청(RPD)까지 무료입니다. (출처: Gemini API 공식 가격 문서)
OAuth 로그인 방식과의 차이는 두 가지입니다. 첫째, API 키 방식은 학습에 데이터가 이용되지 않습니다. 무료 OAuth 방식은 응답이 학습에 사용될 수 있다고 공식 문서에 나와 있습니다. 둘째, API 키 방식은 내 개인 할당량이 별도로 관리되므로 트래픽이 몰려도 서비스 차단을 덜 받습니다.
API 키 등록 방법 (간단 요약)
① aistudio.google.com 접속 → ② “Get API Key” 클릭 → ③ 키 생성 후 복사 → ④ Gemini CLI 실행 후 gemini --api-key YOUR_KEY 또는 환경변수 GEMINI_API_KEY에 등록
단, Pro 모델(Gemini 3.1 Pro 기준)은 API 무료 등급에서도 2026년 4월 1일부터 유료 전환될 예정입니다. Flash 사용이 목적이라면 API 키 방식으로 무료 유지가 가능합니다.
개발자 커뮤니티 반응과 개인적 소감
GitHub 스레드 반응은 대체로 부정적입니다. “Pro 유료 구독자도 주간 한도에 2시간 만에 걸린다”, “월 140유로 내고도 하루 8시간 이상 ‘이 요청은 시간이 좀 걸립니다’ 오류를 본다”는 불만이 많습니다. Ultra 구독자 중 일부도 이 상황을 비판하고 있습니다.
한편 Claude나 GPT-5.4로 넘어가겠다는 반응도 꽤 있습니다. 실제로 GitHub에서 한 사용자가 “Claude Code로 전환했더니 Gemini CLI보다 빠르고 Pro API 직접 연결이 Max보다 저렴하다”고 후기를 남기기도 했습니다. 개발자 충성도가 높지 않은 서비스의 전형적인 리스크입니다.
개인적으로는 이 정책 변경이 어느 정도는 예고됐다고 봅니다. 구글이 2025년 9월 AI Pro와 Ultra 구독자에게 더 높은 CLI 한도를 부여하는 공지를 낸 시점부터, 무료 등급 축소는 시간문제였습니다. 다만 변경 공지에서 “Google One Premium(일반 유료 구독) 사용자가 어떻게 되는지”를 명확히 밝히지 않은 점은 아쉽습니다.
Q&A
마치며
오늘 변경 사항을 한 줄로 정리하면 이렇습니다. 무료 사용자는 Flash만 쓸 수 있게 됐고, 개발 작업만 놓고 보면 그게 꼭 나쁜 상황은 아닙니다. 하지만 “유료 구독해도 CLI 한도가 불분명하다”는 문제는 여전히 남아 있습니다.
무료 사용자에게 현실적인 대응은 세 가지입니다. 첫째, AI Studio에서 개인 API 키를 발급받아 등록하는 것. 둘째, Flash 모델을 기본으로 사용하되 복잡한 추론 작업은 다른 도구를 병행하는 것. 셋째, 개발 업무가 메인이라면 AI Pro 구독($19.99/월)을 고려하는 것입니다.
구글이 이 정책 변경을 “남용 방지”라고 설명했지만, 실제로는 AI 서비스 전체가 상업적 수익화 단계에 접어들고 있다는 신호로 읽힙니다. OpenAI도, Anthropic도, 이제 구글도 무료 최상위 모델을 유지하는 게 점점 줄어드는 추세입니다. Gemini CLI에 익숙해졌다면 API 키 방식으로 Flash를 쓰는 것이 당분간 가장 합리적인 선택입니다.
본 포스팅 참고 자료
본 포스팅은 2026년 3월 25일 기준으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 요금, 한도, 요금제 구성은 구글 공식 페이지에서 최신 정보를 확인하시기 바랍니다.











댓글 남기기