2026.03.25 정책 기준 / Gemini CLI v0.38.x 기준
그런데 2026년 3월 25일 이후, 그 전제가 완전히 바뀌었습니다.
무료 계정은 Flash 모델로만 제한되고, Pro 모델은 유료 구독이 있어야만 열립니다.
여기서 끝이 아닙니다 — OAuth를 통해 Gemini CLI 무료 쿼터를 우회하던 서드파티 툴들도 동시에 막혔습니다.
3월 25일 전: 무료로 Pro를 쓸 수 있었던 구조
(출처: Google for Developers 블로그, 2025.06.25)
이 정책 덕분에 많은 개발자들이 Gemini CLI를 Claude Code나 OpenAI의 GPT CLI보다
비용 면에서 훨씬 유리한 선택지로 봤습니다.
특히 흥미로운 점이 있었습니다. Gemini CLI가 OAuth 인증을 통해 Google 계정과 연동되는 구조였기 때문에,
Continue, Cline 같은 VS Code 확장 툴들이 Gemini CLI의 OAuth 인증을 그대로 활용해서
Pro 모델에 접속할 수 있었습니다.
공식적으로 별도 API 키를 발급받지 않아도 Gemini Pro를 VS Code 안에서 무료로 쓸 수 있는
우회 경로가 열려 있었던 셈입니다.
이 구조는 사실상 Google이 의도하지 않은 방향으로 사용되고 있었고,
무료 쿼터 남용이 누적되면서 결국 3월 25일 정책 변경으로 이어졌습니다.
Ryan J. Salva(Gemini CLI 제품 책임자, Google 개발자 경험 수석 이사)가
직접 GitHub Discussion(#22970)에 세 가지 변경사항을 공지했습니다.
(출처: google-gemini/gemini-cli GitHub Discussions #22970, 2026.03.18)
3월 25일 이후: 3가지 변경사항 수치 비교
변경사항은 크게 세 갈래입니다. 하나씩 전후를 직접 비교하면 이렇습니다.
| 항목 | 3월 25일 이전 | 3월 25일 이후 |
|---|---|---|
| 무료 모델 접근 | Pro 포함 | Flash 전용 |
| Pro 접근 조건 | Google 계정 로그인 | 유료 구독 필수 ($19.99/월 이상) |
| 트래픽 우선순위 | 동일 | 구독 등급별 차등 (피크 시간 제한 가능) |
| OAuth 제3자 툴 | 사실상 허용 | 남용 감지 시 계정 제한 |
① 무료 계정, 하루 요청 건수는 그대로인데 모델이 달라집니다
개인 Google 계정(Gemini Code Assist for Individuals)으로 로그인하면
하루 1,000건의 요청 한도는 유지됩니다. 숫자만 보면 변한 게 없는 것 같지만,
그 1,000건이 Flash 모델로만 채워진다는 게 핵심입니다.
(출처: geminicli.com/docs/resources/quota-and-pricing/, 2026.03.26)
코드 리뷰나 복잡한 리팩터링처럼 추론 품질이 중요한 작업에서 Flash와 Pro의 차이는
체감 수준으로 나타납니다.
② API 키 무료 티어는 하루 250건, Flash 전용으로 확정
Google 계정 로그인(1,000건)보다 4배 낮습니다.
Pro 모델 접근은 불가하고, Flash 계열만 사용할 수 있습니다.
(출처: geminicli.com/docs/resources/quota-and-pricing/, 2026.03.26)
이 수치를 알고 있어야 실제 워크플로에서 방식 선택이 달라집니다.
💡 공식 발표문과 실제 요금 페이지를 같이 놓고 보니 이런 차이가 보였습니다.
무료 한도 건수(1,000건)는 그대로지만 모델 등급이 낮아졌습니다.
숫자 변경이 없으니 변경됐다는 걸 눈치채기 어렵습니다.
많은 사용자들이 “여전히 1,000건 쓸 수 있다”고 착각하는 포인트가 바로 이겁니다.
서드파티 툴이 함께 막힌 이유
이번 정책 변경에서 가장 주목할 지점은 ‘제3자 소프트웨어 남용 탐지 강화’입니다.
공식 발표문(GitHub Discussion #22970)은 이렇게 표현합니다:
“서드파티 소프트웨어가 Gemini CLI의 OAuth 인증을 무단으로 활용하는 행위를 차단하며,
위반 계정은 제한 조치를 받습니다.”
실제 피해가 보고된 사례도 있습니다. 2026년 2월부터 이미 유료·Ultra 티어 사용자들이
오픈소스 CLI 툴을 사용하다 계정이 즉시 차단되는 사태가 발생했고,
Google 개발자 포럼에는 “Urgent: Mass 403 ToS Bans” 스레드가 열렸습니다.
(출처: discuss.ai.google.dev, 2026.02.20)
유료 사용자인데도 제3자 툴 연동 이력이 잡히면 차단되는 상황이었습니다.
💡 기존 포스팅 대부분은 “무료 한도 줄었다”에서 끝납니다.
그런데 실제 개발 환경에서 더 즉각적인 문제는 VS Code 확장이나 자동화 스크립트가 갑자기 403을 뱉는 것입니다.
이 둘이 연결된 이유가 바로 OAuth 남용 탐지 정책 때문입니다.
어떤 툴이 영향을 받나요?
Continue, Cline, Open WebUI, LM Studio의 Gemini 연동 설정 등이 해당합니다.
이 방식으로 설정한 경우, 3월 25일 이후 Pro 모델 요청이 자동으로 Flash로 강등되거나
403 응답을 받게 됩니다. 자신이 쓰는 툴의 인증 방식이 ‘Gemini CLI OAuth’인지
‘직접 발급 API 키’인지 지금 바로 확인해 봐야 합니다.
4월 1일 AI Studio 무료 티어도 바뀌었다
3월 25일 Gemini CLI 변경에서 한 발 더 나아가, 4월 1일에는 AI Studio 무료 티어까지 개편됐습니다.
(출처: ai.google.dev/gemini-api/docs/pricing, 2026.04 기준)
Flash 계열은 무료 티어에 그대로 남아있습니다.
개인 프로젝트나 학습 수준의 사용에서는 충분한 한도입니다.
(출처: ai.google.dev/gemini-api/docs/pricing)
Flash가 대부분의 작업에서 Pro의 85~90% 수준을 커버한다는 게 Google 측 설명이기도 합니다.
| 모델 | 무료 티어 | 하루 한도 | 유료 입력 가격 |
|---|---|---|---|
| Gemini 3.1 Pro | ✗ 없음 | 유료만 | $2.00/1M tok |
| Gemini 2.5 Pro | △ 제한적 | 약 100건 | $1.25/1M tok |
| Gemini 2.5 Flash | ✓ 무료 | 약 250건 | $0.25/1M tok |
| Gemini 2.5 Flash-Lite | ✓ 무료 | 약 1,000건 | $0.10/1M tok |
※ 수치는 2026년 4월 기준. (출처: ai.google.dev/gemini-api/docs/pricing)
지금 선택할 수 있는 경로 3가지
현재 상황에서 Gemini CLI를 계속 활용하고 싶다면 세 가지 경로가 있습니다.
경로 1
Google 계정 로그인 유지 (무료 Flash 1,000건/일)
가장 간단합니다. 개인 Google 계정으로 로그인하면 하루 1,000건의 Flash 요청을 무료로 쓸 수 있습니다.
Pro 기능이 없더라도 간단한 코드 완성, 질문 응답, 문서 요약 수준이라면 충분합니다.
단, 제3자 툴 연동은 삭제하거나 자체 API 키로 교체해야 합니다.
경로 2
Google AI Pro 구독 ($19.99/월, 하루 1,500건 + Pro 모델)
Pro 모델이 반드시 필요한 작업이 있다면 Google AI Pro가 가장 직접적인 선택입니다.
하루 1,500건의 요청과 함께 Gemini Pro 계열 모델에 접근할 수 있습니다.
(출처: geminicli.com/docs/resources/quota-and-pricing/)
월 $19.99는 경쟁사 대비 합리적인 수준입니다. Claude Pro는 월 $20, OpenAI Plus는 월 $20입니다.
경로 3
API 키 유료 전환 (Pay-as-you-go) + Vertex AI
대규모 자동화 워크플로나 팀 단위 사용에서는 API 키 기반 유료 전환이 더 유연합니다.
(출처: ai.google.dev/gemini-api/docs/pricing)
월 $250 이하로 쓸 수 있다면 Tier 1 한도 안에서 안정적으로 운영할 수 있습니다.
Flash만으로 얼마나 버틸 수 있을까
솔직히 말하면, Flash 모델에 대한 기존의 인식이 바뀌고 있습니다.
“Flash는 라이트 작업용”이라는 생각이 자연스러웠지만,
Google 공식 문서에는 Gemini 2.5 Flash가 “1M 토큰 컨텍스트 윈도우를 가진 하이브리드 추론 모델”로 명시돼 있습니다.
단순 텍스트 완성뿐 아니라 추론 기능(thinking budget)도 지원합니다.
(출처: ai.google.dev/gemini-api/docs/pricing)
실제로 해외 개발자 커뮤니티에서는 “2.5 Flash가 이전 Pro보다 낫다”는 의견도 나옵니다.
복잡한 멀티스텝 코딩이나 장문 문서 분석에서 Pro와 Flash의 차이가 나지만,
일상적인 코드 설명, 단위 테스트 생성, 짧은 문서 요약 작업에서는 Flash로 충분한 경우가 많습니다.
다만 대규모 코드베이스를 통째로 분석하거나 복잡한 추론이 필요한 작업에서는
여전히 Pro와의 품질 차이가 체감됩니다.
💡 “Flash는 Pro의 열화판”이라는 통념과 달리,
2.5 Flash는 1M 토큰 컨텍스트와 thinking 기능을 갖춘 모델입니다.
작업 유형에 따라 Pro를 고집할 이유가 생각보다 많지 않을 수 있습니다.
무료 유지를 우선시한다면, Flash로 전환 후 실제 품질을 테스트해보는 게 순서입니다.
Q&A 5가지
마치며
그 전제가 3월 25일로 공식적으로 끝났습니다.
숫자만 보면 무료 한도(1,000건)가 그대로인 것처럼 보이지만, 모델 등급이 내려왔다는 사실을
눈치채지 못하고 쓰던 방식을 유지하는 경우가 많을 것 같습니다.
제 판단은 이렇습니다.
대부분의 개발 작업에서 Flash로 전환하고, 꼭 Pro가 필요한 시점에만 유료를 쓰는 방식이
현재 구조에서 가장 현실적인 접근입니다.
2.5 Flash의 1M 토큰 컨텍스트는 생각보다 넓고, thinking 기능도 됩니다.
무조건 Pro를 고집할 이유가 줄어든 게 사실입니다.
서드파티 툴 연동 방식을 아직 정리하지 못한 상태라면, 지금이 점검 타이밍입니다.
OAuth 우회 방식은 계정 차단 리스크가 있고, 직접 발급 API 키 방식으로 바꾸는 게 안전합니다.
본 포스팅 참고 자료
- Google Gemini CLI 공식 서비스 업데이트 발표 (Ryan J. Salva, GitHub Discussion #22970) — github.com/google-gemini/gemini-cli/discussions/22970
- Gemini CLI 공식 쿼터 및 요금 문서 — geminicli.com/docs/resources/quota-and-pricing/
- Google Gemini API 공식 요금 페이지 (2026.04 기준) — ai.google.dev/gemini-api/docs/pricing
- Google 개발자 포럼: Mass 403 ToS Bans 관련 스레드 — discuss.ai.google.dev
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다.
이 글은 2026년 3월 25일~4월 기준 공식 발표 및 공식 문서를 근거로 작성됐습니다.

댓글 남기기