Gemini CLI 무료, 3월 25일부터 달라졌습니다

Published on

in

Gemini CLI 무료, 3월 25일부터 달라졌습니다

2026.03.25 기준 / Gemini CLI 최신 정책 반영

Gemini CLI 무료, 3월 25일부터 달라졌습니다

3월 25일 이후 Gemini CLI를 쓰던 방식 그대로 놔뒀다가 어느 날 갑자기 Pro 모델에 접근이 안 되거나, 반대로 아무것도 달라진 게 없어서 고개를 갸웃한 경험이 있다면, 이 글이 그 이유를 설명해 줄 겁니다. 결론부터 말씀드리면, 바뀐 건 맞지만 모든 무료 사용자가 불이익을 받는 건 아닙니다.

API 키 방식 → Flash 전용 제한
구글 계정 로그인 → 무료로도 Pro 유지
1일 요청 한도 최대 1,000회

무슨 일이 있었나 — 3월 25일 변경 내용

Gemini CLI 팀의 Ryan J. Salva가 2026년 3월 18일 GitHub 공식 Discussion에 공지를 올렸습니다. 핵심은 세 가지입니다. 3월 25일부터 Gemini Pro 모델은 유료 구독자 전용이 되고, 트래픽 우선순위가 구독 등급에 따라 분리되며, OAuth 인증을 써서 제3자 소프트웨어로 무단 접근하는 경우 제재를 받는다는 내용입니다.

공지에 명시된 정확한 문구는 이렇습니다. “Starting March 25, 2026, Gemini Pro models will only be accessible via paid subscriptions. Free tier users will be limited to Gemini Flash models.” (출처: Google Gemini CLI 공식 GitHub Discussion #22970, 2026.03.18) 직역하면 “3월 25일부터 Pro 모델은 유료 구독 전용이며, 무료 사용자는 Flash 모델로 제한된다”는 겁니다.

여기서 많은 사람들이 놓친 게 있습니다. “무료 티어(Free tier)”가 정확히 누구를 가리키는지가 이 공지에 분명하게 정의되어 있지 않다는 점입니다. 실제 적용 결과는 로그인 방식에 따라 완전히 갈렸습니다.

▲ 목차로 돌아가기

로그인 방식에 따라 결과가 완전히 다릅니다

💡 공식 문서와 실제 적용 결과를 같이 놓고 보니 이런 차이가 보였습니다

Gemini CLI에는 세 가지 로그인 방식이 있고, 3월 25일 제한은 이 중 “API 키 방식”에만 직접 적용됩니다. 구글 계정으로 로그인하는 방식은 다른 규칙이 적용됩니다.

Gemini CLI 공식 문서(geminicli.com/docs/resources/quota-and-pricing, 2026.03 기준)에 나와 있는 세 가지 방식을 실제로 정리해 보면 이렇습니다.

로그인 방식 사용 모델 일일 요청 한도 비용
구글 계정 로그인
(Gemini Code Assist 개인)
Pro 포함 약 1,000회 무료
API 키 방식
(Gemini API 무료 등급)
Flash 전용
3월 25일부터
약 250회 무료
Vertex AI (Express) 계정별 상이 계정별 상이 90일 무료 후 청구

구글 계정으로 로그인하는 방식은 Gemini Code Assist 개인 라이선스를 자동으로 받게 되고, 이 라이선스에서는 3월 25일 이후에도 Pro 모델에 접근이 됩니다. 이 구조 때문에, 같은 날 같은 버전의 Gemini CLI를 쓰더라도 누구는 Pro 모델이 되고 누구는 Flash만 뜨는 현상이 생긴 겁니다. 로그인 방식이 다를 뿐입니다.

▲ 목차로 돌아가기

Flash-Lite로 밀려나면 실제로 얼마나 차이가 날까요

API 키 방식을 쓰다가 이번 변경으로 Flash 모델에 귀속된 경우라면, 실제 성능 차이가 궁금할 겁니다. 구글 공식 블로그에서 직접 공개한 벤치마크 수치를 기준으로 말씀드리겠습니다.

구글이 2026년 3월 3일 공개한 Gemini 3.1 Flash-Lite 공식 발표문에는 이런 수치가 나옵니다. Flash-Lite는 GPQA Diamond 86.9%, MMMU Pro 76.8%를 기록했습니다. 반면 BenchLM.ai(2026.03.18)의 교차 비교 기준에서 Gemini 3.1 Pro의 지식 과제 평균은 80.7점, Flash-Lite는 60점이었습니다. (출처: BenchLM.ai, Gemini 3.1 Flash-Lite vs Gemini 3.1 Pro, 2026.03.18) 지식 집약적 작업에서는 3.1 Pro가 평균 20점 이상 앞섭니다.

💡 같은 Flash 계열이라도 Flash-Lite와 3.1 Pro의 쓰임새는 다르게 설계됐습니다

구글은 Flash-Lite를 “번역, 콘텐츠 분류, UI 생성 같은 고빈도 대량 작업”에 최적화된 모델이라고 공식 발표에서 규정했습니다. 코딩, 긴 문맥 추론, 복잡한 분석이 필요한 작업에서는 Flash-Lite보다 Pro급 모델이 적합한 구조입니다.

장문 처리 성능도 다릅니다. verdent.ai의 벤치마크(2026.03.11)에서 FACTS(사실성 지표) 기준으로 Flash-Lite는 40.6%, 3.1 Pro는 50.4%를 기록했습니다. (출처: verdent.ai, Gemini 3.1 Flash-Lite vs Flash vs Pro, 2026.03.11) MRCR v2 장문 추론(128k 토큰)에서는 3.1 Pro 60.1% 대 Flash-Lite 54.3%로 약 6%p 차이가 납니다. 단순 계산이나 요약 수준에서는 체감 차이가 크지 않지만, 긴 문서 분석이나 코드 리뷰에서는 차이가 눈에 띄게 나타납니다.

다만 속도는 Flash-Lite가 훨씬 빠릅니다. Artificial Analysis 벤치마크 기준으로 2.5 Flash 대비 첫 토큰 응답 속도 2.5배, 출력 속도 45% 빠릅니다. 빠른 반응이 중요한 단순 작업에서는 Flash-Lite도 충분한 선택지입니다.

▲ 목차로 돌아가기

무료로 Pro를 계속 쓰고 싶다면 이 방법 하나면 됩니다

정리하면 간단합니다. API 키 대신 구글 계정으로 로그인하면 됩니다. 터미널에서 gemini 명령어를 실행할 때 처음 뜨는 로그인 화면에서 “Login with Google” 옵션을 선택하면 Gemini Code Assist 개인 라이선스가 자동으로 활성화됩니다.

📌 무료 Pro 접근 방법 순서

1

터미널에서 npm install -g @google/gemini-cli 로 설치

2

gemini 명령어 실행 후 “Login with Google” 선택

3

개인 구글 계정으로 인증 완료 → Gemini Code Assist 라이선스 자동 적용

4

/stats model 명령어로 현재 사용 모델과 잔여 한도 확인

이 방법의 한 가지 주의 사항이 있습니다. Google Workspace 계정(조직 소속 계정)으로는 위 방식이 그대로 적용되지 않습니다. 개인 구글 계정(Gmail 개인 계정)만 Gemini Code Assist 개인 라이선스를 무료로 받을 수 있습니다. Workspace 계정 사용자는 관리자가 별도 Code Assist 라이선스를 할당하거나 유료 플랜을 구독해야 합니다. (출처: developers.google.com/gemini-code-assist/resources/quotas, 2026.03 기준)

무료로 받을 수 있는 일일 요청 한도는 약 1,000회입니다. 반면 API 키 방식의 무료 등급은 250회입니다. 구글 계정 로그인이 요청 한도 면에서도 4배 유리한 셈입니다.

▲ 목차로 돌아가기

돈을 쓰면 뭐가 더 달라지나 — 구독 플랜 비교

무료로 쓰는 데 불편함이 없다면 구독 없이도 충분합니다. 하지만 하루 1,000회 한도를 자주 넘기거나, 피크 타임에 응답이 느려지는 경험이 잦다면 구독 전환을 고려해볼 수 있습니다. 3월 25일 변경 이후 구독 플랜과 CLI 사용 한도의 관계를 정리하면 다음과 같습니다.

플랜 월 요금
(한국 기준)
CLI 일일
요청 한도
CLI 모델
무료
(구글 계정 로그인)
₩0 약 1,000회 Pro 포함
Google AI Plus ₩11,000 공식 미공개 Pro 포함
Google AI Pro ₩29,000 약 1,500회 Pro 포함
Google AI Ultra ₩360,000 약 2,000회 Pro + Deep Think

표를 보면 AI Pro(₩29,000/월) 기준으로 무료 대비 일일 한도가 1,000회→1,500회로 늘어납니다. 그런데 솔직히 말하면, 대부분의 개인 개발자 사용 패턴에서 하루 1,000회를 꽉 채우는 경우는 흔하지 않습니다. 무거운 에이전트 작업이나 코드 리뷰 자동화 파이프라인을 돌릴 때 한도가 문제가 된다면 구독을 고려하는 게 맞습니다.

AI Ultra(₩360,000/월)는 Deep Think 모델 접근권이 포함되고 Google Antigravity 에이전트 한도도 최고 수준으로 올라갑니다. CLI만 쓰는 게 목적이라면 Ultra가 아닌 Pro로 충분하고, 영상 생성·NotebookLM 고사양 사용까지 묶어서 쓴다면 Ultra 검토 여지가 있습니다. (출처: gemini.google/kr/subscriptions, 2026.03.28 기준)

▲ 목차로 돌아가기

직접 확인한 것들 — 놓치기 쉬운 함정 2가지

① “무료니까 학습에 쓰인다”는 말, 맞습니다 — 하지만 조건이 있습니다

구글 개인 계정으로 Gemini Code Assist 무료 라이선스를 쓸 경우, Gemini Code Assist 개인정보 처리방침에 따라 프롬프트, 응답, 관련 코드가 수집되고 학습에 활용될 수 있습니다. (출처: Google Gemini Code Assist 개인 이용약관, 개인 정책 항목) 회사 코드나 민감한 내용을 다루는 경우 이 점을 반드시 확인해야 합니다. 유료 기업 라이선스(Code Assist Standard/Enterprise)를 쓰면 별도 데이터 처리 조건이 적용됩니다.

💡 구독 요금을 냈다고 해서 자동으로 CLI 한도가 올라가는 건 아닙니다

Google AI Pro를 구독한 뒤에도 CLI에서 구글 계정으로 재로그인하지 않으면 이전 무료 한도가 그대로 유지됩니다. 구독 후 반드시 CLI를 재실행하거나 gemini /auth로 인증을 갱신해야 변경된 한도가 적용됩니다. Reddit r/GeminiAI 사용자들 사이에서 이 부분을 모르고 “구독 후에도 한도가 안 늘었다”는 혼란이 있었습니다. (출처: Reddit r/googlecloud, 2026.01.28)

② Gemini CLI가 “무료이면서도 Pro”를 주는 건, 처음부터 그 목적으로 설계됐습니다

구글이 2025년 6월 Gemini CLI를 오픈소스로 공개할 때 “개인 구글 계정으로 로그인하면 Gemini Code Assist 무료 라이선스를 받고, 이 라이선스로 Pro 모델과 100만 토큰 컨텍스트 윈도우를 쓸 수 있다”고 명시했습니다. (출처: blog.google, Introducing Gemini CLI, 2025.06.25) 이번 3월 25일 변경은 그 구조를 건드린 게 아니라, API 키 방식 무료 사용자(남용 주체로 지목된 그룹)만 Flash로 격리한 조치입니다. 구글 계정 로그인 사용자는 처음부터 지금까지 같은 조건입니다. 제한이 생긴 게 아니라, 원래 있던 두 방식의 차이가 이번에 더 뚜렷하게 드러난 겁니다.

▲ 목차로 돌아가기

Q&A — 가장 많이 궁금해하는 것들

Q1. API 키로 쓰고 있었는데, 지금 당장 구글 계정 로그인으로 바꿀 수 있나요?

바꿀 수 있습니다. gemini /auth 명령어를 실행하면 로그인 방식을 재선택할 수 있습니다. 기존 API 키로 설정한 환경변수(GOOGLE_API_KEY)가 남아 있으면 이게 우선 적용될 수 있으니, 전환 후에도 여전히 Flash만 뜬다면 해당 환경변수를 삭제하거나 주석 처리하면 됩니다.

Q2. 하루 1,000회 한도는 어디서 확인하나요?

CLI 실행 상태에서 /stats model 명령어를 입력하면 현재 세션 기준 토큰 사용량과 한도를 확인할 수 있습니다. 세션 종료 시에도 요약 정보가 터미널에 출력됩니다.

Q3. Workspace 계정을 쓰는 직장인은 어떻게 해야 하나요?

회사 Google Workspace 계정은 무료 Code Assist 개인 라이선스 대상이 아닙니다. 회사 관리자가 Code Assist Standard 또는 Enterprise 라이선스를 할당해야 CLI에서 Pro 모델을 쓸 수 있습니다. 개인 구글 계정을 병행해서 사용하는 방법은 있지만, 회사 코드를 개인 계정으로 처리하면 데이터 처리 정책 문제가 생길 수 있어 주의가 필요합니다.

Q4. Flash-Lite와 3.1 Pro가 CLI에서 실제로 어떻게 다른가요?

단순한 코드 보완, 짧은 텍스트 요약, 번역 작업에서는 Flash-Lite도 충분합니다. 차이가 뚜렷하게 나는 건 긴 코드베이스 분석, 복잡한 로직 추론, 여러 파일을 동시에 참조하는 에이전트 작업 쪽입니다. BenchLM.ai(2026.03.18) 기준 지식 과제 평균 점수가 Pro 80.7 대 Flash-Lite 60으로, 복잡한 추론 작업일수록 격차가 커집니다.

Q5. 이 정책이 또 바뀔 가능성이 있나요?

구글 공식 지원 페이지에는 “Gemini 앱의 한도는 변경될 수 있으며, 테스트·실험·가용성에 따라 제한될 수 있다”고 명시돼 있습니다. (출처: support.google.com/gemini/answer/16275805) 실제로 무료 등급 Flash 요청 한도는 2025년 하반기부터 꾸준히 축소됐습니다. 구글 계정 로그인 방식의 무료 Code Assist 라이선스도 정책 변경 대상이 될 수 있으므로, 중요한 워크플로에 활용한다면 Google for Developers 위클리 업데이트를 주기적으로 확인하는 게 현실적입니다.

▲ 목차로 돌아가기

마치며

3월 25일 변경 소식을 처음 봤을 때 “이제 Gemini CLI 무료로 못 쓰겠네”라고 생각했다면, 그건 반은 맞고 반은 틀린 겁니다. API 키 방식으로 Pro를 쓰던 사람은 맞게 느낀 거고, 구글 계정으로 로그인해서 쓰던 사람은 달라진 게 없는 게 맞습니다.

개인적으로 이번 변경에서 흥미로웠던 건, 구글이 남용 방지를 명분으로 API 키 방식 무료 사용자를 Flash로 격리하면서, 역설적으로 구글 계정 로그인(데이터 수집 동의)을 하는 사용자에게는 Pro를 유지해 줬다는 구조입니다. 무료를 유지하는 대신 데이터 처리에 동의하는 교환이 더 명확해진 셈이고, 그 구조가 좋은지 나쁜지는 쓰는 사람이 판단할 문제입니다.

결론은 단순합니다. Gemini CLI를 계속 무료로 Pro 수준에서 쓰고 싶다면, 구글 개인 계정으로 로그인하면 됩니다. 이 방식이 불편하거나 데이터 정책이 맞지 않는다면 Vertex AI Express Mode(90일 무료)나 유료 AI Pro 전환이 현실적인 대안입니다.

📚 본 포스팅 참고 자료

  1. Google Gemini CLI 공식 GitHub Discussion #22970 — Service update: mitigating abuse and prioritizing traffic (2026.03.18)
  2. Gemini CLI 공식 문서 — Quotas and Pricing (2026.03 기준)
  3. Google 공식 블로그 — Gemini 3.1 Flash-Lite: Built for intelligence at scale (2026.03.03)
  4. Google Gemini 구독 플랜 공식 페이지 (2026.03.28 기준)
  5. Google for Developers — Gemini Code Assist 한도 공식 문서 (2026.03 기준)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 이 글의 내용은 2026년 3월 28일 기준이며, 구글의 Gemini CLI 정책은 예고 없이 변경될 수 있으므로 최신 정보는 공식 문서를 직접 확인하세요.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기