Gemini CLI 요금, 무료 1000회라더니 실제로 달랐습니다

Published on

in

Gemini CLI 요금, 무료 1000회라더니 실제로 달랐습니다

2026.03.18 기준
Gemini CLI v0.34.0-nightly 기준
IT / AI

Gemini CLI 요금, 무료 1000회라더니 실제로 달랐습니다

“Google 계정으로 로그인만 하면 하루 1,000회 무료”라는 문구를 보고 Gemini CLI를 설치한 분이 많습니다. 결론부터 말씀드리면, 1,000회는 Flash 모델 기준 숫자입니다. 실제로 2.5 Pro를 쓰면 하루 수십 회에서 막히는 경우가 속출하고 있습니다. Google AI Pro를 유료로 가입해도 선언된 1,500회와 실측값은 다릅니다.

1,000회
무료 일일 한도 (Flash 기준)
100~150회
AI Pro 실측 Pro 모델 한도
250회
API 키 무료 일일 한도

무료 1,000회의 진짜 의미

💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다

GitHub Community Discussion #4122에서 Gemini CLI 팀 관계자가 직접 밝힌 내용이 있습니다. “1,000회 한도는 Flash 모델 기준이며, Gemini 2.5 Pro를 포함한 Pro 계열 모델의 무료 요청은 별도로 훨씬 낮은 한도가 적용된다”는 것입니다. 즉 “1,000회 무료”라는 표현이 “Gemini 2.5 Pro 1,000회 무료”를 의미하지 않습니다.

Hacker News에 올라온 스레드에서도 같은 지적이 나왔습니다. “1,000 Gemini Pro 요청이 아니라, Flash를 포함한 총 모델 요청 1,000회다. Pro는 5~7회 수준일 수도 있다”는 내용이었습니다. 이 수치가 실생활에서 의미하는 바는, 코딩 작업에 Gemini CLI를 적극적으로 쓰는 경우 오전 중에 Pro 모델 한도가 소진된다는 것입니다.

▲ 목차로 돌아가기

인증 방식 3가지와 할당량 차이

인증 방식 일일 한도 분당 한도 비고
Google 계정 로그인 (무료) 1,000회 60회 Flash 포함 전체 모델 기준
Gemini API 키 (무료 등급) 250회 10회 Flash 모델 전용
Vertex AI Express Mode 계정별 상이 계정별 상이 90일 무료, 이후 빌링 필요

출처: Gemini CLI 공식 quota-and-pricing 문서 (2026.03 기준)

여기서 눈에 띄는 점이 하나 있습니다. Google 계정 로그인이 API 키보다 일일 한도가 4배(1,000회 vs 250회) 높습니다. 하지만 API 키 방식은 유료 플랜으로 전환하면 모델과 토큰 수에 따른 종량제로 바뀌어 사실상 한도가 없어집니다. Google 계정 로그인은 유료 플랜으로 올려도 고정 한도 내에서만 움직입니다. 이 구조 차이가 실무에서 상당한 영향을 미칩니다.

▲ 목차로 돌아가기

Google AI Pro 가입해도 막히는 이유

Google AI Pro(월 29,000원, 또는 연간 50% 할인 기간 기준)에 가입하면 Gemini CLI의 일일 한도가 1,000회에서 1,500회로 올라갑니다. (출처: Google for Developers — Gemini Code Assist 할당량 공식 문서, 2026.02.25 업데이트)

💡 선언된 수치와 실제 사용 흐름을 나란히 놓으니 이런 불일치가 보였습니다

2026년 3월 6일자 GitHub Issue #21395에서 Google AI Pro 가입자가 직접 신고한 내용이 있습니다. 버전 0.34.0-nightly 기준으로, 하루 Pro 모델 요청이 100~150회에서 막혔다는 것입니다. /stats model 명령어로 확인하면 “Gemini Code Assist via Google AI Pro” 티어임에도 Flash 1,000회 + Pro 100~150회 구조로 실제 운영된다는 점을 확인할 수 있습니다.

공식 문서는 “1,500회 / 일”이라고 단일 수치만 제시하지만, 실제로는 Flash와 Pro 모델이 각각 다른 하위 한도를 갖습니다. 문서에는 “모델 선택은 Gemini CLI가 자체적으로 결정한다”고만 나와 있습니다. 코딩 작업처럼 추론이 많이 필요한 경우 CLI는 2.5 Pro를 우선 선택하는데, 이 모델만 따지면 AI Pro 가입자도 하루 100~150회 안팎에서 제한을 경험합니다.

계산식으로 표현하면: 무료 사용자의 Pro 모델 체감 한도 ≈ 수십 회, AI Pro 가입자의 Pro 모델 실측 한도 ≈ 100~150회. 공식 선언치 1,500 대비 실제 Pro 모델 가용량은 10% 수준입니다. 월 29,000원을 내면서도 Pro 모델 사용량이 무료 대비 2~3배에 그친다는 의미입니다.

▲ 목차로 돌아가기

API 키 방식이 오히려 유리한 경우

API 키 유료 등급(Pay-as-you-go)으로 전환하는 순간 일일 한도 자체가 사라집니다. Gemini API 요금 기준으로 2.5 Pro는 입력 100만 토큰당 $1.25(20만 토큰 이하), 출력 100만 토큰당 $10.00입니다. (출처: Gemini API 공식 요금 페이지) 일반적인 코딩 프롬프트 한 번이 약 2,000~5,000 토큰이라고 볼 때, 요청 100회 기준 비용은 약 $0.02~0.05 수준으로 추정됩니다. 이는 월 29,000원(약 $20)을 내는 AI Pro와 비교했을 때, 실제로 Pro 모델을 1,000회 이상 사용하는 헤비유저가 아니라면 종량제가 저렴할 수 있습니다.

💡 “무료 한도가 더 많은 쪽이 유리하다”는 기준만으로는 잡히지 않는 구조입니다

Google 계정 로그인 방식은 어떤 유료 플랜을 써도 고정 한도 내에서만 동작합니다. 반면 API 키 방식은 무료 한도가 더 낮지만, 유료 전환 후에는 사실상 한도 없이 토큰 단위 과금이 적용됩니다. 즉, Google 계정 로그인이 무조건 나은 선택이 아닌 것입니다.

Vertex AI Express Mode도 90일 무료 사용 후 빌링을 활성화하면 기업 수준의 동적 공유 할당량을 쓸 수 있습니다. 이쪽은 조직 단위 사용에 더 적합하며, 개인 개발자에게는 API 키 방식이 진입 장벽이 낮습니다.

▲ 목차로 돌아가기

한도 소진 확인하는 법과 대응 전략

/stats model

세션 내 토큰 사용량과 현재 할당량 정보 표시

이 명령어를 실행하면 Flash, Pro, Flash-Lite 각 모델별로 실제 사용된 요청 수를 볼 수 있습니다. GitHub Issue #21395 신고자가 이 방법으로 “Pro 246회, Flash 16회, Flash-Lite 1회인데 이미 한도 초과 오류가 나온다”는 사실을 파악했습니다. 선언치(1,500회)와 실측 동작 사이에 불일치가 있음을 직접 확인한 사례입니다.

한도에 자주 걸린다면 아래 세 가지 대응을 고려할 수 있습니다.

  • 모델 명시 지정: gemini -m "gemini-3-flash" 명령으로 Flash 모델을 직접 지정하면 Pro 한도를 아낄 수 있습니다.
  • API 키 + Pay-as-you-go 전환: 일일 한도 걱정 없이 쓸 수 있고, 실제 비용은 사용량에 비례합니다.
  • Vertex AI Express Mode: 조직 계정이나 Google Cloud 환경이라면 90일 무료 후 빌링 활성화가 현실적 선택지입니다.

▲ 목차로 돌아가기

자주 나오는 질문 5가지

Q1. Gemini CLI는 완전 무료로 쓸 수 있나요?
Google 계정으로 로그인하면 하루 1,000회, API 키 무료 등급은 250회까지 무료입니다. 다만 2.5 Pro 같은 고성능 모델은 이 안에서도 별도의 낮은 하위 한도가 존재해 실제로는 더 적게 쓸 수 있습니다. 무료 범위 안에서 Flash 모델 위주로 사용하면 대부분의 개인 작업에는 충분합니다.
Q2. Google AI Pro 가입하면 Gemini CLI 한도가 얼마나 올라가나요?
공식 문서 기준 1,000회(무료) → 1,500회(AI Pro) → 2,000회(AI Ultra)로 올라갑니다. 그런데 이 수치는 Flash 포함 전체 모델 기준입니다. Pro 모델만 따지면 AI Pro 기준 실측 100~150회 수준이라는 사례 신고가 있습니다(GitHub Issue #21395, 2026.03.06 기준). 공식 확인은 /stats model로 직접 확인하는 것이 정확합니다.
Q3. API 키 방식과 Google 계정 로그인 방식 중 어느 쪽이 나은가요?
무료로만 쓴다면 Google 계정 로그인이 한도가 4배 높습니다(1,000회 vs 250회). 하지만 유료 전환을 고려할 때는 다릅니다. API 키를 Pay-as-you-go로 전환하면 일일 고정 한도가 없어지고 실제 사용량만큼만 과금됩니다. Google 계정 로그인 방식은 유료 플랜을 써도 고정 한도 안에서만 동작합니다.
Q4. Gemini CLI가 한도에 도달했을 때 어떤 오류가 나오나요?
“Rate limit exceeded” 또는 유사한 API 호출 오류가 표시됩니다. 이 시점에서 /stats model 명령어를 실행하면 각 모델별 사용된 요청 수를 확인할 수 있습니다. 한도는 매일 초기화되며, 초기화 시점은 계정에 따라 다릅니다. 즉시 계속 쓰려면 API 키 Pay-as-you-go로 전환하거나 Flash 모델로 낮추는 것이 현실적입니다.
Q5. Vertex AI Express Mode는 개인이 쓰기 적합한가요?
Google Cloud 계정이 이미 있는 개발자라면 90일 무료로 시작해볼 수 있습니다. 한도와 모델은 계정별로 다르게 설정됩니다. 다만 Google Cloud 프로젝트 설정, 빌링 연결 등 초기 설정이 필요하고, 이후 과금 구조가 Vertex AI 단가를 따르기 때문에 일반 개인 개발자보다는 조직이나 팀 단위에 더 적합합니다.

▲ 목차로 돌아가기

마치며 — 숫자가 전부가 아닌 이유

이 사실 자체가 Gemini CLI를 쓰면 안 된다는 의미는 아닙니다. Flash 모델은 빠르고 가볍고, 일상적인 파일 처리·검색·요약에는 충분합니다. Pro 모델이 꼭 필요한 고난도 코딩 작업을 자주 한다면 API 키 Pay-as-you-go가 사실상 유일한 무제한 옵션입니다.

솔직히 말하면, 이 구조를 공식 문서만 읽어서는 파악하기 어렵습니다. 모델별 하위 한도가 명시되지 않은 채 “1,000회” 또는 “1,500회”라는 총합만 표기돼 있기 때문입니다. /stats model 명령어를 습관적으로 확인하고, 내가 어떤 모델을 얼마나 쓰고 있는지 파악하는 것이 현재로서는 가장 실용적인 접근입니다.

▲ 목차로 돌아가기

📚 본 포스팅 참고 자료

  1. Gemini CLI 공식 — Quotas and Pricing (github.com)
  2. Google for Developers — Gemini Code Assist 할당량 공식 문서 (2026.02.25 업데이트)
  3. Gemini API 공식 요금 페이지 (ai.google.dev)
  4. Gemini CLI 공식 — 인증 방법 문서 (github.com)
  5. GitHub Issue #21395 — 선언치 vs 실측 할당량 불일치 신고 (2026.03.06)
  6. Google 공식 — Gemini 앱 한도 및 요금제별 비교 (support.google.com)

⚠️ 본 포스팅은 2026년 3월 18일 기준으로 작성되었습니다. Gemini CLI는 Gemini CLI v0.34.0-nightly 버전을 기준으로 합니다. 본 포스팅 작성 이후 서비스 정책·UI·기능·할당량이 변경될 수 있습니다. 최신 정보는 위 참고 자료 원문을 직접 확인하세요.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기