Gemini API 무료 등급, 이 조건에서만 살아남습니다

Published on

in

Gemini API 무료 등급, 이 조건에서만 살아남습니다
2026.03.20 기준
Gemini API 공식 문서 기반
2026-03-16 업데이트 반영

Gemini API 무료 등급,
이 조건에서만 살아남습니다

공식 Rate Limits 문서 기준 — 무료로 쓸 수 있는 것과 없는 것을 직접 정리했습니다.

2.5 Pro 무료 일일 한도
100 RPD
Tier 1 월 지출 한도
$250
12월 무고지 삭감
최대 92%↓

결론부터 — 무료 등급, 지금도 쓸 수 있습니다. 단 이 범위 안에서만

Gemini API 무료 등급은 2026년 3월 기준으로도 살아있습니다. Gemini 2.5 Pro는 하루 100번, 분당 5번 호출 가능하고, 2.5 Flash는 하루 250번, Flash-Lite는 하루 1,000번까지 무료입니다. (출처: Google AI for Developers 공식 Rate Limits 문서, 2026-03-16 업데이트)

솔직히 말하면, 이 숫자만 보면 “충분하겠네” 싶습니다. 그런데 막상 써보면 다릅니다. 2025년 12월에 아무 예고 없이 한도가 80~92% 삭감된 전례가 있고, 2026년 3월 16일에는 유료 전환 후에도 월 $250(Tier 1 기준)을 초과하면 당월 서비스가 중단되는 지출 한도 제도가 새로 도입됐습니다. 무료 등급은 공식적으로 “모델을 잠깐 테스트하는 용도”로 정의돼 있고, 지속적인 프로덕션 운용을 위한 것이 아닙니다. 이 글에서는 그 경계선이 정확히 어디인지를 짚겠습니다.

💡 공식 문서와 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다 — Rate Limits 문서는 조용히 2026-03-16에 갱신됐는데, 이번에 지출 한도 개념이 새로 명문화됐습니다. 기존 블로그 대부분은 이 부분을 빠뜨리고 있습니다.

2025년 12월, 갑자기 사라진 2.5 Pro 무료 접근

2025년 12월 7일, 개발자들의 앱이 갑자기 429 오류를 뱉기 시작했습니다. 공지도 없었고 설명도 없었습니다. AI Studio에서 확인해보니 Gemini 2.5 Pro가 무료 tier에서 아예 사라져 RPD가 0으로 표시됐고, 2.5 Flash도 하루 250건에서 20건으로 92% 삭감됐습니다. (출처: PiunikaWeb, 2025.12.08)

이 부분이 핵심입니다. Google AI Studio Product Lead Logan Kilpatrick이 Reddit 커뮤니티 스레드에 직접 남긴 발언을 보면, “2.5 Pro 무료 접근은 원래 단 하나의 주말만 열어두려 했던 것”이라고 밝혔습니다. 몇 달간 사용해오던 개발자들에게 이 발언은 충격이었습니다. 그는 이어서 “무료 tier는 모델을 잠깐 테스트해보고, 잘 맞으면 유료로 넘어가게 하는 것이 목적이며, 지속적인 프로덕션 의존은 의도한 바가 아니다”라고 못 박았습니다. (출처: PiunikaWeb, 2025.12.08 인용 Logan Kilpatrick 발언)

💡 이 발언은 무료 tier를 프로덕션에 쓰는 것이 기술적 한계가 아닌 정책적 의도에 의해 제한된다는 것을 의미합니다. 즉, 언제든 다시 삭감될 수 있고, 예고 없이 진행된 전례가 이미 있습니다.

참고로 Google은 같은 시기에 유료 Tier 1에서도 Gemini 3 Pro에 대한 하루 요청 수를 10,000건에서 300건으로 대폭 줄였습니다. 이유로는 TPU 용량을 Gemini 3.0 Pro와 Nano Banana Pro에 배분해야 한다는 점과, Tier 1에서 대규모 사기·남용이 있었다는 점을 들었습니다.

API 키 여러 개 만들면 한도 늘어날까요?

많은 개발자가 시도하는 방법입니다. 같은 Google 계정에 API 키 3개, 5개를 생성하면 한도가 늘어날 것 같은 느낌이 듭니다. 결론부터 말씀드리면 전혀 효과가 없습니다.

공식 문서는 이를 명확히 못 박고 있습니다. “Rate limits are applied per project, not per API key.” 즉, 쿼터는 API 키가 아닌 프로젝트(Google Cloud Project) 단위로 적용됩니다. 같은 프로젝트 아래서 키를 100개 만들어도 전체 합산이 그 프로젝트의 쿼터 하나를 공유합니다. (출처: Google AI for Developers Rate Limits 공식 문서, 2026-03-16)

⚠️ 실질적으로 한도를 늘리려면 별도의 Google Cloud 프로젝트를 새로 만들어야 합니다. 단, 이 경우 각 프로젝트별로 결제 계정이 분리되어 관리가 복잡해지고, Google 정책상 악용으로 감지될 경우 계정 전체가 제한될 수 있습니다(확인 필요: Google Abuse Monitoring 정책 적용 범위).

또 하나의 흔한 오해는 “Google AI Studio에서 직접 쓰는 건 API와 별개”라는 것입니다. 맞습니다. AI Studio 직접 사용(브라우저에서 프롬프트 입력)은 API 쿼터와 분리됩니다. 그러나 코드로 API를 호출하는 순간부터는 동일한 프로젝트 쿼터를 소모합니다. 단, 유료 API 키가 프로젝트에 연결돼 있으면 AI Studio에서의 직접 사용도 과금 대상이 됩니다. (출처: Google AI for Developers Billing 공식 문서)

2026년 3월 개편 — 지출 한도가 생겼습니다

2026년 3월 16일, Gemini API 공식 Rate Limits 문서가 조용히 업데이트됐습니다. changelog에 기록된 문구는 “개선된 사용량 등급 및 결제 계정 지출 한도 도입”입니다. (출처: Gemini API changelog 공식 문서, 2026-03-16 항목)

이게 왜 중요하냐면, 유료로 전환해도 무한정 쓸 수 있는 게 아니라는 뜻이기 때문입니다. 공식 Billing 문서에 따르면 Tier별 월 지출 한도(Billing Account tier spend caps)는 다음과 같습니다.

사용 등급 자격 요건 월 지출 한도
Free Google 계정 가입 없음 (무료)
Tier 1 결제 계정 활성화 $250 / 월
Tier 2 누적 $100 결제 + 최초 결제 후 3일 경과 $2,000 / 월
Tier 3 누적 $1,000 결제 + 최초 결제 후 30일 경과 $20,000~$100,000+ / 월

(출처: Google AI for Developers Billing 공식 문서)

💡 Tier 2 승급 조건에서 생각보다 걸리는 지점이 있습니다 — 많은 사람이 “결제 등록하면 바로 Tier 2″로 알고 있지만, Tier 2는 누적 $100 + 3일, Tier 3는 누적 $1,000 + 30일이 필요합니다. 고부하 사용을 시작하자마자 Tier 1의 $250 한도에 걸릴 수 있고, 그 달에는 서비스가 중단됩니다.

Tier 1에서 $250/월이면 어느 수준의 사용량인지 따져보면, Gemini 2.5 Pro 기준 입력 토큰 $1.25/100만 토큰, 출력 토큰 $10.00/100만 토큰입니다. 일반적인 대화 요청 1건당 약 2,000 출력 토큰이라고 가정하면 $0.02/건입니다. $250으로 계산하면 약 12,500건 호출 시 한도에 도달하는 셈입니다. 하루 약 400건의 2.5 Pro 유료 호출로 한 달 만에 Tier 1 한도가 소진됩니다. 이 수치가 의미하는 것은 사용자 수십 명이 동시에 쓰는 서비스를 Tier 1로 운영하는 건 현실적으로 불가능하다는 것입니다.

모델별 실제 무료 한도 비교

2026년 3월 기준 무료 등급에서 사용 가능한 주요 모델의 한도를 정리하면 다음과 같습니다. (출처: Google AI for Developers Rate Limits 공식 문서, 2026-03-16 업데이트)

모델 RPM
(분당 요청)
RPD
(일일 요청)
TPM
(분당 토큰)
Gemini 2.5 Pro 5 100 250,000
Gemini 2.5 Flash 10 250 250,000
Gemini 2.5 Flash-Lite 15 1,000 250,000
Gemini 3 Flash/Pro
(gemini-3-*)
무료 없음

일일 쿼터 초기화 시각: 태평양 표준시(PST) 자정 기준 / 한국 기준 오전 17시(서머타임 적용 시 16시)

여기서 짚어야 할 포인트가 있습니다. Gemini 3 계열(gemini-3-flash-preview, gemini-3-pro-preview)은 무료 tier 접근이 아예 없습니다. 공식 가격 문서를 보면 Gemini 3 Flash나 Gemini 3 Pro의 무료 항목은 비어 있습니다. 2.5 시리즈가 최신 성능을 유지하는 한 당분간 문제없지만, 시간이 지날수록 최신 모델은 유료 전용으로 운영하는 패턴이 고착화되고 있습니다.

💡 Flash-Lite의 1,000 RPD는 하루 약 42건/시간에 해당합니다. 단순한 분류나 요약 자동화 워크플로우라면 무료 범위 내에서 운영 가능하지만, RPM 한도가 15로 묶여 있어 순간 집중 호출이 많은 구조에서는 병목이 생깁니다.

유료로 넘어갈 때 실제로 얼마가 나올까요?

결제 계정을 연결하면 즉시 Tier 1이 됩니다. 이 시점부터 과금이 발생하는데, Gemini 2.5 Pro 기준 공식 가격은 입력 토큰 200K 이하 $1.25/100만 토큰, 출력 토큰 200K 이하 $10.00/100만 토큰입니다. (출처: Gemini API 공식 가격 문서)

이를 바탕으로 일반적인 코딩 어시스턴트 사용 시나리오를 직접 계산해보면 아래와 같습니다.

📐 계산 예시 — Gemini 2.5 Pro 하루 50건 호출, 건당 평균 3,000 출력 토큰

  • 일일 출력 토큰: 50건 × 3,000 = 150,000 토큰
  • 일일 입력 토큰 (추정 1,000 토큰/건): 50건 × 1,000 = 50,000 토큰
  • 일일 비용: (150,000 / 1,000,000 × $10) + (50,000 / 1,000,000 × $1.25) = $1.5625 / 일
  • 월 비용 추정: $1.5625 × 30 ≒ 약 $46.9 / 월

※ 입력 토큰 1,000 토큰/건, 출력 토큰 3,000 토큰/건 기준 추정치. 실제 사용 패턴에 따라 달라집니다.

월 $46.9라면 Tier 1의 $250 한도 내에서 운영 가능합니다. 그런데 이 수치가 의미하는 바가 중요합니다 — 하루 50건도 안 되는 경량 개인 사용이라면 무료 2.5 Pro 100 RPD 안에 이미 들어갑니다. 즉, 유료 전환이 반드시 필요한 시점은 하루 100건(2.5 Pro 기준)을 넘는 순간이고, 그 전에는 무료 범위 안에서 충분히 소화됩니다.

💡 단, 무료 등급에서는 본인의 프롬프트와 응답이 Google 제품 개선에 활용될 수 있습니다. 유료 전환 후에는 이 데이터 활용이 차단됩니다. 업무용 민감 데이터를 다루는 경우라면 이 조건이 유료 전환 결정에서 요금보다 더 중요할 수 있습니다. (출처: Google AI Billing 공식 문서 Terms of Service 조항)

자주 물어보는 것들

무료 등급에서 컨텍스트 창(1M 토큰)을 다 쓸 수 있나요?

기술적으로는 1M 토큰 컨텍스트 창이 무료 등급에서도 접근 가능합니다. 단, RPM(분당 5건)과 RPD(일 100건) 한도 내에서만 호출이 가능하고, TPM(분당 25만 토큰) 한도도 존재합니다. 한 번의 요청으로 수십만 토큰을 사용하면 TPM 한도에 먼저 걸릴 수 있습니다.

일일 한도(RPD)는 언제 초기화되나요?

공식 문서 기준으로 RPD는 매일 태평양 표준시(PST) 자정에 초기화됩니다. 한국 기준으로는 서머타임 없을 때 오후 5시, 서머타임 적용 시 오후 4시입니다. 초기화 전에 한도에 달한 경우 이 시간까지 대기해야 합니다.

Tier 1 지출 한도 $250을 초과하면 어떻게 되나요?

해당 결제 계정 아래 연결된 모든 프로젝트의 서비스가 그 달이 끝날 때까지 일시 중단됩니다. 서비스가 살아있는 경우라면 월 초에 한도가 초기화될 때까지 기다리거나, Tier 2 승급 조건(누적 $100 + 3일)을 충족해 자동 승급되기를 기다려야 합니다. 단 Tier 승급은 자격 충족 후 10분 내 자동 적용됩니다(Free→Tier 1은 즉시).

무료로 쓰면 내 프롬프트가 Google 학습에 사용되나요?

공식 문서에 따르면 무료 등급에서는 프롬프트와 응답이 Google 제품 개선에 활용될 수 있습니다. 유료 결제 계정을 연결하면 이 데이터 활용이 제한됩니다(Terms of Service ‘Paid Services’ 조항 적용). 업무용 민감 데이터나 개인정보가 포함된 프롬프트를 다루는 경우라면 유료 전환이 권장됩니다.


Gemini CLI는 내부적으로 Gemini API를 호출합니다. 따라서 연결된 프로젝트의 API 쿼터를 동일하게 소모합니다. 2026년 3월 6일 changelog에 “Gemini CLI에서 Plan mode 사용 가능”이 추가된 만큼, CLI 사용량이 늘어날수록 같은 무료 한도를 빠르게 소진할 수 있습니다.

마치며 — 무료 등급은 ‘입장권’이지 ‘자리’가 아닙니다

Gemini API 무료 등급은 지금도 충분히 유용합니다. 개인 프로젝트 테스트, 소규모 자동화, 학습용 코드 실험이라면 하루 100~1,000건 범위 안에서 충분히 쓸 수 있습니다. Flash-Lite의 1,000 RPD는 특히 범용성이 높습니다.

그런데 이걸 프로덕션에 얹을 생각이라면, 2025년 12월의 무고지 삭감 사태와 Logan Kilpatrick의 발언을 다시 떠올릴 필요가 있습니다. 무료 tier는 “모델을 잠깐 맛보는 곳”이고, 그 정의 자체가 언제든 한도 조정의 근거가 됩니다. 2026년 3월 개편으로 유료 Tier도 지출 한도 개념이 생긴 만큼, Tier 승급 조건과 월 지출 한도를 사전에 정확히 파악하고 설계하는 것이 손해를 줄이는 현실적인 방법입니다.

주관적으로는, 무료 한도를 넘는 순간의 가격 단절이 꽤 크게 느껴집니다. Flash-Lite는 무료에서 하루 1,000건이지만, Tier 1으로 넘어가면 $0.40/100만 출력 토큰으로 비용이 발생합니다. 낮은 가격이긴 해도, ‘무료였다가 갑자기 과금’이라는 경험은 관리하지 않으면 예상 외 청구로 이어집니다. AI Studio에서 지출 알림과 프로젝트 지출 한도를 미리 설정해두는 것을 강하게 권합니다.

본 포스팅은 2026년 3월 20일 기준 공식 문서를 바탕으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능·요금이 변경될 수 있습니다. Gemini API 관련 최신 정보는 Google AI for Developers 공식 문서에서 직접 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기