Gemini API 무료 등급, 이 조건이면 3월 31일이 분기점입니다

Published on

in

Gemini API 무료 등급, 이 조건이면 3월 31일이 분기점입니다

📅 2026.03.25 기준
Gemini API 공식 문서 기준
⚠️ 3월 31일 모델 종료 임박

Gemini API 무료 등급, 이 조건이면 3월 31일이 분기점입니다

결론부터 말씀드리면, 지금 “무료로 Gemini 3 Flash 쓴다”고 생각하고 계신 분은 아닐 가능성이 높습니다. Gemini 3 계열 전 모델은 현재 유료 전용 프리뷰입니다. 게다가 2025년 12월 이후 무료 등급 한도가 조용히 50~80% 삭감됐고, 3월 31일에는 쓰고 있던 모델 자체가 종료됩니다. 이 세 가지가 동시에 겹치는 상황인데 한국어 자료가 없어서 직접 공식 문서를 다 뒤졌습니다.

50~80%
무료 한도 삭감폭
(2025.12.07)
3월 31일
Flash Lite Preview
종료일
0개
Gemini 3.x 시리즈
무료 등급 모델 수

지금 무료 등급에서 쓸 수 있는 모델, 딱 3개입니다

Gemini API 공식 비율 제한 페이지(출처: Google AI for Developers, 2026.03 기준)를 보면 무료 등급에서 접근 가능한 안정화 모델은 세 가지입니다. Gemini 2.5 Pro, 2.5 Flash, 2.5 Flash-Lite가 전부입니다. Gemini 1.5 시리즈도 일부 목록에 남아 있지만 2026년 6월 이전 종료 예정이라 신규 프로젝트에 쓸 이유가 없습니다.

각 모델의 무료 등급 한도를 표로 정리하면 아래와 같습니다.

모델 RPM
(분당 요청)
RPD
(일일 요청)
TPM
(분당 토큰)
Gemini 2.5 Pro 5 100 250,000
Gemini 2.5 Flash 10 500 250,000
Gemini 2.5 Flash-Lite 15 1,000 250,000

(출처: Gemini API 공식 비율 제한 문서 — ai.google.dev/gemini-api/docs/rate-limits, 2026.03 기준)

Flash-Lite가 일일 1,000건으로 가장 넉넉합니다. 단순 분류·추출 작업 중심이면 Flash-Lite를 기본 모델로 두는 게 맞습니다.

▲ 목차로 돌아가기

2025년 12월, 한도가 조용히 반 토막 났습니다

2025년 12월 7일, Google은 Gemini API 무료 등급 한도를 대폭 낮췄습니다. 공식 사유는 “대규모 사기·악용 방지”였습니다. (출처: Gemini API 비율 제한 및 할당량 문서, Firebase AI Logic, 2025.12.07)

💡 공식 발표와 실제 사용자 영향을 같이 놓고 보니 이런 차이가 보였습니다

Home Assistant 자동화, n8n 워크플로우, 개인 챗봇 등 무료 등급으로 “가벼운 프로덕션”을 돌리던 개발자들이 가장 직격탄을 맞았습니다. Gemini 2.5 Pro는 일일 250건에서 100건으로, 일부 보고에 따르면 Flash도 250건에서 20건으로 삭감된 시기가 있었습니다. RPD 재설정은 태평양 표준시 자정 기준이라 한국 시간으론 오후 5시(서머타임 기준) 또는 오후 4시에 초기화됩니다.

이 변화가 눈에 안 띄었던 이유가 있습니다. Google은 공식 비율 제한 페이지에서 구체적인 숫자를 점점 줄이고, 대신 “AI Studio 대시보드에서 직접 확인하세요”라는 방향으로 가고 있습니다. 숫자가 변할 때마다 문서를 고치는 대신 대시보드 확인을 유도하는 방식이라 변경 폭이 잘 안 보이는 겁니다.

한도가 얼마인지 정확히 알고 싶다면 Google AI Studio에 로그인 후 ‘사용량 보기’ 탭에서 직접 확인하는 게 현 시점 가장 정확합니다.

▲ 목차로 돌아가기

3월 31일에 뭐가 꺼지는지 직접 확인했습니다

Gemini API 공식 지원 중단 페이지(출처: ai.google.dev/gemini-api/docs/deprecations, 최종 업데이트 2026.03.11)에 따르면 2026년 3월 31일에 종료되는 모델은 하나입니다.

⚠️ 2026년 3월 31일 종료 모델

gemini-2.5-flash-lite-preview-09-2025

→ 권장 대체 모델: gemini-3.1-flash-lite-preview

이 모델을 코드에 하드코딩해서 쓰고 있다면 4월 1일부터 API 호출이 전부 오류로 떨어집니다. 프로젝트 코드에서 gemini-2.5-flash-lite-preview-09-2025 문자열을 검색해보는 게 먼저입니다.

💡 대체 모델로 넘어가면 무료 등급이 그대로인지 확인해봤습니다

권장 대체 모델인 gemini-3.1-flash-lite-preview는 Gemini 3.x 계열 프리뷰 모델입니다. 현재 공식 비율 제한 페이지 무료 등급 표에 이 모델이 없습니다. 즉, “권장 대체 모델로 바꾸면 된다”는 말이 무료 사용자에게는 그대로 적용되지 않습니다.

추가로 같은 날짜 기준으로 Gemini 2.0 Flash / 2.0 Flash-Lite는 이미 2026년 1월 22일 종료 예고가 떴고, 종료일은 2026년 6월 1일입니다. 아직 2.0 Flash를 쓰는 코드가 있다면 여유가 조금은 있지만, 미뤄두면 또 같은 상황을 반복하게 됩니다.

▲ 목차로 돌아가기

Gemini 3 Flash가 무료라는 말이 왜 반만 맞는지

Gemini 앱이나 Google 검색 AI 모드에서는 Gemini 3 Flash를 무료로 쓸 수 있습니다. 이 부분은 맞습니다. 그런데 API로 접근하는 경우는 다릅니다.

💡 공식 발표문과 실제 API 접근 구조를 같이 놓고 보니 이런 차이가 보였습니다

Gemini 3 Flash(gemini-3-flash-preview)는 2025년 12월 17일 공개됐지만 현재 API 무료 등급 표에 없습니다. Gemini API 공식 가격 페이지(출처: ai.google.dev/gemini-api/docs/pricing)에서 Gemini 3 모델은 “월 5,000회 무료(Google Search 그라운딩 기준)”라는 항목이 있지만, 이는 그라운딩 쿼리에 해당하는 수치이고 일반 텍스트 생성 요청 기준이 아닙니다. 일반 API 호출에 대한 무료 RPM/RPD 항목은 공식 비율 제한 페이지에서 확인되지 않습니다.

Reddit 개발자 커뮤니티에서도 같은 혼선이 있었습니다. 초기에 “무료 할당량 0″이라는 보고가 나왔고, 이후 Google 검색 툴이 활성화된 경우에만 오류가 발생한다는 걸 확인한 사례도 있었습니다. 결국 Gemini 3 Flash는 API에서 유료 결제 계정이 있어야 안정적으로 쓸 수 있는 모델이라는 게 현 시점 개발자들의 공통적인 경험입니다.

기존 블로그들이 “Gemini 3 Flash 출시” 소식만 다루고 실제 API 접근 조건까지 파고든 글이 없다 보니, 이 부분을 모르고 마이그레이션을 시도했다가 당황하는 케이스가 나오고 있습니다.

▲ 목차로 돌아가기

유료로 올라가도 Gemini 3 Pro 한도는 생각보다 빡빡합니다

“결제하면 한도가 100배로 뛴다”는 말은 Gemini 2.5 Flash나 Flash-Lite 같은 안정화 모델 기준으로는 맞습니다. 유료 Tier 1에서 이 모델들은 RPM이 1,000~4,000까지 올라갑니다. (출처: Gemini API Rate Limits, aifreeapi.com, 2026.01.06)

그런데 Gemini 3 Pro Preview(gemini-3-pro-preview)는 다릅니다. 유료 Tier 1에서도 RPD가 250건 수준으로, 무료 등급의 Gemini 2.5 Flash(500건)보다 오히려 적습니다. 이미 결제까지 했는데 일일 250번밖에 못 쓴다면 기대와 다를 수 있습니다.

💡 “유료 = 한도 해제”라는 공식이 프리뷰 모델에는 다르게 작동합니다

Gemini API 비율 제한 체계는 모델 안정화(GA) 여부에 따라 갈립니다. 프리뷰 모델은 안정화 전 테스트 단계이기 때문에, 유료 계정이어도 훨씬 낮은 한도가 적용됩니다. (출처: help.apiyi.com, “Interpreting Google AI Studio Rate Limits 2026”, 2026.01.24)

실제로 Gemini 3.1 Pro Preview는 2026년 2월 19일 출시됐는데, 유료 Tier 1 기준 RPD가 250건으로 보고되고 있습니다. Tier 2는 누적 지출 $250 + 30일 이상 조건을 충족해야 접근 가능하고, Tier 3는 $1,000 + 30일 조건입니다. (출처: Gemini API 비율 제한 공식 문서) 충분한 사용 이력이 쌓이기 전에는 높은 한도를 기대하기 어렵습니다.

▲ 목차로 돌아가기

무료 등급을 최대한 버티는 실용적인 방법 3가지

① 모델 라우팅으로 할당량을 3~5배 늘리는 구조 만들기

단순 분류·요약·짧은 질답은 Flash-Lite(RPD 1,000), 일반 대화·내용 생성은 Flash(RPD 500), 복잡한 추론이 필요한 요청만 Pro(RPD 100)로 보내는 구조입니다. 모든 요청을 Pro로 보내면 하루 100건에서 막히지만, 80%의 요청을 Flash-Lite로 보내면 실질 처리 가능 건수가 수배로 늘어납니다.

② 프롬프트 토큰을 줄이면 분당 처리량이 늘어납니다

무료 등급의 TPM(분당 토큰)은 모든 모델 통틀어 250,000입니다. 시스템 프롬프트가 2,000토큰이면 분당 처리 가능한 요청 수가 실질적으로 줄어듭니다. 시스템 프롬프트를 500토큰 이내로 압축하는 것만으로도 분당 처리량이 눈에 띄게 좋아집니다. 1토큰은 대략 한글 1자, 영문 3~4자 정도에 해당합니다.

③ 429 오류는 지수 백오프로 처리해야 앱이 안 죽습니다

한도를 초과하면 API는 429 RESOURCE_EXHAUSTED 오류를 반환합니다. RPM 한도는 60초 후 초기화, RPD 한도는 태평양 표준시 자정에 초기화됩니다. 재시도 로직 없이 오류를 그냥 던지면 사용자 화면에 그대로 노출되는 구조가 됩니다.

import time, random
from google.api_core.exceptions import ResourceExhausted
def generate_with_retry(model, prompt, max_retries=5):
for attempt in range(max_retries):
try:
return model.generate_content(prompt)
except ResourceExhausted:
if attempt == max_retries - 1:
raise
wait = (2 ** attempt) + random.uniform(0, 1)
time.sleep(wait)

위 패턴은 대기 시간을 1초→2초→4초→8초 순으로 늘리면서 재시도합니다. 레이트 리밋 오류가 나도 앱이 죽지 않게 막아주는 최소 방어선입니다.

▲ 목차로 돌아가기

Q&A — 자주 헷갈리는 것들

Q1. 3월 31일 이후 gemini-2.5-flash-lite-preview-09-2025를 쓰면 어떻게 되나요?

API 호출이 오류로 떨어집니다. 모델 엔드포인트 자체가 종료되기 때문에 응답 대신 에러 코드가 반환됩니다. 코드에서 해당 모델명을 검색해 미리 교체해두는 게 필요합니다. 안정화 버전인 gemini-2.5-flash-lite(종료일 2026.07.22)로 바꾸면 당장의 위기는 피할 수 있습니다. 단, 이 역시 Gemini 3.1 Flash-Lite로 가는 과도기 모델임을 감안해야 합니다.

Q2. Google AI Studio에서는 무료로 Gemini 3 Flash를 쓸 수 있는데, API 키 발급 후 코드에서 호출하면 왜 오류가 나나요?

Google AI Studio 웹 UI에서의 무료 체험과 API 키로 접근하는 무료 등급은 조건이 다릅니다. AI Studio 인터페이스는 데모·테스트 환경에 가깝고, API 무료 등급은 안정화 모델(2.5 시리즈)만 허용합니다. Gemini 3 Flash 프리뷰 모델은 현재 무료 등급 비율 제한 표에 없어 API 호출 시 할당량 오류가 발생할 수 있습니다.

Q3. 결제 계정을 연결하면 Gemini 3 Flash 한도가 어느 정도로 늘어나나요?

유료 Tier 1 기준으로 Gemini 2.5 Flash는 RPM 2,000, 일일 한도는 사실상 무제한으로 늘어납니다. 반면 Gemini 3 계열 프리뷰 모델은 훨씬 제한적이며, Tier 2(누적 지출 $250 + 30일) 이상이 되어야 높은 한도를 기대할 수 있습니다. 결제 계정 연결 즉시 $300 무료 크레딧이 제공되는 Google Cloud 신규 계정이라면 초기 비용 부담 없이 Tier 1을 경험해볼 수 있습니다.

Q4. EU, 영국, 스위스 거주자는 무료 등급을 아예 못 쓰나요?

Gemini API 무료 등급은 EU, 영국, 스위스에서는 데이터 처리 요건으로 인해 사용 불가입니다. 해당 지역에서 API를 쓰려면 결제 계정 연결이 필수입니다. 한국은 이 제한 대상이 아니므로 무료 등급 사용에 지역 제한은 없습니다. (출처: Gemini API Available Regions 공식 문서)

Q5. 무료 등급에서도 멀티모달(이미지·오디오 입력) 기능이 되나요?

됩니다. 무료와 유료 등급 사이에 모델 기능 자체의 차이는 없습니다. 이미지, 오디오, 동영상 입력 모두 무료 등급에서 동일하게 작동합니다. 단, 멀티모달 입력은 텍스트보다 토큰을 훨씬 많이 소모하므로 TPM(분당 250,000토큰) 한도를 더 빠르게 소진할 수 있습니다. 이미지 한 장이 수백~수천 토큰에 해당하기 때문에 한 번에 대용량 파일을 여러 개 넣으면 분당 허용 건수가 급격히 줄어듭니다.

▲ 목차로 돌아가기

마치며

Gemini API 무료 등급을 둘러싼 세 가지 변화가 3월에 한꺼번에 겹쳐 있습니다. 2025년 12월의 한도 삭감, 3월 31일 Flash Lite Preview 종료, Gemini 3 계열이 무료 등급에 없다는 사실. 각각은 이미 공식 문서에 있는 내용이지만 같이 놓고 보면 실제 영향이 꽤 큽니다.

개인적으로 가장 중요한 건 두 번째입니다. 모델이 종료될 때 “권장 대체 모델”이 유료 전용이라면, 무료로 쓰던 기능을 자동으로 유지하는 방법이 없습니다. 그냥 안정화된 2.5 Flash-Lite로 바꾸고 사용 패턴을 다시 점검하는 게 현실적인 선택입니다. 무료 등급의 한계를 일찍 파악할수록 유료 전환 시점을 더 합리적으로 결정할 수 있습니다.

▲ 목차로 돌아가기

📎 본 포스팅 참고 자료

  1. Gemini Developer API 가격 책정 — Google AI for Developers
  2. Gemini 지원 중단 공식 문서 (최종 업데이트: 2026.03.11) — Google AI for Developers
  3. Gemini API 비율 제한 — Google AI for Developers
  4. Gemini API 출시 노트 (Changelog) — Google AI for Developers
  5. Firebase AI Logic 비율 제한 및 할당량 — Google Firebase

본 포스팅은 2026년 3월 25일 기준으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Gemini API 요금, 비율 제한, 모델 지원 중단 일정은 Google의 정책에 따라 예고 없이 변경될 수 있으므로 중요한 결정 전 공식 문서를 직접 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기