Gemini API / Google AI Studio
Gemini API 무료, API 키 더 만들어도 소용없습니다
2025년 12월 7일, Google이 Gemini API 무료 할당량을 조용히 최대 92% 삭감했습니다. 갑자기 429 오류가 터지기 시작한 건 그 직후부터입니다. 더 황당한 건 API 키를 새로 만들거나 늘려도 한도가 전혀 달라지지 않는다는 점입니다. 이 글에서는 공식 문서와 실제 변경 수치를 바탕으로, Gemini API 무료 할당량의 구조와 실제 한계를 정리합니다.
삭감 이전 vs 이후 — 실제 수치로 보는 차이
2025년 12월 7일 이전에는 Gemini 2.5 Pro 무료 티어에서 분당 최대 50회(RPM 50) 요청이 가능했습니다. 삭감 이후 현재는 분당 5회(RPM 5)가 상한입니다. 하루 허용 요청 수(RPD)도 1,000회 수준에서 100회로 줄었습니다. 90% 감소입니다. (출처: help.apiyi.com, 2026.02.04 / Google AI Studio 공식 Rate Limits 페이지)
| 모델 | 삭감 전 RPM | 현재 RPM | 현재 RPD | 삭감 폭 |
|---|---|---|---|---|
| Gemini 2.5 Pro | 50 | 5 | 100회 | 약 90% |
| Gemini 2.5 Flash | 60 | 10 | 250회 | 약 83% |
| Gemini 2.5 Flash-Lite | 120 | 15 | 1,000회 | 약 88% |
※ 삭감 전 수치는 커뮤니티 및 제3자 보고 기반 추정치. 현재 수치는 2026.03.28 기준 공식 문서 기반. (출처: ai.google.dev/gemini-api/docs/rate-limits)
하루 100회라는 숫자가 체감상 어느 정도인지 계산해보면, PDF 한 페이지씩 처리하는 분석 스크립트를 하루 100번만 돌릴 수 있습니다. 프로토타입 테스트 수준에서도 금방 소진됩니다. Gemini 2.5 Pro를 무료로 사용해 실제 서비스를 운영하려 했다면, 이 수치는 사실상 불가능한 조건입니다.
API 키를 늘려도 한도가 안 늘어나는 이유
429 오류가 뜨면 많은 개발자가 가장 먼저 시도하는 것이 API 키를 새로 만드는 방법입니다. 직관적으로 보이지만, 이건 아무 효과가 없습니다. Google 공식 문서에 딱 이렇게 나옵니다.
“Rate limits are applied per project, not per API key.”
(출처: ai.google.dev/gemini-api/docs/rate-limits, 2026.03.26 업데이트)
할당량은 API 키가 아니라 프로젝트에 붙습니다. 같은 프로젝트 안에서 키를 5개, 10개 만들어도 풀은 하나입니다. 오히려 여러 서비스가 동일 프로젝트의 키를 나눠 쓰면 서로 한도를 잡아먹어 더 빨리 소진됩니다.
💡 공식 문서와 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다
API 키 추가로 우회하려는 시도는 효과가 없는 것을 넘어, 다중 프로젝트를 만들어 할당량 풀을 쪼개는 방식은 Google 서비스 약관 위반 소지가 있습니다. 공식 문서는 이에 대한 제재 가능성을 명시하지 않지만, 커뮤니티에서는 계정 경고 사례가 보고됩니다.
올바른 접근은 단순합니다. AI Studio에서 해당 프로젝트의 실제 적용 한도를 직접 확인하고, 그 한도 안에서 요청 큐를 설계하는 것입니다. 키를 바꾸는 게 아니라 프로젝트 티어 자체를 올려야 합니다.
모델별 현재 무료 한도 전체 정리
공식 문서는 현재 활성 한도를 AI Studio에서 직접 확인하라고 안내합니다. 공개 페이지에서 확인 가능한 수치는 다음과 같습니다. (출처: ai.google.dev/gemini-api/docs/rate-limits, 2026.03.26 / ai.google.dev/gemini-api/docs/pricing)
| 모델 | RPM | RPD | TPM | 적합 용도 |
|---|---|---|---|---|
| Gemini 2.5 Pro | 5 | 100회 | 250,000 | 복잡한 추론, 코드 리뷰 |
| Gemini 2.5 Flash | 10 | 250회 | 250,000 | 일반 챗, 프로토타입 |
| Gemini 2.5 Flash-Lite | 15 | 1,000회 | 250,000 | 경량 분류, 추출, 배치 |
※ RPD 리셋 기준: 태평양 표준시(PST) 자정 = 한국 시간 오후 4~5시. 위 수치는 공개 스냅샷 기준이며 실제 적용값은 AI Studio에서 확인 필요. (출처: ai.google.dev/gemini-api/docs/rate-limits)
무료 단계에서 대부분의 목적에는 Gemini 2.5 Flash가 균형이 가장 좋습니다. 2.5 Pro는 하루 100회라는 한도가 개인 테스트 수준에서도 금방 소진됩니다. 단순 분류·텍스트 추출처럼 경량 작업이 많다면 Flash-Lite로 먼저 처리하고 Pro/Flash 한도는 고난도 요청에만 사용하는 전략이 현실적입니다.
유료로 전환해도 즉시 안 풀리는 상황이 있습니다
결제를 연결하면 Tier 1으로 올라가면서 RPM이 150~300 수준으로 올라가고, RPD 제한도 사실상 해제됩니다. 그런데 유료 전환 직후에도 429 오류가 계속 뜬다는 보고가 커뮤니티에 꾸준히 올라옵니다.
💡 유료 전환 직후에도 한도가 그대로인 이유를 실제 흐름에서 확인했습니다
공식 문서는 Free → Tier 1 전환이 ‘즉시(typically instantly)’ 적용된다고 설명합니다. 하지만 Google 포럼에는 결제 연결 후 24시간이 지나도 쿼터 화면에 여전히 0 RPM, 0 RPD가 표시된다는 사례가 반복적으로 올라옵니다. (출처: Google Gemini 공식 지원 포럼, 2025.12.08) 이는 내가 결제를 연결한 프로젝트와 실제로 API 키를 발급받은 프로젝트가 다를 때 주로 발생합니다.
이 상황에 빠졌다면 점검 순서는 다음과 같습니다. 먼저 AI Studio에서 내가 결제를 연결한 프로젝트와 API 키가 생성된 프로젝트가 동일한지 확인합니다. 다르다면 결제 연결된 프로젝트에서 키를 새로 발급해야 합니다. 그래도 해결되지 않으면 최소 1시간, 드물게는 24시간까지 기다린 뒤 공식 지원에 에스컬레이션하는 것이 현실적입니다.
| 증상 | 가능한 원인 | 대응 |
|---|---|---|
| 결제 후에도 429 지속 | 프로젝트 불일치 | 결제 프로젝트에서 키 재발급 |
| 쿼터 UI에 0 RPD 표시 | 전파 지연 또는 백엔드 이슈 | 최소 1시간 대기 후 재확인 |
| AI Studio는 되는데 앱은 실패 | 환경변수 오류, 구 SDK | 공식 최소 코드로 재검증 |
무료 단계에서 429를 줄이는 현실적인 방법
429는 RPM, TPM, RPD 중 어느 하나라도 초과하면 발생합니다. 어떤 한도를 맞았는지를 먼저 구분해야 대응이 달라집니다. 모든 429에 재시도만 넣으면 RPD가 소진된 경우에는 자정까지 기다려도 해결이 안 됩니다.
① RPM 초과라면 — 지수 백오프
짧은 시간에 요청이 몰렸을 때 발생합니다. 60초 롤링 윈도우 방식으로 리셋되기 때문에, 잠깐 기다리면 회복됩니다. 단순 지연 재시도보다는 지수 백오프(첫 실패 후 1초, 다음 실패 후 2초, 4초 순) 방식이 안정적입니다.
② RPD 소진이라면 — 기다리거나 모델을 분리
Gemini 2.5 Pro의 하루 100회 한도가 다 찼다면, 재시도는 소용없습니다. 한국 시간 오후 4~5시(태평양 표준시 자정 기준)까지 기다리거나, Flash-Lite로 경량 요청을 돌리는 방식이 현실적입니다. Pro의 100회를 아껴두고 Flash-Lite 1,000회를 먼저 소모하는 전략이 실제로 더 오래 버팁니다.
③ 무료 티어의 데이터 활용 조건 확인
무료 티어를 쓰면 입력한 프롬프트와 응답이 Google 제품 및 서비스 개선에 사용될 수 있습니다. (출처: ai.google.dev/gemini-api/terms) 고객 정보, 계약서, 소스 코드처럼 민감한 데이터를 처리하는 경우에는 무료 티어를 쓰는 것 자체가 리스크입니다. 유료 Tier 1 이상에서는 이 조건이 적용되지 않습니다.
Gemini 2.0 Flash를 아직 쓰고 있다면 지금 바꿔야 합니다
많은 튜토리얼이 아직도 Gemini 2.0 Flash 기준으로 작성돼 있습니다. 그런데 Google 공식 deprecations 페이지에 명확히 적혀 있습니다.
⚠️ Gemini 2.0 Flash 계열 지원 종료 일정
- 2026년 3월 3일: 지원 중단 공지 상태로 전환
- 2026년 3월 31일: Gemini 2.0 Flash 이미지 생성 기능 종료
- 2026년 9월 24일: Gemini 2.0 Flash 계열 완전 종료
(출처: ai.google.dev/gemini-api/docs/deprecations, 2026.03.26 기준)
이미지 생성 기능을 Gemini 2.0 Flash 기반으로 사용하고 있다면, 이 글을 보는 시점에서 이미 해당 기능이 종료됐을 수 있습니다. Gemini 2.5 Flash 또는 최신 모델로의 전환이 필요합니다.
💡 “무료니까 좀 더 써보자”는 판단이 왜 비쌀 수 있는지 수치로 봤습니다
무료 한도에 맞춰 재시도 로직, 큐잉, 프로젝트 분리 등 우회 구조를 쌓는 개발 공수가 유료 Tier 1으로 전환하는 비용보다 실제로 더 클 수 있습니다. Gemini 2.5 Flash Tier 1 기준 입력 토큰 100만 개당 $0.075(출처: ai.google.dev/gemini-api/docs/pricing)이고, 일반 텍스트 요청 1,000건에 드는 토큰은 평균 수십만 토큰 수준입니다. 우회 코드를 짜는 데 드는 시간과 비교해볼 만합니다.
Q&A
마치며
Gemini API 무료 할당량은 2026년 3월 현재도 존재합니다. “무료”라는 사실 자체는 맞습니다. 하지만 Gemini 2.5 Pro 기준 하루 100회라는 숫자는, 실제 서비스에 붙이기에는 너무 빠듯합니다. API 키를 늘려봤자 프로젝트 단위 풀은 그대로고, 유료 전환 후에도 즉시 한도가 풀리지 않는 경우가 있습니다. Gemini 2.0 Flash는 이미 종료 수순이고, 공개 문서만 봐서는 내 프로젝트에 현재 정확히 어떤 한도가 걸려 있는지 알 수도 없습니다.
솔직히 말하면, 무료 한도를 우회하는 데 쓰는 개발 시간이 유료 전환 비용보다 더 비쌀 때가 많습니다. “지금은 무료로 버텨보자”는 판단이 옳은 상황과, 그냥 Tier 1으로 올리는 게 더 빠른 상황을 구분하는 것이 결국 더 중요합니다. AI Studio에서 내 프로젝트 실제 한도부터 확인해 보세요. 거기서 판단이 시작됩니다.
본 포스팅 참고 자료
본 포스팅은 2026년 3월 28일 기준으로 작성됐으며, Google Gemini API의 서비스 정책·한도·요금이 이후 변경될 수 있습니다. 최신 정보는 공식 Gemini API 문서에서 확인해 주세요. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다.











댓글 남기기