Gemini API 공식 업데이트
Gemini API 사용량 등급, $100이면 된다고요?
3월 16일, Google이 Gemini API 사용량 등급 기준을 조용히 바꿨습니다. Tier 2 진입 조건이 $250+30일에서 $100+3일로 낮아졌고, 새로운 Tier 3도 생겼습니다. 문제는 지금 검색하면 나오는 거의 모든 한국어 가이드가 이 변경 전 내용이라는 점입니다. 공식 문서와 개발자 포럼을 직접 확인한 내용을 정리합니다.
Tier 2 조건이 바뀐 것, 대부분 모릅니다
2026년 3월 16일, Google은 Gemini API 공식 문서의 사용량 등급(Usage Tiers) 항목을 업데이트했습니다. 변경 핵심은 Tier 2 진입 조건이 기존 “누적 지출 $250 + 최초 결제 후 30일”에서 “누적 지출 $100 + 최초 결제 성공 후 3일”로 낮아진 것입니다.
(출처: Gemini API Rate Limits 공식 문서, Last updated 2026-03-16 UTC)
💡 공식 문서와 기존 가이드를 같이 펼쳐놓고 비교하니 이런 차이가 보였습니다. 1~2월에 작성된 한국어 블로그와 영문 가이드 거의 전부가 “$250+30일” 기준으로 안내하고 있는데, 이 조건은 이제 정확하지 않습니다.
동시에 이번 업데이트로 Tier 3가 정식 항목으로 추가되었습니다. 기존 문서에서는 “Tier 3: 아직 사용할 수 없으며 곧 제공될 예정”이라고 표시되어 있었는데, 현재는 “누적 지출 $1,000 + 최초 결제 성공 후 30일” 조건을 충족하면 자동 업그레이드 대상이 됩니다.
| 등급 | 변경 전 조건 | 변경 후 조건 (2026.03.16~) |
|---|---|---|
| Free | Google 계정 | Google 계정 (동일) |
| Tier 1 | 결제 계정 연결 | 결제 계정 연결 (동일) |
| Tier 2 ⚡ | $250 + 30일 | $100 + 3일 ✅ 완화 |
| Tier 3 🆕 | 미출시 (예정) | $1,000 + 30일 ✅ 신설 |
출처: ai.google.dev/gemini-api/docs/rate-limits (Last updated 2026-03-16 UTC)
Tier 2 조건이 $250에서 $100으로 낮아졌다는 건, 동일한 API 사용량이라면 Tier 2에 더 빨리 도달할 수 있다는 의미입니다. Gemini 3.1 Flash-Lite 기준 입력 가격이 백만 토큰당 $0.10이니, $100을 채우려면 약 10억 토큰을 사용해야 합니다. 규모 있는 프로젝트라면 2~3주 내에 충분히 도달 가능한 수준입니다.
Free 등급에서 진짜 받는 것과 못 받는 것
(출처: Gemini API 이용약관)
💡 Free 등급과 Tier 1을 나누는 가장 결정적인 차이는 RPM 수치가 아니라 데이터 프라이버시입니다. Tier 1 이상부터는 “Content not used to improve our products”가 적용됩니다. 실사용자 데이터가 들어가는 서비스라면 Tier 1 이상이 사실상 필수입니다.
속도 제한(Rate Limit) 측면에서는 현재 Free 등급의 핵심 수치를 아래와 같이 확인할 수 있습니다. 2025년 12월 이후 기준입니다. (출처: ai.google.dev/gemini-api/docs/rate-limits)
| 모델 | RPM | RPD | TPM |
|---|---|---|---|
| Gemini 2.5 Pro | 5 | 100 | 250,000 |
| Gemini 2.5 Flash | 10 | 250 | 250,000 |
| Gemini 2.5 Flash-Lite | 15 | 1,000 | 250,000 |
출처: Gemini API Rate Limits (2026.03 기준)
RPD 100이라는 수치는 8시간 개발 기준 시간당 약 12회 호출이 가능하다는 뜻입니다. 반복 테스트가 필요한 개발 단계에서 생각보다 빠르게 바닥납니다. r/GeminiAI 커뮤니티에는 “트래픽 피크 시간대에 공식 한도보다 훨씬 낮은 실제 처리량을 경험했다”는 보고도 다수 있으니, 이 수치가 보장치가 아니라는 점도 감안해야 합니다. 참고로 Google 공식 문서에도 “Specified rate limits are not guaranteed and actual capacity may vary”라는 문구가 명시되어 있습니다.
유료 전환 후 실제로 뭐가 달라지는가
Tier 1은 결제 계정을 연결하는 순간 적용됩니다. 별도 심사도, 최소 예치금도 없습니다. 변화는 즉각적입니다. Gemini 2.5 Flash 기준으로 RPM이 10에서 150으로 15배 올라가고, RPD 제한이 사라집니다. 데이터 프라이버시도 “사용 안 함”으로 전환됩니다. 이 변화를 무료로 누릴 수 있다는 것 자체가 많은 사람이 놓치는 포인트입니다. 사용량이 Free 등급 범위 내라면 비용이 그대로 0원이기 때문입니다.
💡 결제 계정 연결이 “돈을 내겠다는 약속”이 아니라 단순한 계정 인증에 가깝게 작동합니다. Tier 1 가입 직후 API 호출을 하나도 안 했다면 청구 금액은 0원입니다. 그런데도 Rate Limit은 Free 대비 최대 30배 올라갑니다.
Tier 1으로 올라가면 Context Caching과 Batch API도 사용할 수 있게 됩니다. Batch API는 실시간 응답이 필요 없는 요청에 한해 토큰당 비용을 50% 낮춰줍니다. 예를 들어 Gemini 3.1 Flash-Lite의 표준 입력 가격은 백만 토큰당 $0.10인데, Batch API 적용 시 $0.05로 내려갑니다. 비동기 처리가 가능한 문서 분석, 데이터 추출 파이프라인이라면 이 하나만으로도 운영 비용을 절반으로 줄일 수 있습니다.
(출처: Gemini API 공식 가격 페이지)
Tier 2 조건 충족했는데 버튼이 안 나타납니다
Tier 2 조건을 충족했다고 해서 자동으로 업그레이드되는 것이 아닙니다. AI Studio의 API Keys 페이지에서 “Upgrade to Tier 2” 버튼이 표시되어야 하는데, 조건을 충족했음에도 이 버튼이 보이지 않는다는 사례가 Google 개발자 포럼에 다수 올라와 있습니다.
⚠️ 실제 포럼 사례 (2026년 3월)
Google 개발자 포럼에서 확인된 내용입니다. 한 사용자는 $330 이상 실제 청구가 완료되었고(프로모션 크레딧 없음), 최초 결제 이후 38일이 경과했음에도 Tier 2 업그레이드 버튼이 표시되지 않았습니다. Google 지원팀은 “우리도 해결책이 없고, 안내해 줄 담당자가 없다”는 답변을 했고, 포럼 다른 사용자들도 동일한 상황을 보고했습니다.
(출처: Google AI Developers Forum, 2026년 3월 8~13일 스레드)
공식 문서에도 이 예외 상황이 명시되어 있습니다. “명시된 자격 기준을 충족하면 일반적으로 승인에 충분하지만, 드물게 검토 과정에서 확인된 다른 요인으로 인해 업그레이드 요청이 거부될 수 있다”는 항목이 있습니다. (출처: ai.google.dev/gemini-api/docs/rate-limits) 즉, $100+3일이 충족되어도 100% 보장은 아닙니다. 빠른 처리량이 필요한 출시 일정이 있다면 이 부분을 사전에 확인해야 합니다.
현재로선 버튼이 표시되지 않을 경우 AI Studio Projects 페이지에서 현재 등급을 확인하고, Google 제공 피드백 양식을 통해 직접 요청하는 방법 외에 공식 에스컬레이션 경로가 없는 상태입니다. (확인 필요: 2026년 3월 16일 이후 정책 변경으로 처리 방식이 개선됐을 가능성 있음)
비용 계산: 한 달에 얼마나 쓸까
공식 가격 기준으로 직접 계산해 볼 수 있는 시나리오 두 가지를 정리했습니다.
(출처: Gemini API 공식 가격 페이지, 2026.03.18 확인)
챗봇 서비스 (하루 200건 대화, 한 달 기준)
대화 1건당 입력 500토큰 + 출력 300토큰 × 3회 교환 기준 월 요청 수: 200 × 30 × 3 = 18,000건. Gemini 2.5 Flash 적용 시:
$$\text{입력 비용} = \frac{18{,}000 \times 500}{1{,}000{,}000} \times \$0.30 = \$2.70$$
$$\text{출력 비용} = \frac{18{,}000 \times 300}{1{,}000{,}000} \times \$2.50 = \$13.50$$
$$\text{월 합계} \approx \$16.20\ (\approx 23{,}000\text{원})$$
같은 작업량을 OpenAI GPT-4o($2.50/$10.00 per 1M)로 처리하면 약 $76.50입니다. Gemini 2.5 Flash가 약 79% 저렴합니다. 다만 이 수치는 공식 표준 가격 기준이며, 실제 사용 패턴에 따라 달라집니다.
문서 처리 파이프라인 (하루 2,000건, Batch API 적용)
문서 1건당 입력 50,000토큰 + 출력 2,000토큰, Gemini 3.1 Flash-Lite (Batch) 적용 시:
$$\text{월 입력} = 2{,}000 \times 30 \times 50{,}000 = 3{,}000{,}000{,}000\ \text{토큰}$$
$$\text{비용} = \frac{3{,}000{,}000{,}000}{1{,}000{,}000} \times \$0.05 = \$150$$
같은 양을 표준(Non-Batch) 가격 $0.10으로 처리하면 $300입니다. Batch API 하나만으로 매달 $150, 연간 $1,800을 절감할 수 있다는 의미입니다. Batch API는 24시간 내 처리를 보장하므로 실시간 응답이 필요 없는 파이프라인에 적합합니다.
2025년 12월에 있었던 일, 다시 생길 수 있습니다
솔직히 말하면, 지금의 등급 조건과 한도가 내일도 같으리라는 보장이 없습니다. 2025년 12월 6~7일, Google은 Gemini API 무료 등급 한도를 사전 공지 없이 대폭 낮췄습니다. Free RPM(2.0 Flash 기준)이 10에서 5로 절반이 됐고, 일 요청 수(RPD)는 500에서 100으로 80%가 줄었습니다. 당시 Google AI Studio PM이었던 Logan Kilpatrick은 “원래 한 주말만 운영할 계획이었는데 몇 달간 유지됐다”고 설명했습니다.
💡 2025년 12월 사태를 무료 등급 문서와 실제 정책 사이의 간극이라는 관점에서 보면, 지금 이 3월 16일 업데이트도 같은 맥락으로 볼 수 있습니다. Tier 2 진입 장벽을 낮춘 것은 Free 등급에서 유료 등급으로의 이동을 유도하는 방향이고, 이는 앞으로도 Free 등급 조건이 더 타이트해질 가능성이 있다는 신호로 읽힙니다.
실제 서비스에 연결된 API라면 Free 등급에만 의존하는 구조는 리스크입니다. Tier 1은 결제 계정만 연결하면 되고, 실사용량이 없으면 비용도 없습니다. 이 구조를 활용해 Tier 1으로 올라두면서 Free 범위 내에서 사용하는 것이 현실적인 방어책입니다. 또한 중요한 워크로드라면 지수 백오프(exponential backoff)와 큐 방식의 재시도 로직을 구현해 두는 것이 갑작스러운 할당량 변경에 대비하는 가장 실질적인 방법입니다.
Q&A
마치며
이번 3월 16일 업데이트에서 가장 실용적인 변화는 Tier 2 진입 문턱이 낮아진 것입니다. $250에서 $100으로 줄어든 것이고, 대기 기간도 30일에서 3일로 짧아졌습니다. 중간 규모 이상 API 활용 프로젝트라면 Tier 2 진입이 훨씬 현실적인 목표가 됐습니다.
막상 써보니 걸리는 부분은 역시 Tier 2 업그레이드 버튼 미표시 문제입니다. 조건을 충족했다고 바로 올라가는 게 아니라 시스템 자동 검토를 거치는데, 이 과정이 투명하지 않고 대응 경로도 명확하지 않습니다. 빠른 스케일업이 필요한 프로젝트라면 충분한 여유를 두고 준비하는 게 맞습니다.
Free 등급은 신용카드 없이 시작하는 데는 여전히 가장 접근하기 쉬운 옵션입니다. 다만 2025년 12월의 전례처럼 무경고 한도 삭감 가능성이 있고, 데이터 프라이버시 조건도 유의해야 합니다. 실제 서비스가 붙는 시점이라면 Tier 1으로 올라두고 사용량 범위 내에서 운영하는 구조가 안정적입니다. 비용은 사용량 이하로 발생하지 않으니 손해가 없습니다.
📚 본 포스팅 참고 자료
※ 본 포스팅은 2026년 3월 18일 기준으로 작성되었습니다. Gemini API의 서비스 정책·가격·UI·기능은 업데이트로 내용이 달라질 수 있습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있으므로, 중요한 결정 전에는 공식 문서를 반드시 재확인하시기 바랍니다.


댓글 남기기