Gemini API
Gemini API 지출 한도, 설정했는데 10분이 빈틈입니다
2026년 3월 16일, 구글이 Gemini API에 ‘프로젝트 지출 한도’와 전면 개편된 사용량 등급 체계를 내놨습니다. 결론부터 말씀드리면, 이번 기능은 확실히 유용합니다. 다만 공식 문서에 조용히 박혀 있는 조건 하나가 의도치 않은 초과 요금으로 이어질 수 있습니다. 본문에서 정확한 수치와 함께 짚어 드립니다.
이번 발표, 뭐가 달라진 건가요?
구글은 2026년 3월 16일 공식 블로그를 통해 Gemini API에 두 가지 큰 변화를 도입했습니다. 첫 번째는 프로젝트 단위 월 지출 한도(Project Spend Cap)이고, 두 번째는 사용량 등급(Usage Tier) 체계 개편입니다. (출처: Google Blog, 2026.03.16)
이전까지 Gemini API는 지출 상한선을 직접 설정할 방법이 없었습니다. OpenAI나 Azure AI Studio는 이미 수년 전부터 예산 한도를 지원했는데, 구글은 이번에야 이 기능을 도입한 것입니다. 타이밍이 공교롭게도 2025년 8월의 대형 사고 직후라는 점이 눈길을 끕니다.
2025년 8월, Gemini 2.5 Flash 결제 시스템의 버그로 일부 개발자에게 생성하지도 않은 이미지 출력 토큰이 청구됐습니다. 피해액이 $70,000(약 9,800만 원)을 초과한 사례도 있었습니다. (출처: Reddit r/planhub, 2026.03.17 — 구글 공식 발표 배경 설명) 지출 한도는 그 사고로부터 7개월 뒤에 나온 직접적인 후속 대응입니다.
프로젝트 지출 한도, 어떻게 설정하나요?
Google AI Studio 내에서 직접 설정할 수 있습니다. AI Studio → Spend 탭 → Monthly spend cap → Edit spend cap 경로로 이동하면 프로젝트별로 월 지출 한도를 달러 단위로 입력할 수 있습니다. (출처: Google AI Studio 공식 문서, ai.google.dev/gemini-api/docs/billing, 2026.03.16)
설정된 한도는 별도로 변경하거나 해제하지 않는 한 매월 자동으로 유지됩니다. 동일한 결제 계정 아래 여러 프로젝트가 있을 때 각각 다른 한도를 지정할 수 있어서, 테스트 프로젝트와 프로덕션 프로젝트를 분리 관리하는 데 유용합니다.
한도를 설정한 프로젝트를 다른 결제 계정으로 이전하면, 한도 설정 자체는 유지되지만 이미 누적된 지출 금액은 0으로 초기화됩니다. 월 중반에 계정을 이전하면 실질적으로 그 달에는 한도가 처음부터 다시 시작되는 셈이므로, 예상보다 많은 요금이 나올 수 있습니다.
여기서 돈이 빠져나갑니다 — 10분 지연의 실제 의미
지출 한도를 설정했다고 해서 해당 금액에 딱 맞춰 요금이 멈추지는 않습니다. 공식 문서에는 다음 문구가 명시돼 있습니다: “Spend caps have a ~10 minute delay and users are responsible for overages incurred during that period.” 즉, 한도에 도달해도 약 10분 동안은 추가 요청이 계속 처리되며, 그 구간에 발생한 초과 요금은 사용자 책임입니다. (출처: Google Blog, 2026.03.16 / ai.google.dev/gemini-api/docs/billing)
분당 요청이 많은 프로덕션 서비스에서 Tier 2 기준 최대 RPM(분당 요청 수)으로 10분간 계속 요청이 들어올 경우, 10분 집행 지연 구간 동안 수십~수백 달러의 초과 요금이 발생할 수 있습니다. 서비스 레벨에서도 별도의 속도 제한 로직을 추가하는 것이 권장되는 이유입니다.
※ 정확한 초과 금액은 모델·요청 크기·호출 빈도에 따라 다르므로 “추정” 수치임을 전제합니다.
Batch 모드를 쓰는 경우에는 별도로 초과(overage)가 발생할 수 있다는 점도 공식 문서에 명시돼 있습니다. 배치 처리는 한도 적용 시점이 일반 호출과 다를 수 있으니, 자동화 파이프라인에 배치 API를 쓰고 있다면 추가 확인이 필요합니다.
사용량 등급 개편, 진짜로 자동 승격이 되나요?
이번 개편의 또 다른 핵심은 사용량 등급(Usage Tier) 체계 변경입니다. 구글은 공식 발표에서 “Automatic and faster upgrades”를 강조하며, 자격 기준을 충족하면 자동으로 다음 등급으로 승급된다고 설명했습니다. 개편된 등급 기준은 다음과 같습니다. (출처: ai.google.dev/gemini-api/docs/billing, 2026.03.16)
| 등급 | 자격 기준 | 결제 계정 월 한도 |
|---|---|---|
| Free | 가입만 하면 사용 가능 | 해당 없음 |
| Tier 1 | 활성 결제 계정 연결 | $250 |
| Tier 2 | $100 결제 완료 + 첫 결제 후 3일 경과 | $2,000 |
| Tier 3 | $1,000 결제 완료 + 첫 결제 후 30일 경과 | $20,000 ~ $100,000+ |
이전에는 Tier 2 승격에 ‘$250 누적 지출 + 30일’이 요구됐는데, 이번 개편으로 ‘$100 + 3일’로 대폭 낮아졌습니다. 표에서 보이듯 Tier 1 월 한도가 $250으로 설정돼 있는데, 자격 기준이 ‘$100 + 3일’이므로 이론상 한도 도달 전에 Tier 2로 넘어갈 수 있는 구조입니다. 그런데 실제로는 다릅니다.
구글 AI 개발자 포럼에는 “$250를 넘겼는데도 Tier 1에 갇혀 있다”는 보고가 2026년 3월 현재도 이어지고 있습니다. 자동 승격은 서버 측 자동화로 이루어지는데, 이 시스템이 YouTube 계열 악용 방지 시스템과 연동돼 있어 드물게 검토 과정에서 거부될 수 있다고 공식 문서에도 명시돼 있습니다. (출처: discuss.ai.google.dev, 2026.03.18) 자격 기준을 충족했다면 AI Studio 내 ‘Upgrade’ 버튼이 나타나는지 직접 확인하는 것이 가장 확실합니다.
Tier 레벨 한도, 2026.04.01부터 실제 적용됩니다
이번 발표에서 가장 놓치기 쉬운 부분이 여기 있습니다. 결제 계정 전체에 대한 Tier 레벨 한도(Billing Account tier spend cap)는 2026년 4월 1일부터 실제로 집행됩니다. 지금 당장 서비스가 중단되는 게 아니라, 다음 달 1일부터 적용된다는 뜻입니다. (출처: Reddit r/planhub, 2026.03.17 — Google 공식 이메일 공지 기반)
Tier 1 계정이라면 결제 계정 전체 합산 지출이 월 $250에 도달하는 순간 그 계정에 연결된 모든 프로젝트의 API 서비스가 일시 중단됩니다. 4월 1일 전에 지금 월 지출이 $250를 넘는지 Cloud Console 청구 관리 페이지에서 확인해 두는 것이 좋습니다.
- Cloud Console → 결제 계정 관리 → View details on Reports에서 현재 월 누적 Gemini API 지출 확인
- Tier 1($250)을 상시 초과하는 구조라면 Tier 2 기준 충족 여부 먼저 점검
- 여러 프로젝트를 하나의 결제 계정에 묶어 운영하는 경우 합산 지출 기준임을 주의
Vertex AI와 AI Studio, 이 정책이 다르게 적용됩니다
이번 지출 한도 및 사용량 등급 개편은 Google AI Studio를 통한 Gemini API 사용에만 해당됩니다. Vertex AI에서 Gemini를 사용 중이라면 결제 구조와 한도 제어 방식이 완전히 다르며, 이번 정책이 적용되지 않습니다. (출처: Reddit r/planhub 댓글, 2026.03.17 — Canadian AI startups 관련 내용)
같은 구글 클라우드 계정으로 AI Studio와 Vertex AI를 동시에 운영하고 있다면, Vertex AI 쪽 Gemini 비용은 이번 Tier 한도 계산에 포함되지 않습니다. 즉, AI Studio 프로젝트 합산 지출만 Tier 한도 계산에 반영됩니다. 이 구분을 놓치면 Vertex AI 요금이 예상과 다르게 나올 수 있으므로 별도로 관리하는 것을 권장합니다.
| 항목 | Google AI Studio (Gemini API) | Vertex AI |
|---|---|---|
| 프로젝트 지출 한도 | ✅ 적용 | ❌ 미적용 |
| Tier 월 한도 상한 | ✅ 적용 (2026.04.01~) | ❌ 미적용 |
| 자동 Tier 승격 | ✅ 자동 (일부 버그 존재) | 별도 구조 |
| Rate Limit 대시보드 | ✅ AI Studio 내 통합 | Cloud Console 별도 |
자주 묻는 것들
마치며
솔직히 말하면, 이번 업데이트는 늦었습니다. OpenAI와 Azure는 이미 몇 년 전부터 지출 상한 기능을 제공해왔고, Gemini API의 이 기능 부재는 엔터프라이즈 채택을 막는 실질적인 이유 중 하나였습니다. 그 공백이 2025년 8월 $70,000 버그 청구 사건으로 현실에서 터진 것이고, 이번 대응은 그 결과물입니다.
그럼에도 지금 나온 것이 없는 것보다는 분명히 낫습니다. 특히 Tier 자격 기준이 ‘$250 + 30일’에서 ‘$100 + 3일’로 낮아진 건 API를 막 시작하는 팀에 실질적으로 도움이 됩니다. 등급이 빨리 올라갈수록 Rate Limit도 넉넉해지기 때문입니다.
핵심만 다시 짚자면, 지출 한도는 설정만 하면 끝이 아닙니다. 10분 집행 지연이 있고, Batch 모드 초과도 별도입니다. 그리고 Tier 레벨 한도는 4월 1일부터 실제 집행되므로, 지금 AI Studio Spend 탭에서 내 프로젝트 상황을 한 번 확인해 두는 게 좋습니다.
📎 본 포스팅 참고 자료
- Google Blog — Giving you more transparency and control over your Gemini API costs (2026.03.16) blog.google ↗
- Google AI for Developers — Gemini API Billing 공식 문서 ai.google.dev ↗
- Google AI for Developers — Gemini API Rate Limits 공식 문서 ai.google.dev ↗
- Google AI for Developers — Gemini API Changelog ai.google.dev ↗
- Reddit r/planhub — Google finally let developers cap their Gemini API bill (2026.03.17) reddit.com ↗
- Google AI Developer Forum — Billing Update: Gemini API usage tier updates starting Apr 2026 discuss.ai.google.dev ↗
본 포스팅은 2026년 3월 20일 기준으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Gemini API의 요금, 등급 기준, 대시보드 구성은 구글의 업데이트에 따라 달라질 수 있으므로, 최신 정보는 반드시 공식 문서(ai.google.dev)에서 직접 확인하시기 바랍니다.


댓글 남기기