📅 2026.03.16 기준 / Gemini API 공식 발표 기준
2026년 3월 16일, 구글이 드디어 Gemini API에 지출 한도(Spend Cap)를 도입했습니다. 그런데 막상 공식 문서를 읽어보면 “한도를 설정해도 최대 10분은 초과 청구가 발생한다”는 조건이 붙어 있습니다. Tier별 강제 상한은 4월 1일부터 적용되고, 지금 당장 한도를 안 설정하면 어떤 일이 생기는지 실제 사례와 함께 정리했습니다.
⏰ 4.1 Tier 한도 시행
⚠️ 10분 지연 주의
💸 Tier1 월 $250 상한
지금까지는 청구를 막을 방법이 없었습니다
당시 가능한 방법은 두 가지였습니다. Cloud Billing에서 예산을 설정하고 Pub/Sub와 Cloud Function을 연결해 직접 API를 비활성화하는 자동화 스크립트를 짜는 방식, 또는 Google Cloud Console의 Quota & Limits 탭에서 일일 요청 수(RPD)를 낮추는 방식이었습니다. 전자는 Cloud Billing 데이터가 최대 24~48시간 지연돼서 사실상 실시간 차단이 불가능했고, 후자는 요청 수를 줄이는 것이지 금액을 직접 제한하는 건 아니었습니다. (출처: Reddit r/googlecloud, 2026.03.16 스레드 내 공식 Cloud Billing 문서 인용)
결론부터 말씀드리면, 이 구조가 이번에 바뀌었습니다. 완벽하게 바뀐 건 아닙니다. 하지만 이전과는 다릅니다.
3월 16일에 바뀐 것 두 가지
2026년 3월 16일, Google은 두 가지를 동시에 발표했습니다. 첫째는 프로젝트 지출 한도(Project Spend Cap)이고, 둘째는 Billing Account Tier 강제 상한입니다. 두 개는 별개의 기능이며 작동 방식도 다릅니다. (출처: Google 공식 블로그, 2026.03.16, 원문 링크)
💡 공식 발표문과 실제 설정 흐름을 같이 놓고 보니 이런 차이가 보였습니다
프로젝트 한도는 내가 직접 설정하는 것이고, Tier 상한은 구글이 자동으로 강제하는 것입니다. 전자는 설정 안 하면 적용 안 되고, 후자는 4월 1일부터 설정 여부와 무관하게 모든 계정에 적용됩니다.
프로젝트 지출 한도 (즉시 적용, 2026.03.16~)
AI Studio → Spend 탭 → Monthly spend cap → Edit spend cap 경로로 설정합니다. 프로젝트 단위로 월 최대 지출 금액을 지정할 수 있고, 한도 초과 시 해당 프로젝트의 API 요청이 일시 중단됩니다. 한 계정 아래 프로젝트가 여러 개라면 각각 따로 설정해야 합니다. 설정 안 한 프로젝트는 적용되지 않습니다.
Billing Account Tier 강제 상한 (2026.04.01 시행)
이건 내가 설정하는 게 아닙니다. Tier별로 월 최대 지출 상한이 정해지고, 해당 월에 그 금액을 초과하면 계정 아래 모든 프로젝트의 API 요청이 다음 달 1일까지 중단됩니다. 공식 문서에 명시된 한도는 다음과 같습니다. (출처: Gemini API Billing 공식 문서)
| 사용 등급 | 자격 조건 | 월 지출 상한 (Tier Cap) |
|---|---|---|
| 무료(Free) | 회원가입 | N/A (무료 한도 내) |
| Tier 1 | 결제 계정 연결 | $250 |
| Tier 2 | $100 결제 + 첫 결제 후 3일 | $2,000 |
| Tier 3 | $1,000 결제 + 30일 이상 | $20,000~$100,000+ |
이 수치는 “프로젝트 지출 합산”이 아니라 “청구 계정 전체 합산” 기준입니다. 프로젝트가 10개 있어도 Tier 1이면 월 합산 $250이 상한입니다.
“한도를 설정했는데 청구가 됐다”는 게 어떻게 가능할까요
프로젝트 지출 한도에는 공식적으로 명시된 허점이 있습니다. 구글 공식 블로그 원문에는 이렇게 쓰여 있습니다. “Spend caps have a ~10 minute delay and users are responsible for overages incurred during that period.” 한도가 감지되고 요청이 실제로 차단되기까지 최대 약 10분의 지연이 발생하며, 그 사이에 발생한 초과 청구는 사용자 책임입니다. (출처: Google 공식 블로그, 2026.03.16)
이게 실제로 얼마나 문제가 되느냐는 사용 패턴에 달려 있습니다. 분당 토큰 수(TPM) 한도가 높은 고트래픽 서비스라면, 10분 안에 상당한 금액이 추가로 청구될 수 있습니다. Gemini 3 Pro 기준 입력 토큰 200K 이하 가격은 100만 토큰당 $2, 출력은 $12입니다. (출처: Gemini API 공식 요금 문서) Tier 1 기준 RPM이 2,000, TPM이 400만 토큰인데, 이 속도로 10분을 그냥 흘려보내면 최악의 경우 수십 달러가 추가로 나올 수 있습니다.
💡 “알림 ≠ 차단”이었던 구조가 일부 바뀌었지만, “설정 = 완전 차단”이 된 건 아닙니다
이전에는 예산 알림 이메일이 와도 API가 계속 돌아갔습니다. 이제는 설정된 한도를 초과하면 요청이 멈춥니다. 단, 그 ‘멈춤’이 즉각적이지 않고 최대 10분의 시간차가 있습니다. 또 Batch 모드 완료 건에 대해서는 한도를 초과해도 청구가 발생할 수 있다고 공식 문서에 명시되어 있습니다. (확인 필요: Batch 모드 초과 청구 금액 상한에 대한 공식 수치는 문서에 없습니다)
Tier별 강제 상한, 4월 1일부터 서비스가 멈출 수 있습니다
이 부분이 기존 블로그들이 잘 다루지 않는 내용입니다. 프로젝트 한도는 본인이 설정하지 않으면 적용되지 않습니다. 반면 Tier별 강제 상한은 설정 여부와 무관하게 4월 1일부터 모든 결제 계정에 자동으로 적용됩니다. 즉, 4월 1일 이후에 이미 Tier 1($250 상한)을 넘어서 사용 중인 계정은 그 달 남은 기간 동안 API 요청 전체가 중단될 수 있습니다. (출처: Gemini API Billing 공식 문서 – Tier Spend Caps 항목)
Tier 2($100 결제 + 3일 이상)를 충족한 계정이라면 상한이 $2,000으로 올라갑니다. 하지만 Tier 2 자격을 갖추지 못하고 Tier 1에 머물러 있는데 월 사용액이 $250을 초과하면, 다음 달 1일까지 계정 전체의 API가 멈춥니다. 이건 프로덕션 서비스를 운영하는 팀이라면 사전에 반드시 확인해야 할 변화입니다.
자신의 계정이 현재 어느 Tier에 있는지 확인하는 방법은 간단합니다. AI Studio → Settings → Billing 탭에서 현재 Tier와 월 누적 지출을 볼 수 있습니다. 아직 Tier 1이라면 최근 1~2개월 청구 내역을 확인해서 $250 초과 가능성이 있는지 미리 점검하는 것이 좋습니다.
⚠️ 현재 Tier 1 계정의 3월 청구액이 $250 근처라면, 4월 1일 시행 직후 초과 시 서비스가 중단됩니다. Tier 2 요건($100 결제 + 3일)을 사전에 충족하거나, 프로젝트 한도를 설정해 미리 조절하는 것을 권장합니다. (단, Tier 업그레이드는 자동화됐지만 시스템 처리 지연이 발생하는 사례가 실제로 보고된 바 있습니다 — 출처: Google Developer 공식 포럼, 2026.03.18)
실제로 $128K 청구된 사례가 이 발표 당일에 나왔습니다
구글이 지출 한도를 발표한 날인 3월 16일, Reddit r/googlecloud에는 일본의 한 중소기업이 Gemini API로 약 2,036만 엔(약 1억 4천만 원, 당시 환율 기준 약 $128K)을 청구받아 파산 위기에 처했다는 글이 올라왔습니다. (출처: Reddit r/googlecloud, u/Mobile-Classroom-589, 2026.03.16, 작성 시점 기준 업보트 420개·댓글 207개) 이 타이밍이 묘합니다.
해당 사례에서 이 기업이 사용한 것은 방화벽으로 보호된 내부 도구였고, GitHub 저장소도 비공개였습니다. 3월 12일 오전 4시(JST)에 비정상적인 API 사용이 시작됐고, 당일 업무 마감 전 정기 점검 때 처음 발견했을 때는 이미 7백만 엔 이상이 청구된 상태였습니다. 즉시 API를 중단하고 구글에 연락했지만, 청구는 3월 13일 심야까지 계속 늘어났습니다.
이 사례가 말해주는 것은 두 가지입니다. 첫째, 이번에 도입된 프로젝트 한도가 있었다면 어느 시점에서는 요청이 차단됐을 것입니다. 단, 10분 지연과 그 전에 발생한 초과분은 여전히 책임 대상입니다. 둘째, API 키가 노출된 경로를 알 수 없었다는 점에서, 한도 설정과는 별개로 API 키 보안 관리가 별도로 필요합니다. 키를 주기적으로 교체하고, 사용 모니터링을 설정하는 것이 한도 설정만큼 중요합니다.
💡 한도 도입 발표일에 파산 위기 사례가 동시에 올라온 것은 우연이 아닙니다
구글이 이번 정책을 도입한 이유는 이와 같은 민원과 사용자 압박이 수년간 쌓였기 때문입니다. Reddit 댓글 중에는 “OpenAI, Anthropic, AWS, Azure는 이미 갖고 있는 기능인데 구글만 없었다”는 지적이 여러 개 달려 있습니다. 실제로 같은 스레드에서 개발자들이 공유한 OpenRouter 사용 이유 중 하나도 “지출 한도 없는 Google API는 못 믿겠다”였습니다.
지금 해야 할 설정 순서
정책 변경 내용을 이해했다면, 지금 당장 확인할 것과 설정할 것을 순서대로 정리합니다.
1
현재 Tier 확인
AI Studio → Rate Limit 대시보드에서 현재 계정의 Tier와 해당 Tier의 월 상한을 확인합니다. Tier 1이면 $250, Tier 2면 $2,000이 강제 상한입니다.
2
최근 3개월 청구 내역 확인
AI Studio → Spend 탭에서 프로젝트별 일별 비용을 확인합니다. 월 합산이 현재 Tier 상한에 근접한다면 즉시 Tier 업그레이드 요건 충족 여부를 점검합니다.
3
프로젝트 지출 한도 설정
AI Studio → Spend 탭 → Monthly spend cap → Edit spend cap에서 프로젝트별 월 한도를 설정합니다. 하나의 계정에 프로젝트가 여러 개라면 각각 따로 설정해야 합니다. 한도는 설정 직후부터 적용되며, 초과 시 해당 프로젝트 API가 일시 중단됩니다. (최대 10분 지연 주의)
4
API 키 보안 점검 (별도)
지출 한도와는 별개로, API 키가 GitHub 저장소나 코드에 하드코딩되어 있는지 점검합니다. 키는 정기적으로 교체하고, 환경 변수로 관리합니다. Google AI Studio의 API Keys 페이지에서 키를 비활성화하거나 재생성할 수 있습니다.
※ Tier 업그레이드는 자동화됐지만 처리에 수일이 걸릴 수 있습니다. 공식 포럼에서 “$250 이상 결제했는데 Tier 1에 묶여 있다”는 버그 신고가 2026.03.18 기준으로 접수된 상태입니다. (출처: Google Developer 공식 포럼 discuss.ai.google.dev)
Q&A
Q1. 무료 Tier 사용자는 이번 변경에 영향을 받지 않나요?
무료 Tier에는 Tier 강제 상한(Billing Account tier spend cap)이 적용되지 않습니다. 다만 무료 Tier는 기존의 요청 수(RPM/RPD) 제한을 그대로 유지합니다. 프로젝트 지출 한도 역시 결제 계정이 연결된 프로젝트에만 설정 가능합니다. (출처: Gemini API Billing 공식 문서)
Q2. 프로젝트 한도와 Tier 강제 상한, 둘 다 설정하면 어느 쪽이 먼저 적용되나요?
공식 문서에 따르면 두 한도는 독립적으로 작동합니다. 프로젝트 한도에 먼저 걸리면 해당 프로젝트만 중단되고, Tier 강제 상한에 걸리면 계정 전체가 중단됩니다. 둘 중 먼저 충족되는 조건이 먼저 작동합니다. 프로젝트 한도를 Tier 상한보다 낮게 설정하면, 실질적으로 프로젝트 한도가 주된 제어 수단이 됩니다. (출처: Gemini API Billing 공식 문서)
Q3. API 서비스가 중단되면 다음 달 1일에 자동으로 재개되나요?
프로젝트 지출 한도 초과로 중단된 경우, 다음 달 1일 청구 사이클이 초기화되면 자동으로 재개됩니다. 또는 한도를 올리거나 제거해도 즉시 재개됩니다. Tier 강제 상한 초과도 동일하게 다음 달 1일에 초기화됩니다. (출처: Gemini API Billing 공식 문서)
Q4. Google Cloud Console에서 설정한 기존 예산 알림은 이번 변경과 별개인가요?
네, 별개입니다. Google Cloud Console의 Budgets & Alerts는 여전히 알림만 보내는 방식이며, 자동 차단 기능이 없습니다. 이번에 도입된 AI Studio의 Spend Cap은 AI Studio에서 생성된 프로젝트와 API 키에만 적용됩니다. Vertex AI를 통해 사용하는 경우에는 AI Studio의 지출 한도가 적용되지 않는 것으로 알려져 있으며, 이 부분은 확인이 필요합니다.
Q5. 지금 Tier 1인데, $250을 넘기면 4월 전에도 문제가 생기나요?
Tier 강제 상한 시행은 2026년 4월 1일부터입니다. 그 이전까지는 기존과 동일하게 지출이 $250을 초과해도 API는 계속 작동합니다. 단, 프로젝트 지출 한도는 지금 즉시 설정 가능하고 즉시 적용됩니다. 4월 1일 이후 처음 청구 사이클부터 강제 상한이 적용되므로, 4월 중 $250을 초과하는 순간 그달 나머지 기간 동안 서비스가 중단됩니다. (출처: Gemini API 공식 Billing 문서의 “주의: 등급별 지출 한도는 2026년 4월 1일에만 시행됩니다” 항목)
마치며
솔직히 말하면, 이 기능은 2~3년 전에 나왔어야 맞습니다. OpenAI, Anthropic, AWS, Azure 모두 이미 갖고 있던 기본 기능을 구글은 이제야 도입했고, 그 사이에 여러 개발자와 팀이 예상치 못한 대규모 청구를 경험했습니다. 도입된 것 자체는 환영할 일입니다.
다만 “한도 설정 = 완전 보호”라고 오해하면 안 됩니다. 10분 지연은 고트래픽 서비스에선 여전히 의미 있는 시간입니다. Batch 모드 초과 청구 가능성도 공식적으로 명시되어 있습니다. 그리고 4월 1일 Tier 강제 상한 시행은 생각보다 빠른 변화입니다. 지금 Tier 1에 있고 월 $250에 근접해서 쓰고 있다면 지금 당장 점검할 이유가 있습니다.
API 키 보안 관리는 지출 한도와 별개의 문제입니다. 한도가 있어도 키가 탈취되면 그 10분 안에 상당한 금액이 나갈 수 있습니다. 이 두 가지를 함께 관리하는 것이 현실적인 대응입니다.
📚 본 포스팅 참고 자료
※ 본 포스팅 작성 이후 Gemini API 서비스 정책·UI·기능·요금이 변경될 수 있습니다. 수치 및 정책은 반드시 공식 문서에서 최신 내용을 확인하시기 바랍니다. 본 포스팅은 2026년 3월 19일 기준으로 작성됐습니다.


댓글 남기기