Gemini API 지출 한도, 이 조건에서만 막힙니다

Published on

in

Gemini API 지출 한도, 이 조건에서만 막힙니다

2026.03.16 기준
Gemini API / Google AI Studio

Gemini API 지출 한도,
이 조건에서만 막힙니다

2026년 3월 16일, 구글이 드디어 Gemini API에 월별 지출 한도(Project Spend Cap) 설정 기능을 공식 출시했습니다. 개발자들이 몇 년 동안 요청해온 기능입니다. 그런데 공식 문서에는 한도를 설정해도 초과 청구가 발생하는 조건이 명시돼 있습니다. 이 부분을 먼저 짚고 넘어가야 실제로 쓸 수 있습니다.

$70,000+
2025년 8월 피해 최대 금액
~10분
지출 한도 적용 지연 시간
Tier 2
진입 조건이 바뀌었습니다

Gemini API 지출 한도, 정확히 뭐가 바뀐 건가요?

2026년 3월 16일 구글이 Google AI Studio에 Project Spend Cap(프로젝트 지출 한도)을 공식 도입했습니다. 개발자가 AI Studio의 Spend 탭 → Monthly spend cap 항목에서 프로젝트별로 월 최대 지출 금액을 설정할 수 있는 기능입니다. (출처: Google Blog, 2026.03.16)

기존에는 Gemini API를 사용하다가 요금이 폭증해도 막을 방법이 없었습니다. OpenAI나 Anthropic은 이미 하드 리밋 기능을 제공하고 있었는데, 구글만 유독 이 기능이 없었습니다. 구글 자신도 이번 발표에서 “other platforms in the industry(업계의 다른 플랫폼)”와 비교하며 뒤늦은 도입임을 사실상 인정했습니다.

설정 방법은 간단합니다. Google AI Studio → 왼쪽 메뉴 Spend 탭 → Monthly spend cap에서 금액을 입력하면 됩니다. 한도는 프로젝트 단위로 별도 설정이 가능해서, 여러 프로젝트를 운용하는 경우 각각 다른 한도를 걸 수 있습니다. 한 번 설정하면 수동으로 변경하거나 해제하기 전까지 자동 유지됩니다.

한도를 설정해도 청구가 되는 상황이 있습니다

⚠️ 공식 문서에 명시된 주의사항 (출처: Google Blog, 2026.03.16)

“Spend caps have a ~10 minute delay and users are responsible for overages incurred during that period.”

→ 지출 한도 적용에는 약 10분 지연이 있으며, 그 사이 발생한 초과 요금은 사용자가 부담합니다.

이 10분이 생각보다 크게 작동합니다. 2025년 8월 결제 버그 당시, 한 개발자는 API 키를 삭제한 뒤에도 20분 만에 $200이 추가로 청구됐다고 보고했습니다. 높은 처리량으로 API를 쓰는 애플리케이션이라면, 10분 동안 수천 번의 요청이 발생할 수 있습니다. Gemini 3.1 Pro 기준으로 입력 토큰 100만 개당 $2.00이므로, 대용량 컨텍스트를 반복 처리하는 서비스라면 10분 안에 한도 금액을 훌쩍 넘을 수 있다는 의미입니다. (출처: Gemini API Pricing 공식 문서)

💡 공식 발표문에서 “10분 지연”과 실제 2025년 8월 버그 사례를 같이 놓고 보면 이런 차이가 보였습니다.

지출 한도는 청구 오류를 막는 기능이 아닙니다. 오류가 발생하더라도 한도 금액 + 최대 10분치 추가 비용까지는 청구될 수 있습니다. 한도 설정은 손실을 줄이는 기능이고, 손실을 0으로 만드는 기능은 아닙니다.

실무적으로는 한도 금액을 넉넉하게 잡되, 실제 예산보다 낮게 설정하는 방식이 현실적입니다. 예를 들어 월 예산이 $500이라면 지출 한도를 $300~$350 수준으로 설정하면, 10분 지연 구간에서 나오는 초과분이 발생하더라도 전체 지출이 예산을 크게 벗어나지 않습니다.

이미지 생성 안 했는데 $70,000이 나온 이유

이번 지출 한도 기능이 왜 이제야 나왔는지를 이해하려면, 2025년 8월 사건을 알아야 합니다. 2025년 8월 23일 전후로 Gemini API를 사용하는 개발자들의 청구 금액이 급격히 치솟았습니다. 문제가 된 SKU는 “Generate_content image output token count for Gemini 2.5 Flash Native Image Generation”이었는데, 이미지를 생성한 적이 없는 개발자들에게도 이 항목이 청구됐습니다.

한 개발자는 상품 설명 텍스트를 번역하는 워크플로우만 돌렸는데, $1,000 이상의 이미지 생성 요금이 청구됐습니다. API 키를 삭제해도 20분 뒤 $200이 추가됐고, 결제 계정 자체를 비활성화한 후에도 카드에 $500이 청구됐습니다. 포럼에서 가장 큰 피해로 보고된 케이스는 $70,000 이상이었습니다. (출처: ppc.land, Google AI Developer Forum 기록 기반 리포트, 2026.03.16)

💡 당시 버그가 발생한 경위를 공식 커뮤니케이션과 교차 확인해보니 이렇게 정리됩니다.

구글은 결국 “2.5 Flash Native Image Generation 서비스에 잘못된 가격 설정이 있었다”며 “사용량이 잘못 계산돼 청구됐고 전액 크레딧으로 환불할 것”이라고 공식 인정했습니다. (출처: Google Cloud Support 공식 이메일, 개발자 포럼 공개 게시물, 2025년 8월).

그런데 “크레딧”이라는 단어가 문제였습니다. 현금 환불이 아닌 Google Cloud 계정 잔액 크레딧으로 처리한 것입니다. Gemini API를 소규모로만 쓰는 개발자에게 $1,237 크레딧은 사실상 쓸 곳이 없는 돈입니다. 게다가 카드사에 이의를 제기한 개발자들은 구글이 결제 프로필을 전 서비스(Google Play, YouTube Premium 포함)에서 비활성화하는 조치를 취했다고 보고했습니다. 이의 제기 자체가 또 다른 문제로 이어진 셈입니다.

Tier 2 진입 조건, 생각보다 다른 게 있습니다

이번 개편에서 사용량 등급(Usage Tier) 체계도 함께 변경됐습니다. 특히 Tier 2와 Tier 3의 진입 조건이 많은 개발자가 생각하는 것과 다릅니다. (출처: Gemini API Rate Limits 공식 문서, 2026.03.16 업데이트)

등급 진입 조건
Free 구글 계정 가입만 하면 됨
Tier 1 결제 계정 활성화
Tier 2 GCP 결제 계정 누적 $100 지출 + 첫 결제 후 최소 3일
Tier 3 GCP 결제 계정 누적 $1,000 지출 + 첫 결제 후 최소 30일

💡 공식 문서와 티어 진입 흐름을 같이 놓고 보니 이런 차이가 보였습니다.

Tier 2 진입 조건의 $100는 Gemini API 사용 금액만이 아니라, 해당 GCP 결제 계정에 연결된 모든 구글 클라우드 서비스의 누적 지출을 합산합니다. 즉 Google Maps API, Firebase, Cloud Run 등 다른 GCP 서비스를 쓰고 있다면 그 비용도 합산돼 Tier 2 진입이 빨라집니다. 반대로 Gemini API만 쓰는 계정이라면 Tier 2 진입까지 $100를 Gemini로만 채워야 합니다.

이전 조건에서는 더 높은 금액이 필요했는데, 이번 개편으로 하향 조정됐습니다. 구글은 이를 “strong payment history를 가진 사용자가 더 빨리 높은 쿼터를 얻을 수 있도록”이라고 설명했습니다. (출처: Google Blog, 2026.03.16) 등급 업그레이드는 이제 자동으로 처리되며, Tier 1 이상에서의 업그레이드는 조건 충족 후 10분 이내에 적용됩니다.

새 대시보드, 실제로 어디서 봐야 하나요?

이번 업데이트에서 대시보드가 세 가지 신설됐습니다. 이전에는 청구 확인을 위해 Google Cloud Console, AI Studio, 결제 페이지를 번갈아 오가야 했는데, 이제 AI Studio 안에서 대부분을 처리할 수 있습니다. 이게 실제로 의미 있는 이유는, 2025년 8월 버그 당시 구글 대시보드가 최대 48시간 지연으로 정확한 사용량을 보여주지 않아서 개발자들이 실시간으로 피해를 파악조차 못했기 때문입니다.

세 가지 대시보드의 위치는 다음과 같습니다. Rate Limit 대시보드aistudio.google.com/rate-limit에서, Cost 대시보드Usage 대시보드aistudio.google.com/spendaistudio.google.com/usage에서 접근 가능합니다. (출처: Google Blog, 2026.03.16)

Rate Limit 대시보드에서는 RPM(분당 요청 수), TPM(분당 토큰 수), RPD(일일 요청 수)를 프로젝트 단위로 확인할 수 있고, Cost 대시보드에서는 최근 7일~한 달 단위로 모델별 지출을 필터링해서 볼 수 있습니다. Usage 대시보드에는 Imagen과 Veo의 일별 요청 수 그래프도 추가됐습니다. 결제 설정 자체도 이제 AI Studio 내 aistudio.google.com/projects에서 바로 가능해서, 기존처럼 창을 세 개씩 열 필요가 없어졌습니다.

2026년 4월부터 달라지는 것

이번 개편에서 가장 주목해야 할 변화는 Billing Account Tier Cap(결제 계정 등급별 한도)의 신설입니다. 2026년 4월부터 각 사용량 등급(Tier 1, 2, 3)에 결제 계정 전체에 대한 월 최대 지출 한도가 자동으로 적용됩니다. 개발자가 설정하는 Project Spend Cap과는 별개로, 구글이 등급별로 설정하는 시스템 한도입니다.

📌 현재 알려진 것과 모르는 것

알려진 것: 등급이 높아질수록 한도가 자동으로 증가한다. Tier 1보다 Tier 2, Tier 3이 더 높은 월 지출 한도를 갖는다.

확인 필요: 구글은 블로그 발표문에서 각 등급별 구체적인 달러 금액을 공개하지 않았습니다. 공식 문서(billing#tier-spend-caps)를 직접 확인하는 것이 현재 가장 정확합니다.

이 Billing Account Tier Cap이 중요한 이유는, 4월 이후에는 기존에 높은 사용량을 운용하던 개발자도 등급별 한도에 걸려 서비스가 중단될 수 있기 때문입니다. 구글 개발자 포럼에서는 이미 “Manually verify and review your current usage to plan ahead and prevent service disruption(서비스 중단을 막기 위해 지금 당장 사용량을 직접 확인하라)”는 안내가 나온 상태입니다. (출처: Google AI Developer Forum, 2026.03 게시물)

현재 Tier 1에서 Tier 2로 넘어가려면 GCP 결제 계정의 누적 지출이 $100 이상 + 첫 결제 후 3일이 지나야 합니다. 4월 전에 자신의 현재 Tier를 확인하고 ($100 조건을 아직 못 채웠다면 4월 전 채워두는 것이 유리), Billing Account Tier Cap이 자신의 실제 사용량보다 낮은지 체크해두는 것이 필요합니다.

자주 묻는 것들

지출 한도를 설정했는데, 한도 금액이 정확히 그 금액에서 딱 끊기나요?
+
그렇지 않습니다. 공식 문서에 명시된 것처럼 약 10분의 적용 지연이 있기 때문에, 한도 금액에 도달해도 즉시 차단되지 않습니다. 고 처리량 애플리케이션이라면 10분 안에 한도를 넘는 추가 요금이 발생할 수 있으며, 이 초과분은 사용자 부담입니다. 예산보다 낮은 금액으로 한도를 설정하는 것이 안전합니다.
Tier 2 진입 조건 $100는 Gemini API만의 지출인가요?
+
아닙니다. Tier 2와 Tier 3의 진입 조건은 “결제 계정의 GCP 전체 누적 지출” 기준입니다. Gemini API뿐만 아니라 Google Maps API, Cloud Run, Firebase 등 같은 GCP 결제 계정에 연결된 모든 서비스의 지출이 합산됩니다. (출처: Gemini API Rate Limits 공식 문서, 2026.03.16)
2025년 8월 버그로 잘못 청구된 금액은 현금 환불이 됐나요?
+
구글은 현금 환불이 아닌 Google Cloud 계정 크레딧으로 처리했습니다. 소규모 개발자에게는 사실상 쓸모없는 크레딧인 경우도 많았습니다. 카드사에 이의를 제기한 개발자 중 일부는 구글이 Google Play, YouTube Premium을 포함한 전 서비스 결제 프로필을 비활성화하는 조치를 받았다고 보고했습니다.
Free 등급에서 Tier 1으로 바뀌려면 어떻게 해야 하나요?
+
Google AI Studio에서 결제 계정을 활성화하면 Tier 1으로 즉시 전환됩니다. Free 등급에서 Tier 1으로의 업그레이드는 거의 즉시 반영됩니다. aistudio.google.com/projects에서 현재 프로젝트의 등급을 확인할 수 있습니다.
지출 한도와 Billing Account Tier Cap은 어떻게 다른가요?
+
Project Spend Cap은 개발자가 직접 설정하는 프로젝트 단위 월 한도입니다. 설정도 해제도 개발자가 합니다. 반면 Billing Account Tier Cap은 2026년 4월부터 구글이 자동으로 적용하는 결제 계정 전체 단위 한도입니다. 등급이 높을수록 더 높은 금액이 허용됩니다. 두 가지는 서로 독립적으로 작동하며, 둘 중 더 낮은 한도에 먼저 도달하면 그 시점에서 제한이 걸립니다.

마치며

솔직히 말하면, 이번 업데이트는 구글이 자랑스럽게 내놓은 신기능이라기보다 2025년 8월 사건 이후 밀린 숙제를 제출한 것에 가깝습니다. OpenAI와 Anthropic은 이미 있던 기능이고, 구글만 없었던 것이었으니까요. 다만 늦었더라도 없는 것보다는 낫습니다.

핵심은 두 가지입니다. 첫째, 지출 한도를 설정해도 10분 지연 구간이 있으므로 예산보다 넉넉하게 낮게 설정해야 합니다. 둘째, 2026년 4월부터 Billing Account Tier Cap이 자동 적용되는데 구체적인 금액이 아직 명시되지 않았으니, 공식 문서를 직접 확인하고 4월 전에 자신의 Tier와 현재 사용량을 검토해두는 게 실수를 막는 방법입니다.

이번 업데이트에서 아직 해결되지 않은 것도 있습니다. 2025년 8월 버그로 피해를 입었는데 아직 크레딧조차 받지 못한 개발자들에 대한 언급은 이번 발표에 없었습니다. 앞으로 나아가는 기능을 만드는 것만큼, 과거의 피해를 수습하는 것도 신뢰 회복의 일부라는 점은 짚어두고 싶습니다.

본 포스팅 참고 자료

  1. Google Blog 공식 발표 — “Giving you more transparency and control over your Gemini API costs”
    https://blog.google/innovation-and-ai/technology/developers-tools/more-control-over-gemini-api-costs/
  2. Gemini API Rate Limits 공식 문서 (2026.03.16 최종 업데이트)
    https://ai.google.dev/gemini-api/docs/rate-limits
  3. Gemini API Changelog 공식 문서
    https://ai.google.dev/gemini-api/docs/changelog?hl=ko
  4. ppc.land 리포트 — “Google finally adds Gemini API spend caps” (2026.03.16)
    https://ppc.land/google-finally-adds-gemini-api-spend-caps-after-billing-chaos-hit-devs/
  5. Google AI Developer Forum — Billing Account Tier Cap 안내 스레드 (2026.03)
    https://discuss.ai.google.dev/t/why-billing-update-gemini-api-usage-tier-updates-and-billing-caps-starting-apr-2026/134392

본 포스팅은 2026년 3월 16일 구글 공식 발표 기준으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 최신 정보는 반드시 공식 문서에서 직접 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기