2026.03.16 기준
Gemini API / Google AI Studio

Gemini API 비용 한도, 10분이 이만큼 됩니다

2026년 3월 16일, 구글이 드디어 Gemini API에 지출 한도 기능을 추가했습니다. 공식 블로그는 “개발자에게 투명성과 통제권”을 준다고 했지만, 막상 공식 문서를 읽어보니 “10분 지연”이라는 조항이 조용히 들어 있습니다. 이 10분이 얼마나 되는지, 숫자로 직접 계산해봤습니다.

$70,000+
2025년 8월 버그 최대 청구액

10분
지출 한도 적용 지연 시간

$100
Tier 2 진입 기준 (기존 $250)

지출 한도가 이제야 생긴 이유

이유가 된 사건이 있습니다. 2025년 8월 23일, 구글 AI 개발자 포럼에 한 기업이 올린 글에 따르면 Gemini 2.5 Flash API를 쓰다가 이미지 생성 출력 토큰 명목으로 7만 달러(약 9,700만 원)가 청구됐습니다. 이 기업은 이미지를 전혀 생성하지 않았고, API 키를 전부 삭제한 이후에도 매일 1만 달러씩 청구가 늘어났습니다. (출처: Google AI Developers Forum, 2025.09.02)

구글은 결국 버그를 인정했고, “모든 잘못된 청구는 크레딧으로 환불하겠다”고 발표했습니다. 그런데 여기서 또 문제가 생겼습니다. 크레딧은 구글 클라우드 잔액이지, 카드로 돌려주는 환불이 아닙니다. API를 가끔 쓰는 소규모 개발자에게 구글 클라우드 크레딧 $1,000은 사실상 쓸 곳이 없습니다. 이 문제를 제기한 개발자 중 일부는 카드사에 직접 이의를 신청했고, 그에 대해 구글이 결제 프로필을 잠가버린 사례도 보고됐습니다. 그 7개월 후가 이번 2026년 3월 16일 발표입니다.

▲ 목차로 돌아가기

10분 지연, 숫자로 보면 이렇습니다

Project Spend Cap(프로젝트 지출 한도)을 설정해도, 구글 공식 블로그는 “약 10분 지연이 있으며, 그 시간 동안 발생한 초과 비용은 개발자 책임”이라고 명시합니다. (출처: Google AI Blog, 2026.03.16) 이게 실제로 얼마인지 계산해보면 이렇습니다.

💡 공식 가격표와 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다

분당 요청 제한(RPM) Tier 1 기준 Gemini 3.1 Flash: 2,000 RPM, 분당 400만 토큰(TPM). 즉, 10분이면 최대 4,000만 토큰 처리가 가능합니다.

→ Flash 기준 출력 토큰($2.50/100만) 4,000만 토큰 = 최대 $100, Pro 기준 출력($15.00/100만) = 최대 $600. 한도를 걸어놔도 10분 안에 이 금액이 나올 수 있습니다.

2025년 8월 버그 당시 피해 개발자 중 한 명은 API 키를 모두 삭제했음에도 20분 만에 $200가 추가됐다고 보고했습니다. 지출 한도가 있었더라도 10분 지연 구간에서 $100 이상이 빠져나갈 수 있다는 뜻입니다. 한도를 설정한다고 해서 $0 손실을 보장하진 않습니다.

게다가 Tier 레벨 한도(청구 계정 전체에 적용되는 시스템 정의 상한)는 2026년 4월 1일부터 적용됩니다. 3월 16일 발표 이후 4월 1일 전까지는 프로젝트 단위 지출 한도(본인이 직접 설정하는 것)만 작동하고, 계정 전체 한도는 아직 비어 있는 상태입니다. (출처: Reddit r/planhub, 2026.03.17)

▲ 목차로 돌아가기

사용량 등급 개편, 달라진 것 세 가지

이번 발표에서 비용 한도 못지않게 실용적인 부분이 사용량 등급(Usage Tier) 개편입니다. 개발자가 API를 쓰다가 “429: RESOURCE_EXHAUSTED” 오류를 만나는 건 대부분 등급 한도 때문인데, 그 기준이 크게 낮아졌습니다.

등급	기존 자격 조건	변경 후 조건
Free	결제 계정 미연결	동일
Tier 1	결제 계정 연결	동일
Tier 2	누적 지출 $250 + 30일 대기	누적 지출 $100 + 3일 대기 (자동 승격)
Tier 3+	미공개	미공개 (확인 필요)

(출처: securityonline.info 분석 기사, 2026.03.18 / Google AI Blog, 2026.03.16)

Tier 2로 올라가면 체감 차이가 큽니다. Gemini 3.1 Flash 기준으로 Tier 1에서 RPM은 2,000이지만, Tier 2에서는 더 높은 쿼터가 제공됩니다 — 구체적 수치는 공식 rate-limits 페이지에서 모델별로 확인해야 합니다. 이전에는 $250을 쓰고 30일을 기다려야 했는데, 이제는 $100만 넘으면 3일 후 자동으로 승격됩니다. 반복 작업이 많은 서비스 개발자라면 쿼터 벽이 훨씬 빨리 해결될 수 있습니다.

또 한 가지 알아둘 점이 있습니다. Tier 3 이상에 대한 기준은 구글이 공개하지 않고 있습니다. 공식 문서에도 “곧 제공 예정”으로만 돼 있습니다. 더 높은 쿼터가 필요한 경우라면, Tier 2 도달 후 별도로 한도 상향 요청을 해야 하는 상황이 여전히 존재합니다.

▲ 목차로 돌아가기

이건 AI Studio에서만 됩니다

Project Spend Cap이 생겼다는 발표를 읽고 안심했다면, 한 가지를 꼭 확인해야 합니다. 이 기능은 Google AI Studio를 통한 Gemini API 사용에만 적용됩니다. Vertex AI를 통해 Gemini 모델을 사용하는 경우에는 전혀 다른 결제 체계가 적용되며, AI Studio의 지출 한도는 Vertex AI 청구에 영향을 주지 않습니다.

이 차이는 작지 않습니다. Google for Startups 같은 프로그램을 통해 구글 클라우드 인프라를 쓰고 있거나, Firebase AI Logic 또는 LangChain 등 Vertex AI 기반 도구를 통해 Gemini를 호출하는 경우에는 이번 발표가 직접적으로 해당되지 않습니다. Vertex AI의 비용 관리는 Google Cloud 콘솔의 예산 및 알림 기능으로 별도 설정해야 합니다.

💡 공식 문서와 실제 사용 경로를 함께 보니 이 구분이 보였습니다

AI Studio Spend Cap → ai.google.dev 기반 API 호출만 커버
Vertex AI 호출 → Google Cloud 콘솔 예산 설정 별도 필요
Firebase AI Logic → 모델에 따라 다름. 2026년 3월 31일 이전 구 모델 사용 시 마이그레이션 필요 (출처: Firebase AI Logic 공식 문서)

솔직히 말하면 이 부분이 가장 헷갈리는 지점입니다. 발표 자체가 “Gemini API”를 강조하다 보니 Vertex AI 경로로 쓰는 개발자는 스스로 해당 여부를 확인해야 합니다. 공식 발표문 어디에도 “Vertex AI는 제외”라는 문구가 명시돼 있지 않습니다.

▲ 목차로 돌아가기

새 대시보드, 실제로 쓸 수 있는 것

지출 한도 외에 이번 발표에서 함께 추가된 것이 세 개의 대시보드입니다. Rate Limit 대시보드, Cost 대시보드, Usage 대시보드로 나뉩니다. 각각 Google AI Studio의 별도 탭에서 접근할 수 있습니다.

Rate Limit 대시보드(aistudio.google.com/rate-limit): RPM, TPM, RPD를 프로젝트별로 실시간 시각화. 모델별 필터 지원.
Cost 대시보드(aistudio.google.com/spend): 최근 7일~월 단위 일별 비용 그래프. 모델별 필터 지원. 지출 한도도 여기서 설정.
Usage 대시보드(aistudio.google.com/usage): 요청 수, 오류율, 토큰 사용량 종합. Imagen·Veo 요청별 그래프 포함.

2025년 8월 버그 당시 가장 큰 문제 중 하나가 “청구 데이터가 48시간 지연”이었다는 점을 감안하면, 이 대시보드가 실시간 수준으로 작동하는지가 핵심입니다. 공식 발표문은 “투명한 뷰”를 제공한다고 했지만, 데이터 반영 지연이 얼마나 개선됐는지에 대해서는 구체적 수치를 명시하지 않았습니다. 실제 프로덕션에서 쓰기 전에 직접 확인이 필요한 부분입니다.

▲ 목차로 돌아가기

OpenAI·Anthropic과 비교하면

구글 AI 블로그는 이번 Tier 레벨 상한을 “업계 다른 플랫폼과 유사한 방식”이라고 표현했습니다. 실제로 OpenAI는 이미 월별 예산 상한 설정 기능을 제공해왔고, API 호출이 상한에 도달하면 더 이상 응답하지 않습니다. Anthropic도 동일한 방식입니다. 구글만 없었던 겁니다.

항목	Gemini API (신규)	OpenAI API	Anthropic API
월별 지출 한도	✅ (프로젝트 단위)	✅	✅
한도 도달 시 즉시 차단	⚠️ 10분 지연	✅ 즉시	✅ 즉시
계정 전체 한도	⏳ 2026.04.01~	✅	✅
Tier 2 진입 기준	$100 + 3일	별도 신청	별도 신청

(출처: Google AI Blog 2026.03.16 / OpenAI Help Center / Anthropic 공식 문서 기준, 2026.03 기준)

기대했던 것과 달랐습니다. “한도가 생겼으니 이제 구글도 안전하다”는 결론은 아직 이릅니다. 10분 지연이라는 조항은 경쟁사 대비 여전히 구조적 차이입니다. 특히 높은 처리량이 필요한 에이전트 루프나 배치 API를 사용하는 경우라면, 애플리케이션 레벨에서 자체적인 속도 제한을 별도로 구현하는 것이 현실적입니다.

▲ 목차로 돌아가기

자주 묻는 질문

지출 한도를 설정하면 초과 즉시 API가 막히나요?

막히기는 하지만, 약 10분 지연이 있습니다. 구글 공식 블로그 기준으로 “해당 기간 동안 발생한 초과 비용은 개발자 책임”입니다. 즉, 한도를 설정해도 10분치 요금은 초과될 수 있습니다. 고처리량 앱에서는 앱 레벨 속도 제한을 병행하는 것이 안전합니다. (출처: Google AI Blog, 2026.03.16)

Vertex AI를 쓰고 있는데 이번 변경이 적용되나요?

적용되지 않습니다. Project Spend Cap과 새 사용량 등급 체계는 Google AI Studio(ai.google.dev) 기반 Gemini API에만 해당됩니다. Vertex AI를 통해 Gemini를 사용하는 경우, Google Cloud 콘솔에서 별도로 예산 알림 및 한도를 설정해야 합니다.

Tier 2 자격이 $250에서 $100으로 낮아졌다는데, 기존 사용자도 소급 적용되나요?

시스템이 자동으로 확인하여 기준 충족 시 자동 승격됩니다. 수동 신청 없이 조건이 충족되면 바로 상위 등급으로 이동합니다. 단, 사기 방지 시스템 검토 과정에서 드물게 승격이 거부될 수 있다고 구글 공식 문서가 명시하고 있습니다.

2025년 8월 버그로 과청구된 경우, 이번 발표로 해결이 되나요?

이번 발표는 과거 피해에 대한 소급 조치를 포함하지 않습니다. 구글은 당시 “크레딧”으로 환불하겠다고 했고, 아직 미해결 사례가 남아 있다는 보고가 있습니다. 과거 피해를 받은 경우에는 Google Cloud 지원팀에 직접 문의해야 합니다.

Tier 레벨 한도(계정 전체 상한)의 구체적 금액은 어떻게 되나요?

구글 공식 블로그는 “상세 내용은 문서에서 확인하라”고만 했고, 2026년 3월 19일 현재 각 Tier별 정확한 상한 금액은 ai.google.dev/gemini-api/docs/billing에서 확인해야 합니다. 단, Tier 레벨 한도 자체는 2026년 4월 1일부터 실제 적용 예정입니다.

▲ 목차로 돌아가기

마치며

AI Studio Spend 탭에서 지출 한도를 설정하는 건 5분이면 됩니다. 단, 그 한도가 마지막 방어선이 아니라 1차 알림 정도로 인식하고, 애플리케이션 레벨에서도 별도 처리량 제한을 두는 것이 이번 공식 문서를 읽고 난 뒤 판단입니다.

▲ 목차로 돌아가기

📌 본 포스팅 참고 자료

⚠️ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 본문의 모든 가격 및 사용량 기준은 2026년 3월 19일 기준이며, Gemini API 공식 문서에서 최신 내용을 반드시 확인하시기 바랍니다. 본 포스팅은 구글의 공식 입장을 대표하지 않습니다.

Gemini API 비용 한도, 10분이 이만큼 됩니다

Gemini API 비용 한도, 10분이 이만큼 됩니다

지출 한도가 이제야 생긴 이유

10분 지연, 숫자로 보면 이렇습니다

사용량 등급 개편, 달라진 것 세 가지

이건 AI Studio에서만 됩니다

새 대시보드, 실제로 쓸 수 있는 것

OpenAI·Anthropic과 비교하면

자주 묻는 질문

마치며

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

Gemini API 비용 한도, 10분이 이만큼 됩니다

지출 한도가 이제야 생긴 이유

10분 지연, 숫자로 보면 이렇습니다

사용량 등급 개편, 달라진 것 세 가지

이건 AI Studio에서만 됩니다

새 대시보드, 실제로 쓸 수 있는 것

OpenAI·Anthropic과 비교하면

자주 묻는 질문

마치며

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기