Gemini API 무료 한도, 모델마다 이게 달랐습니다

Published on

in

Gemini API 무료 한도, 모델마다 이게 달랐습니다
2026.03.18 기준
Gemini API 공식 문서 기준
IT/AI

Gemini API 무료 한도, 모델마다 이게 달랐습니다

AI Studio에서 무료로 쓸 수 있다고 해서 시작했다가, 429 오류만 보고 포기한 경우가 꽤 많습니다. 결론부터 말씀드리면, 모든 Gemini 모델이 무료 한도를 동등하게 제공하는 게 아닙니다. 모델에 따라 하루 1,500건이 되기도 하고, 아예 무료 티어가 없기도 합니다.

1,500 RPD
Gemini 2.5 Flash 무료 하루 최대
Not Available
Gemini 3.1 Pro 무료 티어 상태
4단계
사용 티어 구조 (Free ~ Tier 3)

“무료인데 왜 429 오류가 나죠?” — 여기서 시작됩니다

Google AI Studio에 접속하면 API 키를 무료로 발급받을 수 있고, 별도 카드 등록 없이 Gemini 모델을 바로 사용할 수 있습니다. 그래서 ‘무료’라는 말을 곧이곧대로 받아들이고 자동화 스크립트를 돌리거나 API를 붙이다가 429 “You exceeded your current quota” 오류를 만나는 경우가 많습니다.

문제는 “얼마나 쓸 수 있는지”가 모델마다, 그리고 미디어 타입(텍스트·이미지·오디오)마다 전부 다르다는 점입니다. 게다가 RPM(분당 요청), RPD(일당 요청), TPM(분당 토큰) 세 가지 기준이 동시에 적용되기 때문에, 셋 중 어느 하나라도 초과하면 바로 오류가 발생합니다. RPD를 아직 채우지 않았어도 RPM을 순간적으로 넘기면 그게 바로 차단입니다.

그리고 한 가지 더 — 무료 한도는 API 키 단위가 아니라 프로젝트 단위로 적용됩니다. (출처: Google AI for Developers 공식 문서, 2026.03.16 업데이트) API 키를 여러 개 만들어도 같은 프로젝트에 묶여 있으면 한도가 분산되지 않습니다. 이 부분을 모르고 키만 새로 만들어 시도하는 경우가 많은데, 거기서 벽에 부딪힙니다.

▲ 목차로 돌아가기

공식 문서에서 직접 확인한 모델별 Gemini API 무료 한도 수치

아래 표는 2026년 3월 16일 업데이트된 영문 공식 문서(ai.google.dev/gemini-api/docs/pricing)와 rate-limits 페이지를 기준으로 직접 정리한 수치입니다. 같은 “무료 티어”라도 모델별 격차가 상당합니다.

모델명 무료 입력가 무료 출력가 무료 RPD 한도
Gemini 2.5 Flash 무료 무료 1,500 RPD
Gemini 2.5 Flash-Lite 무료 무료 1,500 RPD
Gemini 3 Flash Preview 무료 무료 공식 명시 없음
Gemini 3 Pro Preview 무료 무료 공식 명시 없음
Gemini 3.1 Pro Preview Not Available Not Available 없음
Gemini 3.1 Flash-Lite Preview 무료 무료 공식 명시 없음
Gemini 2.0 Flash 무료 무료 500 RPD (구글 검색 한도)
Gemini 2.5 Pro Not Available Not Available 없음

(출처: Google AI for Developers 공식 Pricing 문서, ai.google.dev/gemini-api/docs/pricing, 2026.03.12 업데이트 기준)

표에서 한 가지 패턴이 보입니다. Pro 계열은 무료 한도가 없고, Flash·Flash-Lite 계열은 무료 한도가 있습니다. “Pro를 무료로 써보겠다”는 시도는 공식적으로 막혀 있습니다. 단, Gemini 3 Pro Preview와 Gemini 3 Flash Preview는 입출력 토큰 자체는 무료이지만 RPD 수치가 문서에 명시되어 있지 않습니다 — 이 부분은 AI Studio 내 개인 계정 기준으로 확인해야 합니다.

💡 공식 pricing 문서와 rate-limits 문서를 같이 놓고 보니 이런 차이가 보였습니다. pricing 문서에서 “Free of charge”라고 표시된 모델도, rate-limits 문서에서 RPD 수치가 따로 명시되지 않은 경우 실제 한도는 AI Studio에서만 확인 가능합니다. 두 문서를 별개로 읽으면 이 간극을 놓치게 됩니다.

▲ 목차로 돌아가기

숫자는 있는데 실제로는 안 되는 경우가 있습니다

2026년 2월, Reddit r/Bard에서 흥미로운 스레드가 올라왔습니다. AI Studio rate-limit 화면에 Gemini 2.5 Pro에 대해 1,500 RPD라는 수치가 표시됐는데, 실제로 API를 호출하면 첫 번째 요청부터 429 오류가 발생했다는 겁니다. (출처: Reddit r/Bard, 2026.02.13) 다른 사용자들도 “저는 하루에 5건밖에 안 됐어요”, “저는 아예 0건이었어요”라는 댓글을 남겼습니다.

이게 왜 벌어지냐면, AI Studio 화면에 보이는 수치는 이론적 상한선이고 실제 용량은 구글이 내부적으로 조정하기 때문입니다. 공식 rate-limits 문서에도 명확하게 명시되어 있습니다 — “Specified rate limits are not guaranteed and actual capacity may vary.” (출처: ai.google.dev/gemini-api/docs/rate-limits, 2026.03.16 업데이트) 즉, 구글이 직접 공식 문서에서 표시된 한도가 보장되지 않는다고 밝히고 있습니다.

실제로 2025년 12월에 구글은 무료 한도를 대폭 축소했다가, 2026년 2월에 다시 복원했습니다. 이처럼 무료 한도는 구글의 서버 용량 상황에 따라 예고 없이 바뀔 수 있습니다. 프로덕션 환경에서 무료 한도에만 의존하는 설계는 리스크가 있다는 뜻입니다.

⚠️ 실 사용 시 주의할 점: AI Studio의 rate-limit 화면에 큰 숫자가 보여도, 그 숫자가 실제로 호출 가능한 횟수와 다를 수 있습니다. 특히 신규 계정, 특정 지역, 또는 구글이 트래픽을 제한하는 시기에는 표시 수치보다 훨씬 낮게 막히는 경우가 보고됩니다. 실제 한도는 aistudio.google.com/rate-limit에서 본인 계정 기준으로 확인하는 게 가장 정확합니다.

▲ 목차로 돌아가기

Gemini API 무료 한도, 한국어 문서를 믿으면 낭패입니다

한국어로 된 공식 Gemini API rate-limits 문서(ai.google.dev/gemini-api/docs/rate-limits?hl=ko)의 최종 업데이트 날짜는 2025년 2월 14일입니다. 반면 영문 공식 문서의 최종 업데이트는 2026년 3월 16일입니다. 약 13개월의 시차가 있습니다.

이게 왜 문제냐면, 한국어 문서에는 Gemini 3, Gemini 3.1 계열 모델이 아예 존재하지 않습니다. 표에는 Gemini 2.0 Flash(RPM 15, RPD 1,500), Gemini 2.0 Flash-Lite(RPM 30, RPD 1,500), Gemini 1.5 Pro(RPM 2, RPD 50) 같은 구버전 수치만 나와 있습니다. 한국어 문서만 보고 “2.5 Pro는 하루 50번이구나”라고 파악하는 건 지금 시점에서는 맞지 않는 정보입니다.

💡 같은 공식 Google 도메인인데도 한국어 번역본과 영문 원본 사이에 1년 이상의 업데이트 공백이 존재합니다. Gemini API처럼 업데이트가 잦은 서비스에서 이 차이는 개발 의사결정에 영향을 줄 수 있습니다. 번역 페이지인지 원문 페이지인지 URL 파라미터(hl=ko vs 없음)로 구분하고, 항상 영문 원문을 기준으로 확인하는 게 안전합니다.

직접 확인 방법은 간단합니다. URL 끝에 있는 ?hl=ko를 제거하면 영문 최신 버전으로 이동합니다. 마지막 업데이트 날짜는 페이지 맨 하단에 “Last updated YYYY-MM-DD UTC”로 표시됩니다.

▲ 목차로 돌아가기

유료 전환 없이 한도를 늘리는 방법이 있긴 합니다

공식 문서에는 Tier 2 요건이 명시되어 있습니다. 2026년 3월 기준 Tier 2 자격 요건은 “결제 계정에 누적 $100 이상 지출 + 첫 결제 후 최소 3일 경과”입니다. (출처: ai.google.dev/gemini-api/docs/rate-limits, 2026.03.16) 이전에는 Tier 2 요건이 “누적 $250 이상”이었는데, 현재 문서 기준으로는 $100으로 낮아진 상태입니다.

그러나 유료 카드를 등록하지 않고도 한도를 일시적으로 늘리는 방법이 있습니다. 구글 클라우드 $300 무료 크레딧을 활용하는 방식입니다. 구글 클라우드 신규 계정에는 $300 상당의 무료 크레딧이 제공되고, 이 크레딧을 Gemini API 프로젝트에 연결하면 Tier 1 유료 티어와 동일한 한도를 이용할 수 있습니다. Vertex AI를 통한 경로도 같은 크레딧을 사용합니다. 단, 이 크레딧은 90일 내에 사용해야 하며 소진 후에는 실제 결제로 전환해야 합니다.

또 하나 — Batch API를 활용하면 일반 요청과 별도의 한도를 이용할 수 있습니다. Batch API는 비동기 처리 방식으로, 실시간 응답이 필요 없는 작업(데이터 분류, 대량 번역 등)에 적합하며 비용은 일반 API 대비 50% 저렴합니다. Tier 1 기준 Gemini 3.1 Flash-Lite Preview는 Batch 큐에 최대 1,000만 토큰을 대기시킬 수 있습니다. (출처: ai.google.dev/gemini-api/docs/rate-limits, Batch API 섹션)

▲ 목차로 돌아가기

무료 티어로 실제 프로젝트를 돌릴 수 있을까요

솔직히 말하면, 개인 프로젝트나 프로토타입 수준에서는 가능합니다. Gemini 2.5 Flash 기준으로 하루 1,500 RPD는 1분에 약 1건 호출하는 수준입니다. 간단한 챗봇이나 문서 요약 자동화 정도라면 하루 사용량 안에서 처리됩니다. 특히 TPM 한도(분당 토큰)가 무제한에 가까운 Flash-Lite 계열은 토큰 처리량이 많은 작업에도 유연하게 활용할 수 있습니다.

반면 실사용자를 대상으로 하는 서비스라면 이야기가 달라집니다. 무료 한도는 프로젝트 단위로 적용되기 때문에, 동시에 여러 사용자가 요청을 보내면 RPM이 금방 초과됩니다. 1,500 RPD를 24시간으로 나누면 시간당 62.5건, 분당 약 1건입니다. 사용자가 몇 명만 동시에 사용해도 분당 한도에 걸립니다. 공식 문서도 무료 티어를 “Developers and small projects getting started”로 명시하고 있습니다. (출처: ai.google.dev/gemini-api/docs/pricing)

그리고 이 부분이 좀 아쉬웠습니다 — 무료 티어에서는 입력 데이터가 구글의 제품 개선에 활용됩니다. 공식 약관에 명시된 내용입니다. 민감한 내용을 다루는 프로젝트라면 반드시 유료 전환 후 “Content not used to improve our products” 조건을 확인해야 합니다.

▲ 목차로 돌아가기

자주 묻는 질문 Q&A

Q. API 키 여러 개를 만들면 Gemini API 무료 한도를 늘릴 수 있나요?

안 됩니다. Gemini API 무료 한도는 API 키 단위가 아니라 프로젝트 단위로 적용됩니다. 같은 프로젝트 안에서 키를 여러 개 만들어도 한도가 늘어나지 않습니다. 한도를 늘리려면 새 구글 클라우드 프로젝트를 별도로 만들거나, 유료 티어로 전환해야 합니다. (출처: ai.google.dev/gemini-api/docs/rate-limits, 2026.03.16)

Q. Gemini 3.1 Pro를 무료로 쓸 방법은 없나요?

API 방식으로는 현재 공식적으로 없습니다. Gemini 3.1 Pro Preview는 공식 pricing 문서 기준 Free Tier가 “Not Available”로 표시됩니다. 단, Google AI Pro 구독($19.99/월)을 통해 Gemini 앱에서 3.1 Pro 기능을 사용하는 건 별개입니다 — 앱 사용과 API 호출은 다른 경로입니다. API로 3.1 Pro를 쓰려면 결제 계정 연결 후 유료 토큰을 소비해야 합니다.

Q. 429 오류가 났을 때 자동으로 재시도하면 해결되나요?

RPM(분당 요청) 초과가 원인이라면 1~2분 후 재시도하면 됩니다. 하지만 RPD(일당 요청)가 초과된 경우라면 해당 날짜가 끝날 때까지(태평양 표준시 자정 기준 초기화) 기다려야 합니다. 재시도 시에는 지수 백오프(Exponential Backoff) 방식을 적용하는 게 권장됩니다 — 1초, 2초, 4초, 8초 간격으로 간격을 늘려가며 재시도하는 방식입니다.

Q. Gemini CLI의 무료 한도는 Gemini API와 같나요?

다릅니다. Gemini CLI 무료 등급 한도는 분당 60 RPM, 하루 1,000 RPD입니다. 일반 Gemini API 무료 티어(Flash 기준 1,500 RPD)보다 RPD는 낮지만 RPM은 높습니다. Gemini CLI는 Google 계정만 있으면 사용 가능하고, 별도 API 키 설정 없이 로컬 터미널에서 바로 실행할 수 있습니다.

Q. 무료 티어에서 Grounding(구글 검색 연동)을 쓸 수 있나요?

일부 모델에서는 가능합니다. Gemini 2.5 Flash, Flash-Lite 기준 무료 티어에서 Grounding with Google Search를 하루 최대 500 RPD까지 사용할 수 있습니다. (출처: ai.google.dev/gemini-api/docs/pricing) 단, Gemini 3.1 Pro Preview 같은 최신 Pro 계열은 무료 티어 자체가 없으므로 Grounding도 유료로만 사용 가능합니다.

▲ 목차로 돌아가기

마치며 — 무료 한도, 숫자보다 조건을 먼저 봐야 합니다

Gemini API 무료 한도를 처음 접하면 “무료로 시작할 수 있다”는 메시지에 집중하게 됩니다. 기대했던 것과 달랐던 부분은 여기서 나옵니다. 모델마다 한도가 완전히 다르고, Pro 계열은 아예 무료 티어가 없고, 표시된 수치가 실제 가용 수치와 다를 수 있다는 점까지 감안하면 “무료”의 범위가 상당히 좁아집니다.

그래도 Gemini 2.5 Flash와 Flash-Lite 계열의 무료 한도는 개인 실험이나 프로토타입 수준에서는 충분히 활용할 만합니다. 핵심은 항상 영문 공식 문서 최신 버전을 기준으로 확인하고, 내 계정의 실제 한도는 AI Studio(aistudio.google.com/rate-limit)에서 직접 확인하는 것입니다. 문서에 나온 숫자가 보장되는 게 아니라는 점, 구글이 공식적으로 인정한 부분이기도 합니다.

막상 써보면 이 단계에서 멈추는 경우가 많습니다 — 한국어 문서와 영문 문서 사이의 수치 차이, 그리고 AI Studio 화면 표시값과 실제 한도 간의 차이. 이 두 가지만 인지하고 있어도 불필요한 삽질을 꽤 줄일 수 있습니다.

📚 본 포스팅 참고 자료

  1. Google AI for Developers — Rate limits 공식 문서 (2026.03.16 업데이트): https://ai.google.dev/gemini-api/docs/rate-limits
  2. Google AI for Developers — Pricing 공식 문서 (2026.03.12 업데이트): https://ai.google.dev/gemini-api/docs/pricing
  3. Google AI for Developers — 한국어 Rate limits 문서 (2025.02.14 업데이트): https://ai.google.dev/gemini-api/docs/rate-limits?hl=ko
  4. Reddit r/Bard — “New Gemini API rate limits!” 스레드 (2026.02.13): reddit.com/r/Bard/comments/1r44i7c
  5. Google AI Studio Rate Limit 실시간 확인 페이지: https://aistudio.google.com/rate-limit

※ 본 포스팅은 2026년 3월 18일 기준 Google AI for Developers 공식 문서를 바탕으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능·가격이 변경될 수 있습니다. 최신 정보는 반드시 공식 문서(ai.google.dev)에서 직접 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기