Gemini 2.5 Pro 무료, 앱과 API 한도가 다릅니다
“제미나이 무료로 쓰면 된다”는 말, 절반만 맞습니다. 구글 계정으로 쓰는 Gemini 앱과 개발자가 쓰는 Google AI Studio API는 한도 체계가 완전히 다릅니다. 특히 2025년 12월 조용히 단행된 한도 삭감 이후, 기존 방식대로 쓰다가 갑자기 막힌 사례가 속출했습니다.
무료 한도, 두 개의 시스템이 존재합니다
Gemini 2.5 Pro를 “무료로 쓴다”고 할 때, 사실 전혀 다른 두 환경이 섞여 있습니다. 하나는 Gemini 앱(gemini.google.com, 모바일 앱)이고, 다른 하나는 Google AI Studio API(ai.google.dev)입니다. 이 둘은 접속하는 계정도 같고 브랜드도 같지만, 한도 체계와 적용 기준이 완전히 분리되어 있습니다.
Gemini 앱은 일반 사용자 대상입니다. 무료 계정으로 로그인하면 ‘사고 모델(Thinking Model)’과 ‘Pro 3.1’ 모델을 쓸 수 있는데, 공식 지원 문서에 정확한 수치가 명시되지 않고 “일일 한도는 자주 변경될 수 있음”이라고만 나옵니다. (출처: Google 공식 지원 문서, support.google.com/gemini/answer/16275805) 바꿔 말하면, 구글이 언제든 사전 공지 없이 줄일 수 있다는 뜻입니다.
반면 Google AI Studio API는 개발자용이라 수치가 명확합니다. 아래 표가 현재 적용 중인 무료 등급 기준입니다.
| 모델 | RPM (분당 요청) |
RPD (일일 요청) |
TPM (분당 토큰) |
컨텍스트 |
|---|---|---|---|---|
| Gemini 2.5 Pro | 5 | 100 | 250,000 | 약 100만 |
| Gemini 2.5 Flash | 10 | 250 | 250,000 | 약 100만 |
| Gemini 2.5 Flash-Lite | 15 | 1,000 | 250,000 | 약 100만 |
| Gemini 2.0 Flash | 15 | 1,500 | 1,000,000 | 약 100만 |
(출처: Google AI for Developers 공식 API 비율 제한 문서, ai.google.dev/gemini-api/docs/rate-limits, 2026.02.18 최종 업데이트)
RPM 5란, 12초에 한 번 요청할 수 있다는 뜻입니다. 이 속도면 활발한 프로토타이핑조차 불편합니다.
💡 앱으로 쓸 때와 API로 쓸 때의 한도는 서로 카운트되지 않습니다. 앱에서 하루 종일 프롬프트를 날려도 API 100회 한도는 그대로 남아 있습니다.
2025년 12월, 조용히 80% 줄어든 이유
2025년 12월 6~7일 주말, 수개월째 잘 돌아가던 Gemini API 연동 앱들이 갑자기 429 오류를 내뿜기 시작했습니다. 사전 공지는 없었습니다. 구글 상태 페이지가 이를 인정한 건 이틀 뒤인 12월 8일이었습니다.
이후 Google AI Studio PM인 Logan Kilpatrick이 개발자 포럼에 입장을 밝혔습니다. Gemini 2.5 Pro 무료 API는 원래 “단 한 주말”만 제공할 예정이었는데, 수개월간 그대로 유지됐다는 겁니다. 삭감의 공식 이유는 “유료 티어에서 발생한 대규모 어뷰징과 신규 모델 출시로 인한 폭발적 수요”였습니다.
| 모델 | 이전 RPD | 변경 후 RPD | 삭감폭 |
|---|---|---|---|
| Gemini 2.5 Pro | 500 | 100 | -80% |
| Gemini 2.5 Flash | 500 | 250 | -50% |
| Gemini 2.5 Flash-Lite | 1,500 | 1,000 | -33% |
(출처: yingtu.ai Gemini API Free Tier Limits 2025, 2025.12.26 기준 검증 데이터)
가장 아픈 건 RPD 500 → 100 전환입니다. 하루 활발하게 개발하면 4~5시간이면 소진됩니다.
💡 공식 발표문과 실제 삭감 타이밍을 함께 놓고 보면, 구글은 처음부터 무료 Pro를 “임시 제공”으로 설계했습니다. 장기 무료 의존은 설계 단계부터 배제해야 합니다.
API 키를 여러 개 만들어도 안 되는 이유
한도를 늘리려고 API 키를 여러 개 발급받는 시도가 많습니다. 직관적으로 말이 되는 것 같지만, 실제로는 전혀 효과가 없습니다. 구글 공식 문서는 이렇게 명시하고 있습니다. “비율 제한은 API 키가 아닌 프로젝트별로 적용됩니다.” (출처: Google AI for Developers 공식 비율 제한 문서, ai.google.dev/gemini-api/docs/rate-limits) 같은 프로젝트 안에서 키를 10개 만들면 10개가 RPD 100을 공유합니다.
한도를 실질적으로 늘리려면 Google Cloud 프로젝트 자체를 별도로 만들어야 합니다. 프로젝트마다 각자의 무료 쿼터가 붙기 때문입니다. 단, 이 방법은 관리 복잡도가 올라가고, 구글이 어뷰징 방지 시스템을 통해 비정상 패턴을 감지할 경우 이용 제한이 걸릴 수 있습니다.
팀 단위로 개발할 때도 문제가 됩니다. 팀원 3명이 같은 프로젝트의 API 키를 각자 쓰면, 한 사람이 50회 쓰는 순간 나머지 두 사람은 50회로 쪼개 써야 합니다.
💡 팀 개발이라면 구성원별로 Google Cloud 프로젝트를 분리하는 게 현실적인 방법입니다. 하나의 프로젝트에 여러 키를 쌓는 건 아무 의미가 없습니다.
Gemini 3 Pro Preview는 API 무료가 없습니다
Google One 공식 페이지를 보면 현재 가장 최신 체계는 “Gemini 3 Pro”, “Pro 3.1”, “사고 모델” 등의 표기를 씁니다. Gemini 앱 안에서는 이미 3세대 모델 체계로 전환된 상태입니다. (출처: Google AI 요금제 공식 페이지, one.google.com/intl/ko_kr/about/google-ai-plans/) 그러나 API 쪽 사정은 다릅니다.
Google AI Studio 공식 문서 기준으로 Gemini 3 Pro Preview는 무료 API 티어가 존재하지 않습니다. AI Studio 인터페이스의 채팅 창에서는 시험해볼 수 있지만, API 호출로 연동하려면 바로 유료 결제가 시작됩니다. 입력 토큰 100만 개당 $2.00, 출력 토큰 100만 개당 $12.00이 청구됩니다. (출처: yingtu.ai, Gemini API Free Tier Limits 2025, 2025.12 기준)
즉, “최신 모델 = 무료”라는 공식은 Gemini 3 세대부터 사실상 깨졌습니다. 무료 API 범위는 현재까지 Gemini 2.5 Pro가 최상위입니다.
💡 앱에서 본 “Gemini 3 Pro”와 API에서 쓸 수 있는 “Gemini 2.5 Pro”는 다른 모델입니다. 최신 앱 경험을 API로 그대로 옮기려 하면 유료 청구가 시작됩니다.
무료 범위 안에서 최대로 쓰는 방법
하루 100회 한도를 최대한 아끼는 현실적인 방법이 있습니다. 직접 검증해볼 수 있는 구체적인 접근법입니다.
① 모델 라우팅으로 Pro 호출 아끼기
복잡한 추론이 필요한 작업만 Gemini 2.5 Pro(RPD 100)에 배당하고, 코드 생성은 Gemini 2.5 Flash(RPD 250), 단순 요약·분류는 Gemini 2.5 Flash-Lite(RPD 1,000)에 맡기면 Pro 한도 소진 속도가 크게 줄어듭니다. Pro 100회 + Flash 250회 = 하루 350회 호출을 사실상 활용할 수 있습니다.
② 여러 질문을 하나의 요청으로 묶기
5개 질문을 각각 보내면 5회 차감이지만, 하나의 프롬프트로 묶으면 1회 차감입니다. TPM(분당 토큰) 한도는 25만 토큰으로 넉넉하므로, 묶어 보내도 토큰 부담은 거의 없습니다. 호출 횟수 기준으로 최대 80%까지 효율화됩니다.
③ 일일 쿼터 리셋 타이밍 파악하기
쿼터는 태평양 표준시(PT) 기준 자정에 초기화됩니다. 한국 시간으로는 서머타임 적용 시 오후 4시, 미적용 시 오후 5시입니다. 오후 4~5시 이후부터 집중 사용하면 당일 남은 쿼터를 쓰고 바로 다음 날 쿼터가 붙으므로, 하루치를 두 번 연속 쓰는 것처럼 활용할 수 있습니다.
④ 같은 입력에 대한 응답 캐싱
동일한 프롬프트가 반복되는 애플리케이션은 응답을 로컬에 저장해두고 재사용하면 API 호출 없이 같은 결과를 냅니다. 컨텍스트 캐싱(서버 측)은 무료 티어에서 지원되지 않지만, 클라이언트 캐싱은 별도 비용 없이 구현 가능합니다.
유료 전환이 필요한 시점을 판단하는 기준
아래 세 가지 상황 중 하나라도 해당되면 무료 범위 유지가 현실적으로 어렵습니다.
📌 하루 RPD 100이 오전 중에 소진된다
오전 중에 Pro 100회가 다 찬다면, 실제 작업 흐름이 무료 범위를 이미 넘어선 상태입니다. 이 경우 결제만 활성화해도 Tier 1으로 올라가며 RPM은 4~10배, RPD는 10~50배 증가합니다.
📌 외부 사용자가 있는 서비스를 운영한다
무료 티어는 서비스 수준 협약(SLA)이 없습니다. 구글이 용량 부족을 이유로 무료 사용자 한도를 먼저 줄이는 건 공식 정책에도 명시된 사항입니다. (출처: Google Gemini 앱 공식 지원 문서) 실제 사용자가 있는 서비스라면 예고 없는 503이나 429는 감당하기 어렵습니다.
📌 민감 데이터를 다룬다
무료 티어에서는 구글이 프롬프트와 응답을 제품 개선 목적으로 검토할 수 있습니다. 유료 전환 후에는 이 데이터 처리가 제외됩니다. 개인정보, 사내 기밀 코드, 계약 관련 내용이 포함된 프롬프트라면 유료 전환이 더 안전합니다.
💡 Google Cloud 신규 가입자는 $300 크레딧(90일 유효)을 받을 수 있습니다. 이 크레딧으로 Tier 1 한도를 쓰면서 실질적인 유료 비용 없이 프로덕션 수준의 쿼터를 경험해볼 수 있습니다.
Q&A 5가지
마치며
Gemini 2.5 Pro 무료 한도는 생각보다 좁습니다. API 기준으로 하루 100회, 분당 5회가 전부입니다. 게다가 이 숫자도 2025년 12월 이전엔 5배 넉넉했다가 예고 없이 줄었습니다.
솔직히 말하면, 구글이 무료 Pro를 처음부터 “영구 제공”으로 설계하지 않았다는 걸 이번 삭감이 보여줬습니다. 학습과 프로토타이핑 용도로는 여전히 충분히 유용하지만, 제품을 만들거나 팀으로 쓸 계획이라면 처음부터 유료 전환을 전제로 설계하는 게 낫습니다.
무료 범위에서 최대한 뽑아내고 싶다면 모델 라우팅과 요청 묶기, 쿼터 리셋 타이밍 활용을 조합하는 것이 현실적입니다. 그리고 Gemini 3 Pro Preview가 API 무료 없이 출시됐다는 점은 앞으로의 방향을 시사합니다. 최신 모델일수록 무료 범위는 더 좁아질 가능성이 높습니다.
본 포스팅 참고 자료
- Google AI for Developers 공식 비율 제한 문서 — ai.google.dev/gemini-api/docs/rate-limits
- Google AI for Developers 공식 Gemini 2.5 Pro 모델 문서 — ai.google.dev/gemini-api/docs/models/gemini-2.5-pro
- Google Gemini 앱 공식 한도 지원 문서 — support.google.com/gemini/answer/16275805
- Google AI 요금제 공식 페이지 — one.google.com/intl/ko_kr/about/google-ai-plans
※ 본 포스팅 작성 이후 Google의 서비스 정책·요금·UI·기능이 변경될 수 있습니다. 최신 정보는 Google AI for Developers 공식 문서에서 확인하세요. 본 포스팅은 2026년 3월 28일 공식 문서 기준으로 작성되었습니다.

댓글 남기기