Gemini 2.5 Pro (gemini-2.5-pro)
Google AI for Developers 공식 기준
Gemini 2.5 Pro 요금, 구독하면 다 될까요?
결론부터 말씀드리면, 안 됩니다. 월 $19.99짜리 Google AI Pro를 결제해도 Gemini 2.5 Pro에는 접근이 안 됩니다. 구독 요금제와 API 요금제는 아예 다른 구조로 설계돼 있고, 이 차이를 모르면 생각보다 훨씬 큰 비용이 나올 수 있습니다. 공식 가격 문서를 직접 뜯어봤더니 예상과 달랐던 부분들이 꽤 있었습니다.
(200K 이하)
(컨텍스트 길이별)
윈도우 토큰
구독 요금제 vs API 요금제 — 처음부터 다릅니다
Gemini 2.5 Pro 요금을 검색하면 가장 먼저 나오는 게 Google AI Pro, 월 $19.99(한국 기준 약 29,000원)입니다. 근데 이게 Gemini 2.5 Pro 전용 요금제가 아닙니다. Google One 공식 페이지에서 직접 확인하면, Google AI Pro에 포함된 모델은 Gemini 3.1 Pro입니다. (출처: Google One 공식 페이지, one.google.com, 2026.03.29)
구독 요금제는 Gemini 앱·Gmail·Docs 같은 소비자 인터페이스에서 모델에 접근하는 방식이고, Gemini 2.5 Pro는 Google AI for Developers API를 통해서만 직접 호출할 수 있습니다. 즉, 두 제품은 다른 팀이 운영하는 것처럼 요금 체계 자체가 완전히 분리돼 있습니다.
💡 공식 발표문과 실제 서비스 구조를 같이 놓고 보니 이런 차이가 보였습니다 — 구글은 “Gemini 2.5 Pro를 구독으로 제공한다”고 발표한 적이 없습니다. 구독 요금제에 포함된 건 항상 최신 앱 모델이고, API 모델과 버전이 따로 관리됩니다.
Gemini 앱에서 무료로 쓸 수 있는 Gemini 2.5 Pro는 하루 5회 프롬프트 한도가 있습니다. AI Pro 구독 시 하루 100회, AI Ultra 구독 시 하루 500회로 늘어납니다. 단, 이 숫자는 Gemini 앱 접근 횟수 기준이고 API 토큰 과금과는 완전히 별개입니다. (출처: Google Gemini 앱 한도 공식 지원 페이지, support.google.com, 2026.03.29)
Gemini 2.5 Pro API 요금 구조 숫자로 뜯기
Google AI for Developers 공식 가격 페이지 기준(2026.03.29)으로 정리하면 이렇습니다. 모델 코드는 gemini-2.5-pro입니다.
| 항목 | 200K 토큰 이하 | 200K 토큰 초과 |
|---|---|---|
| 입력 (텍스트·이미지·동영상·오디오) | $1.25 / 100만 토큰 | $2.50 / 100만 토큰 |
| 출력 (텍스트 + 사고 토큰 포함) | $10.00 / 100만 토큰 | $15.00 / 100만 토큰 |
| 컨텍스트 캐싱 (입력) | $0.31 / 100만 토큰 | $0.625 / 100만 토큰 |
| 캐시 스토리지 | $4.50 / 100만 토큰·시간 | |
| Batch API (비동기) | $0.625 입력 / $5 출력 | $1.25 입력 / $7.5 출력 |
출처: Google AI for Developers 공식 가격 페이지 (ai.google.dev/gemini-api/docs/pricing, 2026.03.29)
여기서 제일 중요한 숫자는 출력 요금 $10~$15입니다. 100만 토큰이 추상적으로 느껴질 수 있으니 실제로 따져보겠습니다. 한국어 기준으로 1토큰은 약 1~2자 정도입니다. 1,000자짜리 답변을 받으면 대략 500~1,000 출력 토큰이 나갑니다. 이걸 1만 번 받으면 500만~1,000만 출력 토큰 — 요금으로 환산하면 $50~$100 수준입니다. 하루에 300번씩 답변을 받는 헤비 유저 기준으로 한 달이면 $45~$90 선이 나옵니다.
막상 계산해보면 적지 않습니다. 그리고 여기에 사고 토큰이 더해지면 실제 청구 금액이 훨씬 올라갑니다.
사고 토큰이 요금을 갑자기 올리는 이유
Gemini 2.5 Pro의 가장 큰 특징은 ‘사고(Thinking)’ 기능입니다. 복잡한 문제를 풀기 전에 내부적으로 스스로 추론 과정을 거치는 방식인데, 이 추론 과정에서 발생하는 토큰도 출력 토큰으로 과금됩니다. (출처: Google AI for Developers 공식 가격 페이지, 2026.03.29)
⚠️ 실사례 — 일주일 만에 $1,000 CAD 청구
해외 커뮤니티(Reddit r/RooCode, 2025.04.13)에 올라온 경험에서, Gemini 2.5 Pro Preview를 코딩 도구(RooCode)에 연동해 일주일 사용했더니 Google API 비용이 $1,000 CAD(약 100만원)가 나왔다는 내용이 있습니다. 코딩 작업 특성상 긴 컨텍스트 + 사고 토큰이 동시에 터진 결과였습니다. 이런 과금 구조는 공식 문서에 명시돼 있지만, 실제 사용 전에 체감하기 어렵습니다.
사고 토큰이 출력에 포함된다는 건 쉽게 말해 이렇습니다. 짧은 답변을 받더라도 내부 추론이 길게 돌아가면 보이지 않는 추론 과정 토큰이 출력 요금에 고스란히 붙습니다. “200자짜리 답변 받았는데 왜 이렇게 많이 나왔지?”라는 상황이 여기서 생깁니다.
💡 공식 가격표와 실제 청구 흐름을 같이 놓고 보면 이런 차이가 보입니다 — 가격표에 쓰인 “$10/100만 출력 토큰”은 답변 텍스트만의 토큰이 아닙니다. 사고 과정까지 포함한 숫자라서, 같은 프롬프트라도 사고 기능이 켜져 있으면 출력 토큰 수가 수십 배까지 늘어날 수 있습니다.
Google AI for Developers 공식 가격 페이지에서는 출력 가격 항목을 명시할 때 괄호 안에 “사고 토큰 포함(텍스트 출력 + 추론)”이라고 적혀 있습니다. 실제로 사고 기능을 끄거나 예산 상한을 설정하는 옵션이 API에 있지만, 기본값으로는 사고 기능이 켜진 채로 동작합니다.
같은 작업에 절반 값으로 쓰는 방법이 있습니다
공식 가격 페이지에 Batch API라는 항목이 있습니다. 많은 분들이 그냥 지나치는데, 실시간 응답이 필요 없는 작업이라면 Batch API로 요금을 50% 절감할 수 있습니다. (출처: Google AI for Developers 공식 가격 페이지, ai.google.dev/gemini-api/docs/pricing, 2026.03.29)
Batch API를 쓰면 입력 요금이 $1.25 → $0.625, 출력 요금이 $10 → $5로 줄어듭니다(200K 이하 기준). 즉, 동일 작업 비용이 정확히 반으로 됩니다. 대신 응답이 즉각 오지 않고 비동기로 처리돼 나중에 받는 방식이라는 게 차이점입니다.
📊 Batch API 절감 계산 — 직접 따라해볼 수 있는 수치
예시: 문서 1,000건 요약 작업 (건당 평균 입력 2,000토큰 + 출력 500토큰)
• 일반 API: (2,000,000 × $1.25/1M) + (500,000 × $10/1M) = $2.50 + $5.00 = $7.50
• Batch API: (2,000,000 × $0.625/1M) + (500,000 × $5/1M) = $1.25 + $2.50 = $3.75
→ 동일 작업에서 $3.75 절감, 정확히 50% 줄어듭니다.
실시간성이 중요한 챗봇이나 사용자 인터렉션 서비스에는 적합하지 않지만, 데이터 분석·요약·분류·번역처럼 배치로 돌려도 되는 작업에는 Batch API가 훨씬 합리적입니다. 이 선택지가 있다는 걸 아는 것과 모르는 것 사이에서 비용이 두 배 차이 납니다.
Flash·Flash-Lite와 비교하면 어느 쪽이 나을까요
Gemini 2.5 계열에는 Pro 외에도 Flash와 Flash-Lite가 있습니다. 요금 차이가 꽤 크니 직접 비교해봤습니다.
| 모델 | 입력 (200K↓) | 출력 | 사고 기능 |
|---|---|---|---|
| Gemini 2.5 Pro | $1.25 | $10~$15 | ✅ 포함 |
| Gemini 2.5 Flash | $0.30 | $2.50 | ✅ 포함 |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | ❌ 미포함 |
출처: Google AI for Developers 공식 가격 페이지 (ai.google.dev/gemini-api/docs/pricing, 2026.03.29)
출력 요금만 비교하면 Pro는 Flash보다 4배, Flash-Lite보다 25배 비쌉니다. 막상 써보면 다릅니다 — 복잡한 수학·코딩·멀티스텝 추론에서는 Pro의 사고 기능이 명확히 다른 품질을 냅니다. 반면 단순 요약·번역·분류처럼 답이 단순한 작업에서는 Flash-Lite가 품질 차이 없이 25배 저렴합니다.
모델 선택 기준 — 어느 쪽이 유리한지
• Pro 유리: 코드 디버깅, 복잡한 수식, 긴 문서의 논리적 분석
• Flash 유리: 구조화된 데이터 추출, RAG 파이프라인, 중간 복잡도 요약
• Flash-Lite 유리: 고속 분류, 키워드 추출, 간단한 Q&A 자동화
무료로 쓸 수 있는 한도, 실제로는 얼마나 될까요
Google AI Studio에서는 API 키 발급 없이도, 또는 무료 티어에서도 Gemini 2.5 Pro를 테스트할 수 있습니다. 공식 가격 페이지에는 “무료 티어는 낮은 속도 제한(lower rate limits)으로 Experimental 버전을 무료 제공한다”고 나와 있습니다. (출처: Google AI for Developers 공식 가격 페이지, 2026.03.29)
다만 Experimental 버전과 Stable 버전은 다른 모델입니다. 현재 gemini-2.5-pro 안정 버전의 최신 업데이트는 2025년 6월이고, Experimental 버전은 그보다 이전 빌드일 수 있습니다. 또한 2026년 3월 10일 공식 공지에서 gemini-2.5-flash-lite-preview-09-2025 모델이 2026년 3월 31일 종료된다고 밝혔습니다. 이처럼 프리뷰 모델은 별도 공지 없이 빠르게 종료될 수 있습니다.
무료 사용 전에 알아두면 좋은 3가지
① 무료 티어에서 발생한 요청은 Google의 AI 학습에 사용될 수 있습니다 — 민감한 데이터는 유료 결제 후 사용하세요
② Google AI Studio 무료 한도는 분당 요청(RPM)과 일일 요청(RPD) 둘 다 제한이 있습니다 — 분당 한도에 걸리면 429 에러가 납니다
③ 무료에서 유료 전환 시 사고 기능이 기본 켜진 상태로 과금이 시작 — 첫 청구서가 생각보다 크게 나올 수 있습니다
개인 프로젝트에서 월 $10~$30 선을 유지하고 싶다면 Google Cloud Console에서 결제 알림을 반드시 설정해두는 걸 권장합니다. 사고 토큰이 예상보다 많이 나오면 알림 없이는 감지가 어렵습니다.
자주 묻는 질문 Q&A
마치며
Gemini 2.5 Pro 요금에서 가장 주의할 점 두 가지를 뽑으라면, 첫째는 구독 요금제로는 API에 접근이 안 된다는 것, 둘째는 사고 토큰이 출력 요금에 고스란히 붙는다는 것입니다. 이 두 가지를 모르고 쓰기 시작하면 첫 청구서에서 당황하게 됩니다.
반면 알고 쓰면 꽤 쓸 만합니다. 실시간성이 필요 없는 작업은 Batch API로 50% 절감할 수 있고, 단순 작업엔 Flash-Lite를 섞어 쓰면 전체 비용을 상당히 낮출 수 있습니다. 복잡도가 낮은 작업까지 Pro에 몰아넣는 게 오히려 손해라는 게 이번에 직접 수치를 뜯어보면서 느낀 부분입니다.
구글이 앞으로 Gemini 3 계열을 구독에서도 더 열어줄 가능성은 있지만, 현재(2026.03.29 기준)로는 API와 구독이 분리된 구조입니다. 이 부분이 바뀌면 그때 다시 확인이 필요합니다.
본 포스팅 참고 자료
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 요금은 Google 공식 페이지에서 최신 정보를 직접 확인하시기 바랍니다. 본 포스팅은 특정 서비스의 구매·투자를 권장하지 않습니다.











댓글 남기기