gemini-3.1-pro-preview
TECH
Gemini 3.1 Pro 요금, $2라고 다 같은 $2가 아닙니다
Gemini 3.1 Pro Preview가 조용히 출시됐습니다. 공식 가격표는 $2/$12처럼 깔끔해 보이는데, 막상 따져보면 200k 토큰 선에서 요금이 바뀌고 무료 티어는 아예 없습니다. 기존 Gemini 3 Pro를 쓰던 사람이라면 이 부분이 특히 중요합니다.
Gemini 3.1 Pro가 3 Pro Preview를 대체한 배경
2026년 2월 19일, Google은 Gemini 3.1 Pro Preview를 공개했습니다. 이어서 2026년 3월 9일, 기존 gemini-3-pro-preview가 공식 종료됐습니다. (출처: Google AI 공식 릴리스 노트) Firebase Studio를 비롯한 여러 개발 환경에서 Gemini 3 Pro가 갑자기 사라지면서 혼선이 있었는데, 이제 마이그레이션 대상이 명확하게 gemini-3.1-pro-preview로 정해진 상황입니다.
3.1 Pro의 공식 설명은 “Gemini 3 Pro 시리즈의 성능과 안정성을 향상”시킨 버전으로, 더 나은 추론 능력, 향상된 토큰 효율성, 그리고 소프트웨어 엔지니어링 및 에이전트 워크플로우에 최적화된 모델입니다. (출처: Google AI Developers 공식 모델 문서, 2026.02) 단순히 숫자만 올라간 게 아니라, 실제 엔지니어링 행동 패턴 자체가 개선됐다는 게 구글 측의 설명입니다.
ARC-AGI-2 점수 기준으로 Gemini 3 Pro(약 45.1%) 대비 3.1 Pro는 77.1%를 기록했습니다. (출처: 포루애니씽 티스토리, 2026.02.20) 이 수치 하나만 봐도 왜 이름은 ‘0.1’ 업그레이드지만 실제 성능 차이는 상당한지 알 수 있습니다.
공식 요금표 — 실제로 어디서 돈이 나가나
공식 Gemini API 요금 페이지(ai.google.dev/gemini-api/docs/pricing)에 게시된 Gemini 3.1 Pro Preview 기준 요금은 다음과 같습니다.
| 구분 | ≤200k 토큰 | >200k 토큰 |
|---|---|---|
| 입력 (텍스트/이미지/동영상) | $2.00/1M | $4.00/1M |
| 출력 (thinking 토큰 포함) | $12.00/1M | $18.00/1M |
| 컨텍스트 캐싱 | $0.20/1M | $0.40/1M |
| 캐싱 스토리지 | $4.50 / 1M tokens per hour | |
| Google Search 그라운딩 | 월 5,000 프롬프트 무료, 이후 $14/1,000 쿼리 | |
| 무료 티어 | Not available (없음) | |
(출처: Google Gemini API 공식 요금 페이지 ai.google.dev/gemini-api/docs/pricing, 2026.03 기준)
💡 공식 발표문과 실제 과금 구조를 같이 놓고 보니 이런 차이가 보였습니다 — 가격표에 적힌 $2/$12는 어디까지나 200k 토큰 이하 기준입니다. Thinking 토큰도 출력 토큰에 포함해 과금되기 때문에, 추론 모드를 켜두면 체감 비용이 예상보다 높게 나올 수 있습니다.
무료 티어가 없다는 게 이렇게 중요합니다
이전 Gemini 3 Pro Preview는 무료 티어에서 사용 가능했습니다. 학습 목적이나 소규모 프로젝트 테스트에 활용할 수 있었죠. Gemini 3.1 Pro Preview는 공식 요금 페이지에 Free Tier 항목이 “Not available”로 표기돼 있습니다. 첫 호출부터 과금됩니다. (출처: Google Gemini API 공식 요금 페이지, 2026.03)
⚠ 주의 — 기존에 Gemini 3 Pro Preview로 무료 API 테스트 환경을 구성해 둔 경우, 동일 코드에서 모델명만 gemini-3.1-pro-preview로 바꾸는 순간 즉시 유료로 전환됩니다.
비교 대상인 Gemini 3.1 Flash는 무료 티어에서 입력·출력 토큰이 무료로 제공됩니다. (출처: 동일 요금 페이지) Flash 계열을 프로토타이핑에 쓰고 Pro는 실제 프로덕션에서만 투입하는 전략이 현재로선 가장 합리적입니다.
Batch API는 표준 요금의 절반 수준입니다. 입력 $1.00/1M(≤200k), 출력 $6.00/1M(≤200k)으로, 실시간 응답이 필요 없는 대량 작업에서는 비용을 절반으로 줄일 수 있습니다. (출처: Google Gemini API 공식 요금 페이지, 2026.03) 다만 Batch API 특성상 응답 시간 보장이 없다는 점은 반드시 확인해야 합니다.
Gemini 3 Pro와 요금을 직접 비교해봤습니다
가격표만 보면 Gemini 3.1 Pro가 3 Pro보다 비쌉니다. Gemini 3 Pro Preview 출력은 $10/1M(≤200k)이었는데, 3.1 Pro는 $12/1M으로 20% 올랐습니다. 입력도 $1.25→$2.00으로 올랐습니다. (출처: pricepertoken.com 비교 페이지, Google 공식 요금 페이지)
| 모델 | 입력/1M | 출력/1M | 무료 티어 |
|---|---|---|---|
| Gemini 3 Pro Preview (구) | $1.25 | $10.00 | 무료 제공 |
| Gemini 3.1 Pro Preview (현) | $2.00 | $12.00 | 없음 |
| Gemini 3.1 Flash | $0.50 | $3.00 | 무료 제공 |
| Gemini 3.1 Flash-Lite | $0.10 | $0.40 | 무료 제공 |
💡 가격표의 숫자와 실사용 요금 흐름을 같이 놓고 보니 이런 차이가 보였습니다 — 3.1 Pro는 명목 요금이 올랐지만, 동일한 작업을 처리할 때 필요한 토큰 수가 줄었다는 평가가 있습니다. Artificial Analysis 벤치마크 기준으로 토큰 효율이 개선됐다는 공식 발표가 있으며, 클리앙 정리 글(2026.02.20)에서도 “비용이나 토큰 사용량의 실질적인 증가 없이 성능을 향상시켰다”는 내용이 언급됩니다. 다만 이는 벤치마크 기준이고, 실제 프로젝트 특성에 따라 토큰 소모량이 달라질 수 있으므로 직접 측정이 필요합니다.
200k 토큰을 넘으면 어떻게 될까요
직접 계산식으로 표현하면 이렇습니다.
입력: 150,000 × ($2.00/1,000,000) = $0.30
출력: 30,000 × ($12.00/1,000,000) = $0.36
합계: $0.66
시나리오B: 프롬프트 250k 토큰 입력 + 50k 토큰 출력
입력: 250,000 × ($4.00/1,000,000) = $1.00 ← 단가 2배 점프
출력: 50,000 × ($18.00/1,000,000) = $0.90
합계: $1.90
이 계산은 공식 요금 기준 추정치입니다. (출처: Google Gemini API 공식 요금 페이지, ai.google.dev/gemini-api/docs/pricing, 2026.03) 200k 토큰 초과 여부 한 번으로 호출당 비용이 약 3배 가까이 차이 나는 것을 확인할 수 있습니다.
customtools 엔드포인트, 아직 모르는 분이 많습니다
Gemini 3.1 Pro Preview에는 공식적으로 별도 엔드포인트가 존재합니다. gemini-3.1-pro-preview-customtools로, 커스텀 툴을 사용하는 에이전트 워크플로우에 최적화된 버전입니다. (출처: Google AI Developers 공식 모델 문서, gemini-3.1-pro-preview 페이지)
이 엔드포인트는 view_file, search_code 같은 커스텀 함수 호출 시 해당 툴을 우선적으로 활성화합니다. bash와 커스텀 툴을 혼용하는 에이전트 파이프라인에서 의도치 않게 기본 툴이 우선되는 문제를 줄이기 위해 분리된 것으로 보입니다.
⚡ 단, 공식 문서에 명시된 주의 사항 — customtools 엔드포인트는 커스텀 툴·bash가 포함되지 않는 일반 사용에서는 품질 변동(quality fluctuations)이 발생할 수 있다고 명시돼 있습니다. (출처: Google AI Developers 공식 모델 문서, 2026.02) 에이전트 파이프라인 전용으로만 사용하는 게 안전합니다.
두 엔드포인트의 요금은 동일합니다. 어떤 엔드포인트를 쓰느냐에 따라 추가 과금이 발생하지는 않습니다. 다만 자신의 사용 패턴에 맞지 않는 엔드포인트를 선택하면 성능 손실이 생기고, 그 손실을 보완하기 위해 더 많은 토큰이 소모돼 간접적으로 비용이 늘어날 수 있습니다.
Knowledge cutoff이 2025년 1월인 모델을 2026년에 쓸 때
Gemini 3.1 Pro Preview의 Knowledge cutoff은 2025년 1월입니다. (출처: Google AI Developers 공식 모델 문서, 2026.02) 현재 시점(2026년 3월)과 약 14개월의 공백이 있습니다. 이 기간 동안의 사건이나 최신 정보는 모델이 학습하지 않았습니다.
Google Search 그라운딩 기능을 함께 사용하면 실시간 정보 조회는 가능하지만, 이것은 검색 결과를 불러오는 방식이지 모델의 내부 지식이 아닙니다. Search 그라운딩은 월 5,000 프롬프트까지 무료이며, 이후 1,000쿼리당 $14가 추가됩니다. (출처: Google Gemini API 공식 요금 페이지, 2026.03)
💡 성능 벤치마크와 실제 지식 한계를 같이 놓고 보니 이런 차이가 보였습니다 — ARC-AGI-2 점수 77.1%는 추론 능력을 측정한 것이고, Knowledge cutoff 이후의 사실 정보를 얼마나 아는지는 전혀 다른 문제입니다. 최신 API 문서나 법률 개정 내용처럼 2025년 2월 이후 변경된 정보를 다룰 때는 반드시 Search 그라운딩이나 외부 컨텍스트를 프롬프트에 직접 삽입해야 합니다.
Q&A
마치며
Gemini 3.1 Pro Preview는 현재 AI 벤치마크 상단을 점령하고 있는 모델입니다. ARC-AGI-2 77.1%, Artificial Analysis Intelligence Index 1위(57점)라는 수치는 그냥 나온 게 아닙니다. 에이전트 워크플로우와 코딩 자동화 쪽에서 실질적으로 쓸 만한 수준까지 올라왔습니다.
그런데 요금 구조를 제대로 보지 않고 쓰다 보면 청구서에서 놀라는 경우가 생깁니다. 무료 티어 없음, 200k 초과 시 단가 2배, thinking 토큰 과금 포함 — 이 세 가지는 기존 Gemini 3 Pro 사용 경험에서 전혀 예상하기 어려운 변화입니다.
솔직히 말하면, 아직 Preview 딱지가 붙어 있고 Knowledge cutoff도 2025년 1월로 14개월의 공백이 있습니다. 성능은 인상적이지만 프로덕션에 바로 전면 투입하기 전에 요금 모니터링 환경을 먼저 구성하고, Flash로 처리 가능한 작업은 분리하는 게 현명합니다.
본 포스팅 참고 자료
- ① Google Gemini API 공식 요금 페이지 — https://ai.google.dev/gemini-api/docs/pricing
- ② Google AI Developers — gemini-3.1-pro-preview 공식 모델 문서 — https://ai.google.dev/gemini-api/docs/models/gemini-3.1-pro-preview
- ③ Google Gemini API 릴리스 노트 (2026.01~03) — https://ai.google.dev/gemini-api/docs/changelog
- ④ Artificial Analysis — Gemini 3.1 Pro Preview vs Gemini 3 Pro Preview 비교 — https://artificialanalysis.ai/models/comparisons/…
- ⑤ Google Blog — A new era of intelligence with Gemini 3 (2025.11.18) — https://blog.google/products-and-platforms/products/gemini/gemini-3/
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Google Gemini API의 요금, 모델 스펙, 레이트 리밋은 공식 발표 없이 업데이트될 수 있으므로, 최신 정보는 Google AI Developers 공식 문서(ai.google.dev)에서 직접 확인하시기 바랍니다. 본 글은 2026년 3월 18일 기준 공식 자료를 바탕으로 작성되었습니다.


댓글 남기기