Gemini 3.1 Pro 요금, $2라고 다 같은 $2가 아닙니다

Published on

in

Gemini 3.1 Pro 요금, 라고 다 같은 가 아닙니다

2026.02.19 기준
gemini-3.1-pro-preview
TECH

Gemini 3.1 Pro 요금, $2라고 다 같은 $2가 아닙니다

Gemini 3.1 Pro Preview가 조용히 출시됐습니다. 공식 가격표는 $2/$12처럼 깔끔해 보이는데, 막상 따져보면 200k 토큰 선에서 요금이 바뀌고 무료 티어는 아예 없습니다. 기존 Gemini 3 Pro를 쓰던 사람이라면 이 부분이 특히 중요합니다.

입력 요금 (≤200k)
$2.00/1M tokens
출력 요금 (≤200k)
$12.00/1M tokens
200k 초과 시
$4/$18 즉시 적용

Gemini 3.1 Pro가 3 Pro Preview를 대체한 배경

2026년 2월 19일, Google은 Gemini 3.1 Pro Preview를 공개했습니다. 이어서 2026년 3월 9일, 기존 gemini-3-pro-preview가 공식 종료됐습니다. (출처: Google AI 공식 릴리스 노트) Firebase Studio를 비롯한 여러 개발 환경에서 Gemini 3 Pro가 갑자기 사라지면서 혼선이 있었는데, 이제 마이그레이션 대상이 명확하게 gemini-3.1-pro-preview로 정해진 상황입니다.

3.1 Pro의 공식 설명은 “Gemini 3 Pro 시리즈의 성능과 안정성을 향상”시킨 버전으로, 더 나은 추론 능력, 향상된 토큰 효율성, 그리고 소프트웨어 엔지니어링 및 에이전트 워크플로우에 최적화된 모델입니다. (출처: Google AI Developers 공식 모델 문서, 2026.02) 단순히 숫자만 올라간 게 아니라, 실제 엔지니어링 행동 패턴 자체가 개선됐다는 게 구글 측의 설명입니다.

ARC-AGI-2 점수 기준으로 Gemini 3 Pro(약 45.1%) 대비 3.1 Pro는 77.1%를 기록했습니다. (출처: 포루애니씽 티스토리, 2026.02.20) 이 수치 하나만 봐도 왜 이름은 ‘0.1’ 업그레이드지만 실제 성능 차이는 상당한지 알 수 있습니다.

▲ 목차로 돌아가기

공식 요금표 — 실제로 어디서 돈이 나가나

공식 Gemini API 요금 페이지(ai.google.dev/gemini-api/docs/pricing)에 게시된 Gemini 3.1 Pro Preview 기준 요금은 다음과 같습니다.

구분 ≤200k 토큰 >200k 토큰
입력 (텍스트/이미지/동영상) $2.00/1M $4.00/1M
출력 (thinking 토큰 포함) $12.00/1M $18.00/1M
컨텍스트 캐싱 $0.20/1M $0.40/1M
캐싱 스토리지 $4.50 / 1M tokens per hour
Google Search 그라운딩 월 5,000 프롬프트 무료, 이후 $14/1,000 쿼리
무료 티어 Not available (없음)

(출처: Google Gemini API 공식 요금 페이지 ai.google.dev/gemini-api/docs/pricing, 2026.03 기준)

💡 공식 발표문과 실제 과금 구조를 같이 놓고 보니 이런 차이가 보였습니다 — 가격표에 적힌 $2/$12는 어디까지나 200k 토큰 이하 기준입니다. Thinking 토큰도 출력 토큰에 포함해 과금되기 때문에, 추론 모드를 켜두면 체감 비용이 예상보다 높게 나올 수 있습니다.

▲ 목차로 돌아가기

무료 티어가 없다는 게 이렇게 중요합니다

이전 Gemini 3 Pro Preview는 무료 티어에서 사용 가능했습니다. 학습 목적이나 소규모 프로젝트 테스트에 활용할 수 있었죠. Gemini 3.1 Pro Preview는 공식 요금 페이지에 Free Tier 항목이 “Not available”로 표기돼 있습니다. 첫 호출부터 과금됩니다. (출처: Google Gemini API 공식 요금 페이지, 2026.03)

⚠ 주의 — 기존에 Gemini 3 Pro Preview로 무료 API 테스트 환경을 구성해 둔 경우, 동일 코드에서 모델명만 gemini-3.1-pro-preview로 바꾸는 순간 즉시 유료로 전환됩니다.

비교 대상인 Gemini 3.1 Flash는 무료 티어에서 입력·출력 토큰이 무료로 제공됩니다. (출처: 동일 요금 페이지) Flash 계열을 프로토타이핑에 쓰고 Pro는 실제 프로덕션에서만 투입하는 전략이 현재로선 가장 합리적입니다.

Batch API는 표준 요금의 절반 수준입니다. 입력 $1.00/1M(≤200k), 출력 $6.00/1M(≤200k)으로, 실시간 응답이 필요 없는 대량 작업에서는 비용을 절반으로 줄일 수 있습니다. (출처: Google Gemini API 공식 요금 페이지, 2026.03) 다만 Batch API 특성상 응답 시간 보장이 없다는 점은 반드시 확인해야 합니다.

▲ 목차로 돌아가기

Gemini 3 Pro와 요금을 직접 비교해봤습니다

가격표만 보면 Gemini 3.1 Pro가 3 Pro보다 비쌉니다. Gemini 3 Pro Preview 출력은 $10/1M(≤200k)이었는데, 3.1 Pro는 $12/1M으로 20% 올랐습니다. 입력도 $1.25→$2.00으로 올랐습니다. (출처: pricepertoken.com 비교 페이지, Google 공식 요금 페이지)

모델 입력/1M 출력/1M 무료 티어
Gemini 3 Pro Preview (구) $1.25 $10.00 무료 제공
Gemini 3.1 Pro Preview (현) $2.00 $12.00 없음
Gemini 3.1 Flash $0.50 $3.00 무료 제공
Gemini 3.1 Flash-Lite $0.10 $0.40 무료 제공

💡 가격표의 숫자와 실사용 요금 흐름을 같이 놓고 보니 이런 차이가 보였습니다 — 3.1 Pro는 명목 요금이 올랐지만, 동일한 작업을 처리할 때 필요한 토큰 수가 줄었다는 평가가 있습니다. Artificial Analysis 벤치마크 기준으로 토큰 효율이 개선됐다는 공식 발표가 있으며, 클리앙 정리 글(2026.02.20)에서도 “비용이나 토큰 사용량의 실질적인 증가 없이 성능을 향상시켰다”는 내용이 언급됩니다. 다만 이는 벤치마크 기준이고, 실제 프로젝트 특성에 따라 토큰 소모량이 달라질 수 있으므로 직접 측정이 필요합니다.

200k 토큰을 넘으면 어떻게 될까요

직접 계산식으로 표현하면 이렇습니다.

시나리오A: 프롬프트 150k 토큰 입력 + 30k 토큰 출력
입력: 150,000 × ($2.00/1,000,000) = $0.30
출력: 30,000 × ($12.00/1,000,000) = $0.36
합계: $0.66

시나리오B: 프롬프트 250k 토큰 입력 + 50k 토큰 출력
입력: 250,000 × ($4.00/1,000,000) = $1.00 ← 단가 2배 점프
출력: 50,000 × ($18.00/1,000,000) = $0.90
합계: $1.90

이 계산은 공식 요금 기준 추정치입니다. (출처: Google Gemini API 공식 요금 페이지, ai.google.dev/gemini-api/docs/pricing, 2026.03) 200k 토큰 초과 여부 한 번으로 호출당 비용이 약 3배 가까이 차이 나는 것을 확인할 수 있습니다.

▲ 목차로 돌아가기

customtools 엔드포인트, 아직 모르는 분이 많습니다

Gemini 3.1 Pro Preview에는 공식적으로 별도 엔드포인트가 존재합니다. gemini-3.1-pro-preview-customtools로, 커스텀 툴을 사용하는 에이전트 워크플로우에 최적화된 버전입니다. (출처: Google AI Developers 공식 모델 문서, gemini-3.1-pro-preview 페이지)

이 엔드포인트는 view_file, search_code 같은 커스텀 함수 호출 시 해당 툴을 우선적으로 활성화합니다. bash와 커스텀 툴을 혼용하는 에이전트 파이프라인에서 의도치 않게 기본 툴이 우선되는 문제를 줄이기 위해 분리된 것으로 보입니다.

⚡ 단, 공식 문서에 명시된 주의 사항customtools 엔드포인트는 커스텀 툴·bash가 포함되지 않는 일반 사용에서는 품질 변동(quality fluctuations)이 발생할 수 있다고 명시돼 있습니다. (출처: Google AI Developers 공식 모델 문서, 2026.02) 에이전트 파이프라인 전용으로만 사용하는 게 안전합니다.

두 엔드포인트의 요금은 동일합니다. 어떤 엔드포인트를 쓰느냐에 따라 추가 과금이 발생하지는 않습니다. 다만 자신의 사용 패턴에 맞지 않는 엔드포인트를 선택하면 성능 손실이 생기고, 그 손실을 보완하기 위해 더 많은 토큰이 소모돼 간접적으로 비용이 늘어날 수 있습니다.

▲ 목차로 돌아가기

Knowledge cutoff이 2025년 1월인 모델을 2026년에 쓸 때

Gemini 3.1 Pro Preview의 Knowledge cutoff은 2025년 1월입니다. (출처: Google AI Developers 공식 모델 문서, 2026.02) 현재 시점(2026년 3월)과 약 14개월의 공백이 있습니다. 이 기간 동안의 사건이나 최신 정보는 모델이 학습하지 않았습니다.

Google Search 그라운딩 기능을 함께 사용하면 실시간 정보 조회는 가능하지만, 이것은 검색 결과를 불러오는 방식이지 모델의 내부 지식이 아닙니다. Search 그라운딩은 월 5,000 프롬프트까지 무료이며, 이후 1,000쿼리당 $14가 추가됩니다. (출처: Google Gemini API 공식 요금 페이지, 2026.03)

💡 성능 벤치마크와 실제 지식 한계를 같이 놓고 보니 이런 차이가 보였습니다 — ARC-AGI-2 점수 77.1%는 추론 능력을 측정한 것이고, Knowledge cutoff 이후의 사실 정보를 얼마나 아는지는 전혀 다른 문제입니다. 최신 API 문서나 법률 개정 내용처럼 2025년 2월 이후 변경된 정보를 다룰 때는 반드시 Search 그라운딩이나 외부 컨텍스트를 프롬프트에 직접 삽입해야 합니다.

▲ 목차로 돌아가기

Q&A

Q1. Gemini 3 Pro Preview가 종료됐는데, 반드시 3.1 Pro로 올려야 하나요?

반드시 3.1 Pro일 필요는 없습니다. Gemini 3.1 Flash도 동일한 Gemini 3.1 계열 모델이고, 멀티모달 지원 및 1M 컨텍스트 윈도우를 제공합니다. 비용이 Pro 대비 약 1/4 수준이므로, 작업 성격에 따라 Flash로도 충분한 경우가 많습니다. 추론 집약적 작업이나 소프트웨어 엔지니어링 에이전트 파이프라인에서만 Pro를 선택적으로 활용하는 방식이 현재 가장 효율적입니다.

Q2. 200k 토큰 초과 여부를 사전에 알 수 있나요?

Gemini API는 토큰 계산 메서드(countTokens)를 제공합니다. 실제 API 호출 전 토큰 수를 사전에 측정해 200k 초과 여부를 확인하고 프롬프트를 분할할 수 있습니다. 컨텍스트 캐싱을 적극적으로 활용하면 반복되는 시스템 프롬프트나 문서 컨텍스트의 재입력 비용을 절감할 수 있습니다.

Q3. Thinking 토큰이 출력 비용에 포함된다는 게 어떤 의미인가요?

Gemini 3.1 Pro는 추론 과정에서 내부적으로 생각하는 단계(thinking tokens)를 거칩니다. 이 사고 과정에서 발생한 토큰도 출력 토큰으로 과금됩니다. 복잡한 수학 문제나 코드 디버깅 같은 작업에서 thinking 토큰이 대량 발생하면 최종 답변 길이보다 훨씬 많은 토큰이 과금될 수 있습니다. 비용 예측 시 thinking 토큰 소모량까지 감안한 버퍼가 필요합니다.

Q4. Vertex AI로 쓰면 요금이 다른가요?

Vertex AI의 Gemini 3.1 Pro 요금은 별도 체계입니다. Google Cloud Vertex AI 요금 페이지에서 확인해야 하며, Enterprise 고객은 볼륨 기반 할인 및 프로비저닝 처리량 옵션이 적용됩니다. 일반 개발자는 Google AI Studio를 통한 Gemini API 직접 사용이 더 간단하고 요금 구조도 투명합니다.

Q5. Preview 딱지가 붙어 있어서 프로덕션에 쓰기 꺼려지는데, 언제 정식 출시되나요?

공식 정식 출시 일정은 2026년 3월 현재 확인 불가 상태입니다. Preview 단계에서는 모델 스펙·요금이 변경될 수 있고 레이트 리밋도 더 제한적이라고 공식 문서에 명시돼 있습니다. 프로덕션 안정성이 최우선이라면 정식 버전 출시 이후 전환을 검토하거나, Gemini 2.5 Pro처럼 이미 안정화된 모델을 함께 비교하는 것을 권장합니다. (확인 필요: 정식 출시 시점 및 요금 변동 여부)

▲ 목차로 돌아가기

마치며

Gemini 3.1 Pro Preview는 현재 AI 벤치마크 상단을 점령하고 있는 모델입니다. ARC-AGI-2 77.1%, Artificial Analysis Intelligence Index 1위(57점)라는 수치는 그냥 나온 게 아닙니다. 에이전트 워크플로우와 코딩 자동화 쪽에서 실질적으로 쓸 만한 수준까지 올라왔습니다.

그런데 요금 구조를 제대로 보지 않고 쓰다 보면 청구서에서 놀라는 경우가 생깁니다. 무료 티어 없음, 200k 초과 시 단가 2배, thinking 토큰 과금 포함 — 이 세 가지는 기존 Gemini 3 Pro 사용 경험에서 전혀 예상하기 어려운 변화입니다.

솔직히 말하면, 아직 Preview 딱지가 붙어 있고 Knowledge cutoff도 2025년 1월로 14개월의 공백이 있습니다. 성능은 인상적이지만 프로덕션에 바로 전면 투입하기 전에 요금 모니터링 환경을 먼저 구성하고, Flash로 처리 가능한 작업은 분리하는 게 현명합니다.

본 포스팅 참고 자료

  1. ① Google Gemini API 공식 요금 페이지 — https://ai.google.dev/gemini-api/docs/pricing
  2. ② Google AI Developers — gemini-3.1-pro-preview 공식 모델 문서 — https://ai.google.dev/gemini-api/docs/models/gemini-3.1-pro-preview
  3. ③ Google Gemini API 릴리스 노트 (2026.01~03) — https://ai.google.dev/gemini-api/docs/changelog
  4. ④ Artificial Analysis — Gemini 3.1 Pro Preview vs Gemini 3 Pro Preview 비교 — https://artificialanalysis.ai/models/comparisons/…
  5. ⑤ Google Blog — A new era of intelligence with Gemini 3 (2025.11.18) — https://blog.google/products-and-platforms/products/gemini/gemini-3/

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Google Gemini API의 요금, 모델 스펙, 레이트 리밋은 공식 발표 없이 업데이트될 수 있으므로, 최신 정보는 Google AI Developers 공식 문서(ai.google.dev)에서 직접 확인하시기 바랍니다. 본 글은 2026년 3월 18일 기준 공식 자료를 바탕으로 작성되었습니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기