Gemini 3.1 Pro API, 프리뷰라서 더 비쌉니다

Published on

in

Gemini 3.1 Pro API, 프리뷰라서 더 비쌉니다
2026.03.19 기준
Gemini 3.1 Pro Preview 기준
IT/AI

Gemini 3.1 Pro API,
프리뷰라서 더 비쌉니다

결론부터 말씀드리면, Gemini 3.1 Pro API는 Flash 대비 입력 토큰 기준 6.7배, 출력 토큰 기준 4.8배 비쌉니다. 그런데도 지금은 ‘Preview’ 딱지가 붙어 있어 레이트 리밋이 정식 모델보다 더 제한적입니다. 벤치마크 1위 모델이 맞긴 한데, 비용과 제약 조건을 먼저 보지 않으면 고생합니다.

입력 토큰 (200K 이하)
$2.00 /1M tokens
출력 토큰
$12.00 /1M tokens
ARC-AGI-2 벤치마크
77.1%

Gemini 3.1 Pro API가 지금 뭔지

2026년 2월 19일, 구글은 Gemini 3.1 Pro를 공식 출시했습니다. Gemini 3 시리즈를 기반으로 핵심 추론 능력을 대폭 강화한 모델로, 구글 AI 스튜디오(Google AI Studio)와 Vertex AI를 통해 API 형태로 접근할 수 있습니다. 출시 당일 Artificial Analysis 지능 지수 1위를 기록했다는 발표가 나왔는데, 그 배경을 보면 단순한 점수가 아닙니다.

ARC-AGI-2 벤치마크에서 77.1%를 기록했고, 이는 이전 모델인 Gemini 3 Pro 대비 2배 이상 향상된 수치입니다. (출처: Google 공식 블로그, 2026.02.19) 코딩 벤치마크인 Terminal-Bench Hard에서 54%, SciCode에서 59%로 코딩 분야에서도 현 시점 1위를 유지하고 있습니다.

단, 지금 이 글을 쓰는 시점(2026.03.19)에서 Gemini 3.1 Pro는 ‘Preview’ 상태로 제공되고 있습니다. 정식(Stable) 버전이 아니라는 뜻이고, 이게 비용 구조와 제약에 직접 영향을 줍니다.

▲ 목차로 돌아가기

공식 가격표, 숫자 그대로 읽으면 틀립니다

구글 AI 개발자 공식 가격 페이지 기준(2026.03.19 확인), Gemini 3.1 Pro API 요금은 다음과 같습니다.

구분 컨텍스트 ≤200K 컨텍스트 >200K
입력 토큰 $1.25 / 1M $2.50 / 1M
출력 토큰 $10.00 / 1M $15.00 / 1M
컨텍스트 캐싱 $0.31 / 1M $0.63 / 1M

(출처: Google AI Developer 공식 가격 페이지, ai.google.dev/gemini-api/docs/pricing, 2026.03.19 확인)

그런데 위 표에서 주목할 부분이 있습니다. 입력 $1.25, 출력 $10.00는 200K 이하 컨텍스트 기준인데, 200K를 넘어가는 순간 입력은 2배, 출력은 1.5배 뛰어오릅니다. 100만 토큰짜리 문서 하나를 통째로 넣으면 200K를 훌쩍 넘어가기 때문에, 롱 컨텍스트를 쓰려고 Pro를 선택했다면 실제 요금은 훨씬 더 나옵니다. 이 부분을 체감 없이 쓰다가 청구서를 보고 당황하는 경우가 있습니다.

Flash와 비교하면 얼마나 차이 나나요?

모델 입력 /1M 출력 /1M Pro 대비 배율
Gemini 3.1 Pro $1.25 $10.00 기준
Gemini 3.1 Flash $0.30 $2.50 입력 1/4, 출력 1/4
Gemini 3.1 Flash-Lite $0.10 $0.40 입력 1/12.5, 출력 1/25

(출처: Google AI Developer 공식 가격 페이지, 2026.03.19 확인)

▲ 목차로 돌아가기

Flash로 충분한 경우 vs Pro가 필요한 경우

💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다 — 구글이 Pro와 Flash를 구분하는 기준이 단순 ‘성능 차이’가 아니라 추론 깊이와 에이전트 워크플로우 여부라는 것입니다.

구글 공식 블로그(2026.02.19)는 Gemini 3.1 Pro가 “모델 스스로 최적의 솔루션 구축 방식을 판단하고 실행해야 하는 워크플로우”를 위해 설계됐다고 명시합니다. 반대로 말하면, 그런 복잡성이 없는 작업에 Pro를 쓰는 건 비용 낭비라는 뜻이기도 합니다.

직접 계산해보겠습니다. 간단한 요약·분류·번역 작업을 하루 1,000번 실행한다고 가정하고, 요청당 평균 입력 2,000토큰 + 출력 500토큰으로 잡으면:

📊 Flash vs Pro 월간 비용 계산 (일 1,000 요청 기준)
일일 입력 토큰 = 1,000회 × 2,000 = 2,000,000 tokens
일일 출력 토큰 = 1,000회 × 500 = 500,000 tokens
Flash 일간 비용: (2M × $0.30/M) + (0.5M × $2.50/M) = $0.60 + $1.25 = $1.85/일
Flash 월간 비용: $1.85 × 30 = 약 $55.5/월
Pro 일간 비용: (2M × $1.25/M) + (0.5M × $10.00/M) = $2.50 + $5.00 = $7.50/일
Pro 월간 비용: $7.50 × 30 = 약 $225/월

즉, 같은 작업량에서 Flash 대신 Pro를 쓰면 월 약 170달러(약 24만 원) 더 나옵니다. 이 차이가 의미 있으려면 실제로 Flash가 틀리고 Pro가 맞는 답을 내는 작업이어야 합니다.

Pro를 써야 할 때는 명확합니다. 복잡한 수학·물리 추론, 코드 에이전트가 여러 도구를 자율 호출하는 멀티스텝 워크플로우, 연구 수준의 분석처럼 추론 오류가 치명적인 경우입니다. 반면 요약, 분류, 감성 분석, 간단한 FAQ 응답처럼 정형화된 반복 작업이라면 Flash나 Flash-Lite에서 시작하는 게 맞습니다.

▲ 목차로 돌아가기

100만 토큰 컨텍스트, 실제로는 다릅니다

💡 구글이 공식적으로 ‘100만 토큰 컨텍스트 창’을 광고하지만, 접근 경로에 따라 실제로 경험하는 컨텍스트는 완전히 다릅니다. 이걸 모르고 앱을 쓰면 광고와 다른 경험을 하게 됩니다.

구글은 Gemini 3.1 Pro의 컨텍스트 창을 100만 토큰으로 공식 명시합니다. API를 통해 직접 호출할 경우 이 수치는 실제로 적용됩니다. Artificial Analysis 평가 결과에서도 3.1 Pro Preview가 전체 지능 지수 실행에 5,700만 토큰을 사용했다고 보고되며, 이는 100만 토큰 창을 실제로 활용하는 것이 가능함을 보여줍니다. (출처: Artificial Analysis, 2026.02.19)

그런데 일반 Gemini 앱(gemini.google.com)에서는 상황이 다릅니다. Reddit(r/GeminiAI, 2026.01.21)에는 378명이 공감한 스레드가 있는데, Pro 유료 가입자가 약 30개 메시지 이후부터 초반 맥락을 잃어버리기 시작했다고 보고했습니다. AI Studio에서 직접 토큰을 세어봤더니 약 30,000토큰 수준이었다고 합니다.

이에 대해 Google 측의 공식 해명은 없지만, 커뮤니티 내에서 두 가지 설명이 나왔습니다. 첫 번째는 앱이 응답 속도를 위해 오래된 메시지를 슬라이딩 윈도우 방식으로 드롭한다는 것, 두 번째는 앱이 100만 토큰 컨텍스트 전체를 모델에 실어 보내지 않는다는 것입니다.

⚠️ 접근 경로에 따른 컨텍스트 경험 차이 (확인 필요)
  • API Key 직접 호출: 공식 100만 토큰 한도 적용 (요금 부과)
  • Google AI Studio (무료 계정): 실질적으로 100만 토큰 사용 가능하나 RPD 제한 있음
  • Gemini 앱 (AI Pro 구독): 앱 자체 최적화로 실제 사용 가능 컨텍스트 제한 가능성 — Google 미공식 확인

결론적으로, 100만 토큰 컨텍스트가 필요한 작업이라면 API Key를 사용하거나 AI Studio에서 직접 테스트하는 것이 현재로서는 더 신뢰할 수 있는 방법입니다.

▲ 목차로 돌아가기

무료로 쓸 수 있는 경로, 실제 한계는 여기서 걸립니다

구글 AI 개발자 공식 가격 페이지에 따르면, Gemini API는 무료 티어(Free Tier)를 제공합니다. 그런데 Gemini 3.1 Pro는 무료 티어에서 사실상 쓰기 어렵습니다. 이유는 두 가지입니다.

모델 무료 RPM 무료 RPD 무료 여부
Gemini 3.1 Pro 없음 (유료만) 없음 ❌ 유료만 가능
Gemini 3.1 Flash 15 RPM 1,500 RPD ✅ 무료 가능
Gemini 3.1 Flash-Lite 30 RPM 1,500 RPD ✅ 무료 가능

(출처: Google AI Developer 공식 가격 페이지, 2026.03.19 확인)

API Key 방식으로 Gemini 3.1 Pro를 호출하려면 반드시 결제가 필요합니다. 무료로 Pro 성능을 테스트하고 싶다면 Google AI Studio 웹 인터페이스를 통하는 방법이 있습니다. 로그인 후 AI Studio에서 직접 3.1 Pro 모델을 선택해 대화할 수 있고, 이 경우 별도 결제 없이 접근할 수 있습니다. 단, AI Studio의 무료 사용량도 상한이 있습니다.

한 가지 더 주의할 점은 Preview 모델의 레이트 리밋입니다. 구글 공식 문서에는 “Preview 모델은 정식(Stable) 버전보다 더 제한적인 레이트 리밋이 적용될 수 있다”고 명시돼 있습니다. (출처: Google AI Developer Docs) 현재 Gemini 3.1 Pro Preview는 Tier 1 유료 사용자 기준으로도 분당 요청 수에 추가 제한이 있을 수 있으며, 정식 릴리스 전까지 이 조건은 바뀔 수 있습니다.

▲ 목차로 돌아가기

AI Studio vs API Key, 같은 모델인데 다르게 청구됩니다

💡 Google AI Studio에서 쓸 때와 API Key로 직접 호출할 때, 같은 Gemini 3.1 Pro를 쓰는 것처럼 보이지만 청구 구조가 완전히 다릅니다. 이걸 모르면 예상치 못한 비용이 나올 수 있습니다.

Google AI Studio 웹 인터페이스: 구글 계정으로 로그인 후 사용하는 경우, 무료 사용량 한도 내에서는 청구가 없습니다. 단, AI Studio에서 API Key를 발급받고 그 Key로 코드에서 직접 호출하면 그 순간부터 요금이 발생합니다.

Vertex AI를 통한 Gemini 3.1 Pro: 기업 환경에서는 Vertex AI를 통해 동일 모델에 접근하는 경우가 많습니다. Vertex AI의 Gemini 3.1 Pro 가격은 입력 $2.00/1M(≤200K), 출력 $12.00/1M입니다. AI Developer API의 $1.25/$10.00와 차이가 납니다. (출처: Google Cloud Vertex AI 공식 가격, 2026.03.19 확인) 동일 모델인데 접근 경로에 따라 입력 토큰 기준 60% 더 비싸게 청구될 수 있다는 뜻입니다.

접근 경로 입력 /1M (≤200K) 출력 /1M
Google AI Developer API $1.25 $10.00
Vertex AI (Google Cloud) $2.00 $12.00

(출처: Google AI Developer API 가격 페이지 및 Vertex AI 가격 페이지, 2026.03.19 확인)

Vertex AI는 엔터프라이즈 기능(SLA, VPC, 데이터 레지던시 등)이 포함돼 있어 기업 용도에 맞는 선택입니다. 개인 개발자나 스타트업 초기 단계라면 Google AI Developer API를 우선 검토하는 편이 비용을 줄일 수 있습니다.

▲ 목차로 돌아가기

자주 묻는 질문

Q1. Gemini 3.1 Pro Preview는 언제 Stable로 전환되나요?
구글이 공식 일정을 발표하지 않았습니다. 공식 문서에는 “Preview 모델은 Stable 버전이 되기 전 변경될 수 있다”는 문구만 있습니다. (출처: Google AI Developer Docs) Stable 전환 시 가격 변동 가능성도 배제할 수 없어 프로덕션 적용 전 확인이 필요합니다.
Q2. Gemini 3.1 Flash와 Pro를 어떻게 선택해야 하나요?
정형화된 반복 작업(요약, 분류, 번역, FAQ 응답 등)은 Flash부터 시작하는 게 맞습니다. 멀티스텝 코드 에이전트, 복잡한 수학·과학 추론, 다단계 논리 분석처럼 오류가 치명적인 작업에서는 Pro를 검토하세요. 실제 정확도 차이를 A/B 테스트로 확인한 후 전환하는 것이 가장 안전합니다.
Q3. 컨텍스트 캐싱을 쓰면 비용이 많이 줄어드나요?
캐싱된 토큰 가격은 일반 입력 토큰 대비 약 25% 수준($0.31/1M vs $1.25/1M)으로 저렴합니다. 시스템 프롬프트나 고정 컨텍스트가 길고 반복적으로 재사용된다면 컨텍스트 캐싱이 비용 절감에 효과적입니다. 단, 캐시 스토리지 비용($4.50/1M/시간)이 별도로 발생하므로 캐시 유지 시간 설정을 잘 조정해야 합니다. (출처: Google AI Developer API 가격 페이지)
Q4. 200K 토큰을 넘으면 가격이 어떻게 되나요?
입력 토큰이 200K를 초과하면 $1.25/1M에서 $2.50/1M으로 2배 인상됩니다. 출력 토큰도 $10.00/1M에서 $15.00/1M으로 1.5배 오릅니다. 100만 토큰 컨텍스트를 실제로 채워 쓰려면 이 가격 구간에 해당하므로 롱 컨텍스트 활용 전 비용 시뮬레이션이 필수입니다. (출처: Google AI Developer API 가격 페이지)
Q5. Gemini 앱(AI Pro) 구독이 있으면 API도 무료로 쓸 수 있나요?
아닙니다. Gemini 앱 AI Pro/Ultra 구독과 Gemini API는 별개의 과금 체계입니다. 앱 구독은 gemini.google.com 및 Google 제품 내 Gemini 사용에 한정됩니다. API Key를 발급받아 코드에서 호출하는 것은 별도 결제가 필요합니다. AI Studio 웹에서 직접 테스트하는 것만 구독 없이 무료로 가능합니다. (Reddit r/GeminiAI 커뮤니티 및 Google 공식 문서 기준)

▲ 목차로 돌아가기

마치며

Gemini 3.1 Pro API는 2026년 2월 기준 Artificial Analysis 지능 지수 1위, ARC-AGI-2 77.1%, 코딩·추론 벤치마크 다수 1위를 달성한 모델입니다. 성능 측면에서는 현 시점 최상위권이 맞습니다.

그런데 막상 써보면 이게 핵심입니다 — 성능이 좋다는 것과 내 서비스에 Pro가 필요하다는 건 다른 얘기입니다. Flash 대비 출력 토큰 기준 4배 비싸고, 200K 넘어가면 또 1.5배 뛰고, 프리뷰 딱지 때문에 레이트 리밋도 더 빡빡합니다. 게다가 Gemini 앱에서 경험하는 컨텍스트와 API에서 경험하는 컨텍스트가 다르게 작동할 수 있다는 점도 알고 들어가야 합니다.

비용이 아깝지 않으려면 순서가 있습니다. Flash-Lite로 시작해서 정확도가 부족한 작업을 파악하고, 그 작업만 Flash로 올리고, 그래도 부족한 핵심 추론 작업에만 Pro를 배정하는 단계적 접근이 현실적입니다. Pro 전면 적용은 비용 검증 이후에 해도 늦지 않습니다.

▲ 목차로 돌아가기

📚 본 포스팅 참고 자료
  1. Google 공식 블로그 (한국어) — 제미나이 3.1 프로 출시 발표
    blog.google/intl/ko-kr/products/gemini-3-1-pro-kr/ (2026.02.19)
  2. Google AI Developer 공식 가격 페이지
    ai.google.dev/gemini-api/docs/pricing
  3. Google Cloud Vertex AI 공식 가격 페이지
    cloud.google.com/vertex-ai/generative-ai/pricing
  4. Artificial Analysis — Gemini 3.1 Pro Preview 성능·비용 분석
    artificialanalysis.ai/models/gemini-3-1-pro-preview (2026.02.19)

⚠️ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Gemini API 가격 및 레이트 리밋은 구글의 정책에 따라 언제든 변경될 수 있으므로, 실제 사용 전 공식 페이지를 반드시 재확인하시기 바랍니다. 본 포스팅의 수치는 2026년 3월 19일 기준 공식 문서를 바탕으로 작성되었습니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기