Gemini 3.1 Pro, 추론이 2.5배 올랐는데 가격은 그대롭니다

Published on

in

Gemini 3.1 Pro, 추론이 2.5배 올랐는데 가격은 그대롭니다

2026.03.12 기준 / Gemini 3.1 Pro Preview

2026년 2월 19일 출시, 3월 12일 구글 코리아 공식 발표. ARC-AGI-2 추론 점수 77.1%로 전 버전 대비 2.5배 향상됐지만 API 단가는 한 푼도 오르지 않았습니다. 그런데 막상 쓰려고 보면 경로마다 한도 구조가 완전히 다릅니다.

ARC-AGI-2 77.1%
API 가격 동결 $2/$12
파일 업로드 5배↑ 100MB
컨텍스트 1M 토큰

3.0 Pro에서 3.1 Pro로, 도대체 뭐가 달라진 걸까요?

구글은 2025년 11월 Gemini 3 Pro를 처음 공개하며 프리뷰 버전으로 배포했습니다. 그런데 불과 3개월 후인 2026년 2월 19일, Gemini 3.1 Pro를 조용히 출시했습니다. 3월 12일에는 구글 코리아 공식 블로그에 한국어로 정식 발표가 올라왔습니다(출처: 구글 코리아 공식 블로그, 2026.03.12). 이름만 보면 마이너 업데이트처럼 들리는데, 숫자를 보면 얘기가 달라집니다.

구글이 직접 밝힌 핵심 벤치마크 수치를 그대로 인용하면 이렇습니다. 새로운 논리 패턴 해결 능력을 평가하는 ARC-AGI-2에서 3.0 Pro는 31.1%였는데, 3.1 Pro는 77.1%를 기록했습니다. 단순 계산으로 2.5배가 오른 겁니다. 코딩 에이전트 벤치마크 SWE-bench Verified는 76.8%에서 80.6%로, 에이전트 웹 검색 능력을 재는 BrowseComp는 59.2%에서 85.9%로 각각 향상됐습니다. 단순히 숫자가 올랐다는 게 아니라, 추론의 깊이가 달라졌다는 의미입니다.

추가로 파일 업로드 한도가 20MB에서 100MB로 5배 확대됐고, YouTube URL을 프롬프트에 직접 붙여넣으면 영상 내용을 분석하는 기능도 새로 추가됐습니다. 최대 출력 토큰도 65,000으로 명확히 표기됐습니다. 이 변화들 모두 API 추가 비용 없이 제공됩니다.

▲ 목차로 돌아가기

가격은 그대로인데 성능이 이렇게 올랐습니다

💡 공식 가격표와 벤치마크 수치를 같이 놓고 보니, 동일 가격에 성능이 2배 이상 오른 케이스가 됩니다. AI 서비스에서 이런 조합은 흔치 않습니다.

솔직히 말하면, 처음 가격표를 봤을 때 실수인 줄 알았습니다. Gemini 3.0 Pro와 3.1 Pro의 API 단가는 완전히 동일합니다. 200,000 토큰 이하 기준으로 입력 $2.00 / 출력 $12.00 (100만 토큰 당)입니다. 200,000 토큰 초과 구간도 입력 $4.00 / 출력 $18.00으로 변화가 없습니다(출처: Google Gemini Developer API 공식 가격 페이지).

항목 3.0 Pro Preview 3.1 Pro Preview
API 입력 단가 (≤200K) $2.00 / M 토큰 $2.00 / M 토큰 (동일)
API 출력 단가 (≤200K) $12.00 / M 토큰 $12.00 / M 토큰 (동일)
ARC-AGI-2 추론 31.1% 77.1% (+148%)
SWE-bench Verified 76.8% 80.6% (+5%)
BrowseComp (웹 검색) 59.2% 85.9% (+45%)
파일 업로드 한도 20MB 100MB (5배)
YouTube URL 직접 분석
사고 레벨 단계 2단계 (low/high) 3단계 (low/medium/high)

출처: apiyi.com 공식 비교 가이드, 구글 코리아 공식 블로그

여기서 한 가지 더 주목할 부분이 있습니다. JetBrains AI 디렉터의 실측 데이터에 따르면, 3.1 Pro는 동일한 작업을 수행할 때 3.0 Pro보다 출력 토큰을 평균 10~15% 덜 소모합니다. 단가가 같고 토큰 소모가 줄었으니, 실제 청구 금액은 오히려 더 저렴해지는 구조입니다. 하루 100만 출력 토큰을 사용하는 환경이라면 모델 교체만으로 매달 수백 달러를 절약할 수 있습니다.

▲ 목차로 돌아가기

무료로 쓸 수 있다고 했는데, 막상 보니 이 차이가 있었습니다

💡 구글 공식 지원 문서와 API 가격 페이지를 같이 읽어보니, “무료로 Gemini 3.1 Pro를 쓴다”는 말이 접근 경로에 따라 완전히 다른 의미가 됩니다.

Gemini 앱 경로: 3.1 Pro 쓸 수 있지만 컨텍스트가 막힙니다

구글 공식 지원 문서(Google AI 구독자의 Gemini 앱 한도 및 업그레이드)를 보면, 무료 계정도 Gemini 앱에서 3.1 Pro에 “기본 액세스”가 가능합니다. 그런데 여기서 눈에 띄는 숫자가 있습니다. 컨텍스트 윈도우가 32,000 토큰으로 고정됩니다(출처: 구글 공식 고객센터, Gemini 앱 한도 페이지). Google AI Pro 구독자는 1,000,000 토큰이 적용되니까, 무료와 유료의 컨텍스트 윈도우 차이는 정확히 31.25배입니다. 3.1 Pro의 핵심 강점 중 하나인 “100만 토큰 컨텍스트”를 무료로는 사실상 활용할 수 없다는 뜻입니다.

요금제 3.1 Pro 일일 한도 컨텍스트 윈도우 Deep Think 3.1
무료 (기본) 기본 액세스 (미공개) 32,000 토큰
Google AI Plus ($3.99~$7.99/월) 하루 30개 프롬프트 128,000 토큰
Google AI Pro ($19.99/월) 하루 100개 프롬프트 1,000,000 토큰
Google AI Ultra 하루 500개 프롬프트 1,000,000 토큰 ✅ 하루 10개

출처: 구글 공식 고객센터, Gemini 앱 한도 (2026.03 기준)

Google AI Studio 경로: 다른 구조입니다

기대했던 것과 달랐습니다. Google AI Studio에서 Gemini 3.1 Pro를 API 키로 사용하는 경우, 무료 등급 비율 제한 페이지에는 구버전 모델(Gemini 1.5/2.0 계열)만 표시되어 있습니다. 3.1 Pro는 현재 프리뷰 모델로, 무료 등급 비율 제한이 공식 문서에 별도 명시되어 있지 않습니다. 실제 Reddit 커뮤니티에서는 AI Studio 기준으로 “3.1 Pro 하루 11~12개 메시지” 정도로 확인됐다는 사용자 보고가 있으나, 이는 구글 공식 확인이 아니므로 변동 가능성이 있습니다. 확인 필요.

▲ 목차로 돌아가기

써봤더니 여기서 멈춥니다

이 부분이 좀 아쉬웠습니다. Reddit r/GeminiAI 커뮤니티에 올라온 사용 후기를 보면 공통적으로 등장하는 불만이 있습니다. 바로 시간 기반 사용 제한입니다. 대화를 막 시작했는데 바로 한도에 걸렸다는 경험이 반복해서 보고됩니다. 이는 단순 일일 메시지 한도가 아니라 분당 요청 수(RPM) 제한이 짧은 시간 집중 사용 시 더 체감된다는 의미입니다.

두 번째 한계는 지식 컷오프입니다. 공식 비교 자료에 따르면 3.1 Pro의 학습 데이터 기준 시점은 2025년 1월로, 3.0 Pro와 동일합니다. 추론 능력이 크게 올랐어도 최신 정보를 묻는 질문에서는 Google 검색 그라운딩을 연결하지 않으면 오래된 답변을 줍니다. 검색 그라운딩 기능은 API에서 별도 요금이 붙습니다(1,500 RPD 기준 무료 이후 1,000회당 $35).

세 번째는 Deep Think 3.1 모드 접근 제한입니다. 앞서 표에서 확인했듯 Deep Think 3.1은 Ultra 구독자에게만 하루 10개 프롬프트 한도로 제공됩니다. 3.1 Pro의 “high 사고 레벨”은 내부적으로 Deep Think Mini 모드이기 때문에, 진짜 최상위 추론 성능을 원한다면 Ultra 요금제가 필요합니다. medium 사고 레벨은 3.0 Pro의 high 수준과 대등하니, 일반적인 복잡한 추론 작업에는 medium으로도 충분하다는 점은 위안입니다.

▲ 목차로 돌아가기

경쟁 모델과 나란히 놓고 보면 이렇게 됩니다

💡 추론 점수와 코딩 점수, 그리고 가격 구조를 같이 보면 단순 성능 비교와는 다른 그림이 나옵니다.

ARC-AGI-2 기준으로 Gemini 3.1 Pro는 77.1%를 기록했습니다. 같은 벤치마크에서 Claude Opus 4.6은 68.8% 수준입니다(출처: apiyi.com 비교 가이드, 구글 공식 블로그). 77.1% vs 68.8%라는 수치는 추론 영역에서 Gemini 3.1 Pro가 현재 공개 프런티어 모델 중 가장 높은 점수를 보여주고 있다는 뜻입니다.

반면 코딩 에이전트 SWE-bench Verified에서는 3.1 Pro 80.6%와 Claude Opus 4.6 80.9% 사이가 0.3%p 차이입니다. 이 정도 고점 구간에서 두 모델 간 실사용 체감 차이는 거의 없다고 봐야 합니다. 가격 비교를 하면, 3.1 Pro API는 입력 $2 / 출력 $12인 반면, Claude Opus 4.6은 입력 $15 / 출력 $75 수준입니다. 코딩 성능이 거의 동등하다면, 순수 API 비용 관점에서 3.1 Pro가 압도적으로 유리합니다.

단, Anthropic의 Claude 모델이 확실히 앞서는 영역이 있습니다. 창의적 글쓰기, 자연스러운 한국어 대화 품질, 그리고 긴 맥락에서 세부 정보 유지 능력 등은 실사용 후기에서 Claude 계열이 더 높은 평가를 받는 경향이 있습니다. 이 부분은 벤치마크로 쉽게 잡히지 않는 질적 차이로, 직접 비교 없이 단정하기 어렵습니다. 확인 필요.

▲ 목차로 돌아가기

Q&A

Q1. Gemini 3.1 Pro는 무료로 쓸 수 있나요?
Q2. 3.0 Pro와 3.1 Pro, API 코드 변경이 많나요?
model 파라미터 하나만 바꾸면 됩니다. gemini-3-pro-previewgemini-3.1-pro-preview로 교체하면 즉시 전환 완료됩니다. API 인터페이스는 완전히 호환됩니다. 단, 3.0에 맞게 튜닝된 복잡한 프롬프트는 3.1에서 결과가 다소 달라질 수 있으니 핵심 시나리오 대상으로 A/B 테스트를 먼저 해보는 편이 안전합니다.
Q3. Deep Think 3.1은 어떤 경우에 써야 하나요?
Google AI Ultra 구독자에게만 하루 10개 한도로 제공됩니다. 수학 증명, 고난도 코딩 디버깅, 복잡한 다단계 추론 문제처럼 정말 깊은 추론이 필요한 작업에 적합합니다. 일반 업무나 글쓰기, 요약에는 medium 사고 수준으로도 충분하며, medium이 3.0 Pro의 high 모드와 거의 동등한 성능을 냅니다.
Q4. 한국어 응답 품질은 어떤가요?
구글 공식 발표에는 한국어 특화 성능 지표가 별도로 명시되어 있지 않습니다. MMMLU(다국어 멀티모달 이해) 벤치마크에서 92.6%를 기록했다는 수치는 있지만, 이는 전체 언어 평균값입니다. 한국어 전용 품질에 대해서는 직접 테스트를 통한 확인이 필요하며, 공식 수치 기반으로 단정하기는 어렵습니다.
Q5. 3.0 Pro는 아직도 쓸 수 있나요?
프리뷰 버전(gemini-3-pro-preview)은 2026년 3월 9일에 공식 종료됐습니다(출처: Firebase AI Logic 공식 문서). 현재는 Gemini 3.1 Pro로 마이그레이션해야 합니다. 구글 안티그래비티, Vertex AI, Google AI Studio 모두 3.1 Pro가 기본 모델로 전환됐습니다.

▲ 목차로 돌아가기

마치며

결론부터 말씀드리면, Gemini 3.1 Pro는 지금 나와 있는 추론 모델 중 가격 대비 성능 면에서 가장 유리한 선택지 중 하나입니다. ARC-AGI-2에서 2.5배 오른 추론 점수, API 단가 동결, 파일 업로드 5배 확대, YouTube URL 직접 분석 — 이게 전부 추가 비용 없이 생겼습니다.

다만 “무료로 다 된다”는 생각은 경로를 먼저 따져봐야 합니다. Gemini 앱 무료 계정으로 접근하면 컨텍스트 윈도우가 32,000 토큰으로 제한됩니다. 1백만 토큰 컨텍스트를 제대로 쓰려면 Google AI Pro가 필요하고, Deep Think 3.1을 쓰려면 Ultra가 필요합니다. 이 부분을 모르고 시작했다가 막히면 당황스럽습니다.

개발자 입장에서는 API로 시작하는 게 가장 현실적입니다. Google AI Studio에서 API 키를 발급받고, model 파라미터 하나만 gemini-3.1-pro-preview로 설정하면 됩니다. 그 이후 실제 사용량을 측정하고 비용이 어느 정도 나오는지 확인한 다음 구독 여부를 결정하는 흐름이 낭비 없이 시작하는 방법입니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. 구글 코리아 공식 블로그 — 제미나이 3.1 프로 출시 발표 (2026.02.19): blog.google/intl/ko-kr/products/gemini-3-1-pro-kr/
  2. 구글 코리아 공식 블로그 — 제미나이 3: 새로운 AI 시대의 개막 (2025.11.19): blog.google/intl/ko-kr/company-news/technology/google-gemini-3/
  3. Google Gemini Developer API 공식 가격 책정 페이지: ai.google.dev/gemini-api/docs/pricing
  4. 구글 공식 고객센터 — Gemini 앱 한도 및 업그레이드: support.google.com/gemini/answer/16275805
  5. Firebase AI Logic — 지원 모델 (Gemini 3 Pro 프리뷰 종료일 명시): firebase.google.com/docs/ai-logic/models

⚠️ 본 포스팅은 2026년 3월 18일 기준으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 특히 Gemini API의 프리뷰 모델 비율 제한, 구독 요금, 무료 한도는 사전 고지 없이 변경될 수 있으므로 최신 공식 문서를 직접 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기