🚨 2026.02.19 공식 출시 · Preview 배포 중
제미나이 3.1 Pro 완전정복:
지금 안 쓰면 경쟁에서 뒤처진다
구글이 2026년 2월 19일, AI 업계에 조용한 충격을 던졌습니다. 신모델 제미나이 3.1 Pro가 ARC-AGI-2 추론 벤치마크에서 77.1%를 기록하며 GPT-5.2(52.9%)를 약 24%p 차이로 압도한 것입니다. 같은 가격에 이 정도 성능 점프라면, 지금 당장 써야 할 이유가 충분합니다.
API 가격 동결
100만 토큰 컨텍스트
무료 AI Studio 지원
🔍 제미나이 3.1 Pro란? — 구글 역사상 최초의 ‘.1’ 버전
제미나이 3.1 Pro를 한 문장으로 표현하면, “DeepThink에서 검증한 추론 기술을 일반 Pro 모델에 처음 이식한 버전”입니다. 구글 제미나이 시리즈는 지금까지 1.0 → 1.5 → 2.0 → 3.0 식으로 메이저 버전만 올라왔는데, 이번이 역사상 처음 등장한 .1 업데이트입니다. 작은 숫자처럼 보이지만, 내부 변화는 메이저 버전 교체에 준한다는 평가가 나오고 있습니다.
출시 배경을 보면, 구글이 2025년 11월 18일 Gemini 3 Pro를 공개한 이후 약 100일이라는 짧은 기간 안에 3.1 Pro가 나왔습니다. 이 기간 동안 구글이 주력했던 건 강화학습(Agentec RL)의 Pro 모델 통합이었습니다. 원래 Gemini Flash 경량 모델에서 먼저 테스트됐던 이 기술이 드디어 최상위 Pro 라인에 탑재되면서, 일부 벤치마크에서 Flash가 Pro를 앞질렀던 현상이 완전히 해소됐습니다.
💡 핵심 요약
Gemini 3.1 Pro = Gemini 3 Pro + DeepThink 기술 + Agentec 강화학습. 현재 Preview 상태로 배포 중이며 Google AI Pro/Ultra 요금제 사용자와 개발자 API를 통해 지금 당장 사용할 수 있습니다.
현재 상태는 ‘Preview’이고, 정식 GA(General Availability) 출시는 아직입니다. 하지만 이미 Gemini 앱, NotebookLM, Google AI Studio, Vertex AI, Gemini CLI, Android Studio 등 구글의 주요 개발 플랫폼 전반에 걸쳐 배포가 시작된 상황입니다. Preview 단계임에도 구글이 이렇게 빠르게 전면 배포를 시작한 건, 사용자 피드백을 통해 에이전트 워크플로우를 추가로 개선하려는 의도입니다.
⚡ Gemini 3 Pro 대비 달라진 것들 — 숫자로 확인하는 5가지 변화
단순 패치인지 실질적 업그레이드인지를 판단하는 가장 빠른 방법은 이전 버전과 스펙을 직접 비교해보는 것입니다. 아래 표를 보면 왜 이번 업데이트가 단순 .1에 그치지 않는지 이해할 수 있습니다.
| 항목 | Gemini 3 Pro | Gemini 3.1 Pro |
|---|---|---|
| 사고 모드 단계 | Low / High (2단계) | Low / Medium / High (3단계) |
| High 모드 성능 | 기본 추론 | DeepThink 준하는 성능 |
| 강화학습(RL) | 미적용 | Agentec RL 통합 |
| 파일 첨부 용량 | 20MB | 100MB (5배 향상) |
| 컨텍스트 윈도우 | 1M 토큰 | 1M 토큰 (유지) |
| API 입력 가격 | $2.00 / 1M 토큰 | $2.00 / 1M 토큰 (동결) |
사고 모드가 2단계에서 3단계로 늘어난 건 생각보다 훨씬 중요한 변화입니다. 이전까지는 “빠르게 쓸 것이냐, 깊게 생각할 것이냐”라는 두 가지 선택지밖에 없었습니다. 그런데 이제 Medium 모드가 생기면서 작업 복잡도에 맞게 훨씬 세밀하게 조절할 수 있게 됐습니다. 가령 일반 코딩 작업은 Medium으로, IMO 수준의 수학 문제는 High로 구분해서 쓰면 토큰 비용과 응답 품질을 동시에 최적화할 수 있습니다.
파일 첨부 용량이 20MB에서 100MB로 5배 늘어난 것도 실무에서 바로 체감되는 변화입니다. 기존에는 긴 PDF나 코드 저장소를 올리다가 용량 한도에 막히는 경우가 잦았는데, 이제 웬만한 비즈니스 문서나 코드베이스는 한 번에 올릴 수 있습니다.
📊 벤치마크 성능 심층 분석 — ARC-AGI-2 148% 향상의 의미
벤치마크 숫자는 늘 과장됐다는 인식이 있지만, 이번 ARC-AGI-2 결과만큼은 다른 시각으로 봐야 합니다. ARC-AGI-2는 단순 암기나 패턴 반복으로는 절대 높은 점수를 받을 수 없는 벤치마크입니다. 모델이 한 번도 본 적 없는 완전히 새로운 논리 패턴을 즉석에서 풀어내는 능력을 측정하기 때문에, AI의 진짜 추론 능력을 가장 잘 반영하는 지표 중 하나로 평가받습니다.
77.1%
ARC-AGI-2
추론 능력
94.3%
GPQA Diamond
과학 지식
80.6%
SWE-Bench
코딩 능력
33.5%
APEX-Agents
에이전트 (↑82%)
구글 공식 자료에 따르면, 3.1 Pro는 총 16개 주요 벤치마크 중 13개에서 1위를 차지했습니다. 특히 ARC-AGI-2에서 전작 3 Pro(31.1%) 대비 무려 148% 향상이라는 수치가 인상적입니다. 이 수치는 업계에서도 “단순 .1 업데이트로 보기 어렵다”는 반응이 나오는 주된 이유입니다.
에이전트 성능을 측정하는 APEX-Agents 벤치마크도 눈여겨볼 만합니다. 3 Pro가 18.4%였던 것이 3.1 Pro에서 33.5%로 뛰었는데, 이는 AI가 장기간 멀티스텝 업무를 얼마나 자율적으로 처리할 수 있는지를 보여주는 지표입니다. 에이전트 기반 자동화 도구를 구축하는 개발자라면 이 수치 변화가 가장 중요한 포인트일 수 있습니다.
🎯 실제 테스트 사례: IMO(국제수학올림피아드) 수준의 문제를 High 사고 모드로 돌린 결과, 약 8분 만에 정답을 도출했습니다. 동일 문제를 DeepThink로 처리하면 17분 이상 걸렸던 것과 비교하면, 비용 대비 효율이 크게 개선됐습니다.
💰 요금제별 사용 한도 완전 정리 — Free부터 Ultra까지
제미나이 3.1 Pro를 접근하는 경로는 요금제에 따라 크게 달라집니다. 2026년 2월 21일 업데이트된 구글 공식 자료를 기준으로 현재 한도를 정리했습니다. 특히 무료 플랜에서도 3.1 Pro를 기본 접근할 수 있다는 점이 중요한데, 다만 하루 사용 가능 횟수가 수시로 변경될 수 있다는 공식 안내가 붙어있습니다.
| 요금제 | 월 요금 | 3.1 Pro 한도 | 컨텍스트 창 |
|---|---|---|---|
| Free | 무료 | 기본 접근 (변동 가능) |
32,000 토큰 |
| Google AI Plus | ₩11,000 | 30회 / 일 | 128,000 토큰 |
| Google AI Pro ⭐ | ₩29,000 | 100회 / 일 | 1,000,000 토큰 |
| Google AI Ultra | ₩360,000 | 500회 / 일 | 1,000,000 토큰 |
일반 사용자 관점에서 가장 밸런스가 좋은 선택은 단연 Google AI Pro(월 ₩29,000)입니다. 하루 100회의 3.1 Pro 사용 한도에 더해 100만 토큰 컨텍스트 창(약 1,500페이지 분량)이 제공됩니다. 여기에 Google Workspace 연동, NotebookLM Pro, Gmail AI Overviews, 2TB 스토리지까지 패키지로 묶여 있어서 실질적인 가성비가 매우 높습니다.
개인적으로 Ultra 플랜은 헤비 개발자나 영상 제작자가 아니라면 과투자입니다. Veo 3.1 영상 생성이나 Project Mariner 같은 실험적 기능이 필요한 게 아니라면, Pro 플랜으로도 일상적인 AI 활용에 전혀 부족함이 없습니다.
🛠️ 무료로 시작하는 방법 — 구글 계정 하나면 충분합니다
제미나이 3.1 Pro를 경험하는 방법은 목적에 따라 크게 세 가지 경로로 나뉩니다. 결제 없이 바로 체험하고 싶다면 Google AI Studio가 가장 빠른 방법입니다. 구글 계정만 있으면 별도의 설치나 결제 없이 즉시 접속해서 3.1 Pro를 사용할 수 있습니다.
일반 사용자Gemini 앱 또는 AI Studio
gemini.google.com에 접속하거나 모바일 앱에서 모델을 ‘3.1 Pro’로 변경. 무료 사용자는 한도 내에서, Pro/Ultra 가입자는 더 넉넉하게 사용 가능. AI Studio(aistudio.google.com)는 별도 회원가입 없이 구글 계정으로 바로 로그인 가능.
개발자Gemini API / Gemini CLI
AI Studio에서 무료 API 키 발급 후 모델명을 gemini-3.1-pro-preview로 지정. Gemini CLI를 통한 터미널 직접 사용도 가능. GitHub Copilot, VS Code 확장으로도 통합 지원됨.
연구·문서NotebookLM (Pro/Ultra 전용)
PDF, 유튜브 영상, 웹 링크 등을 소스로 올리고 3.1 Pro 기반으로 심층 분석 가능. 하루 500회 채팅, 20회 오디오 오버뷰 제공(Pro 기준). 긴 문서 분석이나 리서치 자동화에 특히 강점.
개인적으로 처음 써보는 분들에게는 AI Studio에서 High 사고 모드로 복잡한 문제를 던져보는 것을 권합니다. 직접 체감해봐야 이 모델의 성능 차이를 실감할 수 있습니다. 단순한 질의응답보다는 “이 코드의 버그를 잡아줘”나 “이 계약서의 불리한 조항을 분석해줘” 같은 다단계 추론이 필요한 작업에서 진가가 드러납니다.
⚔️ GPT-5.2 vs 제미나이 3.1 Pro — 어떤 작업에서 누가 앞서나
벤치마크 숫자만 보면 현시점 제미나이 3.1 Pro가 명확한 우위입니다. ARC-AGI-2 기준 3.1 Pro 77.1% 대 GPT-5.2 52.9%는 꽤 큰 격차입니다. 그렇다고 “GPT를 버리고 제미나이로 갈아타라”고 단정 지을 수는 없습니다. 작업 유형에 따라 체감이 다르기 때문입니다.
| 작업 유형 | 제미나이 3.1 Pro | GPT-5.2 |
|---|---|---|
| 복잡한 논리·추론 | ✅ 우세 | 보통 |
| 에이전트·멀티스텝 | ✅ 우세 | 보통 |
| 코딩 특화(Codex 계열) | 보통 | ✅ 우세 (GPT-5.3-Codex) |
| 멀티모달(영상·이미지) | ✅ 우세 | 보통 |
| 긴 문서 처리(100만 토큰+) | ✅ 우세 | ❌ 미지원 |
| 창작·글쓰기 | 비슷 | 비슷 |
전략적인 차이도 흥미롭습니다. OpenAI와 Anthropic은 최근 코딩 특화 모델 개발에 집중하는 경향을 보이는 반면, 구글은 범용 추론 모델과 멀티모달 통합에 방향을 맞추고 있습니다. GPT-5.3-Codex처럼 코딩에 특화된 모델이 필요하다면 OpenAI 생태계가 여전히 우세하지만, 그 외 대부분의 범용 작업에서는 3.1 Pro가 현재 가장 강력한 선택지입니다.
토큰 효율성도 주목할 포인트입니다. 동일한 작업을 처리할 때 Anthropic의 Sonnet 4.6 대비 토큰 소모가 더 적다는 분석이 나왔습니다. API를 고빈도로 활용하는 기업이나 개발자라면 비용 최적화 측면에서도 3.1 Pro가 매력적입니다.
🎯 실전 활용 꿀팁 5가지 — 성능을 200% 끌어올리는 설정
모델 성능이 아무리 좋아도 어떻게 사용하느냐에 따라 결과물 품질이 크게 달라집니다. 실사용자들의 테스트와 공식 문서를 분석해 실전에서 바로 쓸 수 있는 팁 5가지를 정리했습니다.
작업 난이도에 맞게 사고 모드를 골라 쓰세요
Low는 빠른 요약·번역, Medium은 중급 코딩·분석, High는 복잡한 수학·추론에 최적화됩니다. High 모드는 응답이 느리고 토큰 소모가 크므로, 무조건 High로 설정하는 것보다 작업에 맞게 선택하는 게 비용과 속도 모두에서 유리합니다.
100MB 파일 첨부 기능을 적극 활용하세요
이번 업데이트에서 파일 첨부 한도가 5배 늘어난 100MB입니다. 대형 PDF, 코드 저장소, 긴 계약서를 통째로 올려서 분석을 요청할 수 있습니다. AI Studio에서는 여러 파일을 동시에 올리는 것도 지원합니다.
AI Studio에서 코드 생성 시 “단일 파일로” 명시하세요
AI Studio에서 코드를 생성하면 여러 파일로 분리하는 경향이 있습니다. “모든 코드를 하나의 파일에 담아줘”라고 명확하게 지시하면 이 문제를 예방할 수 있습니다. 프롬프트에 출력 형식을 구체적으로 명시하는 것이 3.1 Pro의 성능을 최대로 끌어내는 핵심입니다.
NotebookLM과 병행하면 리서치 효율이 극대화됩니다
Gemini 앱에서 직접 대화하는 것과 달리, NotebookLM은 내가 업로드한 소스에만 집중해서 답변을 생성합니다. 보고서, 논문, 유튜브 강의를 소스로 등록하고 3.1 Pro로 심층 분석 + 오디오 오버뷰까지 생성할 수 있어서 학습과 리서치에 최적화된 조합입니다.
기존 Gemini 3 Pro API 사용자라면 즉시 교체를 권장합니다
구글이 공식적으로 3.1 Pro를 3 Pro의 “drop-in replacement”로 권고합니다. API 가격이 동일하고, 모델명만 gemini-3.1-pro-preview로 바꾸면 됩니다. 추가 비용 없이 성능이 올라가는 거라 망설일 이유가 없습니다.
❓ 자주 묻는 질문 (Q&A)
✍️ 마치며 — 총평: 이번엔 구글이 제대로 치고 나왔다
솔직히 말하면, Gemini 3.1 Pro는 AI 구독 피로감이 쌓인 지금 시점에서 제대로 된 가성비 업그레이드가 맞습니다. API 가격 동결, 파일 첨부 5배 확대, ARC-AGI-2에서 GPT-5.2를 24%p 차이로 앞서는 추론 성능까지. 이 세 가지만 봐도 현재 범용 AI 모델 시장에서 구글이 다시 선두를 탈환했다고 볼 수 있습니다.
다만 아직 Preview 상태라는 점, 코딩 특화 작업에서는 GPT-5.3-Codex 계열이 여전히 경쟁력이 있다는 점은 분명히 짚어둬야 합니다. 자신의 주 사용 목적이 무엇인지에 따라 선택이 달라질 수 있습니다. 하지만 범용 추론, 멀티모달, 긴 문서 처리가 주된 작업이라면 지금 당장 AI Studio에서 3.1 Pro를 무료로 체험해보는 것만으로도 충분한 가치가 있습니다. Preview 기간을 적극 활용하세요.
📌 한 줄 결론
범용 AI 작업이라면 현재 시점 제미나이 3.1 Pro가 가격 대비 최강. 구글 계정만 있다면 지금 바로 AI Studio에서 무료 체험 가능.
※ 본 포스팅은 2026년 3월 11일 기준 구글 공식 블로그, Google DeepMind 모델 카드, 9to5Google 등 공개 자료를 바탕으로 작성됐습니다. 요금제 한도 및 기능은 구글 정책에 따라 변경될 수 있으니 최신 정보는 공식 Google AI 페이지에서 확인하세요.











댓글 남기기