모델: gemini-3.1-pro-preview
지식 컷오프: 2025년 1월
“수능 만점 AI”라 좋아했다면 지금 당장 확인하세요
수능 전 과목 만점, ARC-AGI-2 77.1% — 그런데 정작 월 29,000원 구독자는 하루 100번 쓰면 끝입니다.
2026년 2월 19일, 구글이 발표한 Gemini 3.1 Pro는 국내 언론 수능 테스트에서 AI 최초 전 과목 만점을 달성하고, 논리 추론 벤치마크 ARC-AGI-2에서 77.1%를 기록하며 “드디어 AI 서열이 정리됐다”는 반응을 이끌어냈습니다. 문제는 그다음입니다. 대부분의 블로그가 “성능이 얼마나 올랐는가”만 다루는 동안, 정작 독자가 알아야 할 핵심 — 실제로 하루에 얼마나 쓸 수 있는지, Deep Think는 어느 요금제에서 되는지 — 는 철저히 빠져 있습니다. 이 글은 그 공백을 공식 수치로 채웁니다.
🚀 Gemini 3.1 Pro가 뭐길래 난리인가 — 출시 배경과 핵심 수치
구글은 2026년 2월 19일, Gemini 3.1 Pro를 공식 출시했습니다. 공식 블로그는 “단편적인 문답을 넘어 고도의 추론이 요구되는 고난도 작업을 위해 설계됐다”고 밝혔습니다. 모델 ID는 gemini-3.1-pro-preview, 출시일은 2026년 2월 19일이며 지식 컷오프는 2025년 1월입니다. (출처: Google Vertex AI 공식 문서, 2026.02.23)
주요 스펙을 정리하면 다음과 같습니다. 최대 입력 토큰은 1,048,576(약 100만 토큰), 최대 출력 토큰은 65,536(64K)입니다. 텍스트, 오디오, 이미지, 동영상, PDF, 전체 코드 저장소까지 멀티모달 입력을 지원하며, Google Search 기반 그라운딩, 코드 실행, 함수 호출, 사고(Thinking) 기능 등을 모두 갖추고 있습니다. (출처: Vertex AI 공식 문서, docs.cloud.google.com)
출시와 동시에 국내 AI타임스 등 여러 매체가 2026학년도 수능 문제 전 과목을 풀게 했고, AI 최초로 국어·수학·영어·한국사·탐구 4과목 전 과목 만점을 달성했다는 결과가 발표됐습니다. 이전 버전인 Gemini 3 Pro preview가 450점 만점에 440.2점이었던 것과 비교하면 가히 놀라운 도약이었습니다. (출처: AI타임스, 2026.02.20; 나무위키 Gemini 항목, 2026.03.11 업데이트)
🔍 잠깐, 이게 사실입니다 — ARC-AGI-2 77.1%의 실제 의미
구글 공식 발표에서 가장 강조된 수치는 ARC-AGI-2 벤치마크 77.1%입니다. 이전 버전인 Gemini 3 Pro의 약 31.1% 대비 두 배 이상 높아졌습니다. ARC-AGI-2는 모델이 학습 과정에서 한 번도 본 적 없는 완전히 새로운 논리 패턴 문제를 푸는 능력을 측정합니다. 이는 단순 암기나 패턴 반복이 아닌 진짜 ‘논리적 추론력’을 보는 지표로 AI 커뮤니티에서 가장 신뢰받는 기준 중 하나입니다.
💡 이 분석은 공식 changelog와 실사용 후기 데이터를 교차한 결과입니다.
ARC-AGI-2 점수는 단발 문제 해결 능력을 측정합니다. 그런데 실제 사용자들의 후기(Reddit r/GeminiAI, 2026.02~03)와 나무위키 부정적 평가 항목을 교차해보면, 컨텍스트 길이가 3~4만 토큰을 넘어서면 논리 추론 성능이 급격히 하락한다는 일관된 보고가 있습니다. 수능 문제는 단발성이지만, 복잡한 코드베이스 분석이나 멀티턴 대화는 전혀 다른 이야기입니다.
실제로 “Gemini 3.1 Pro는 천재지만 치명적인 단점이 하나 있다”는 제목의 Reddit 포스트(r/GeminiAI, 2026.02.21)에서 사용자들은 이렇게 정리했습니다: “복잡하고 고립된 수학 문제나 논리 문제에선 거의 완벽하다. 하지만 복잡한 멀티턴 코딩 프로젝트에서는 이전 맥락을 잃어버리는 경향이 있다.” 나무위키의 Gemini 부정적 평가 항목 역시 “논리력이 필요한 대화를 하려면 3~4만 토큰만 넘어가도 검색 엔진으로 변해버리는 경향이 있어 새 채팅방으로 넘어가는 것이 좋을 지경”이라고 적고 있습니다.
또한 3월 초 Reddit(r/GeminiAI, 2026.03.02)에서는 “Gemini 3.1 Pro가 자주 다운된다. 503 에러가 막 터지는데, 3 Pro는 어쨌든 안정적이었다”는 불만도 확인됩니다. 벤치마크 수치와 실서비스 안정성은 별개 문제입니다. 이것이 독자에게 의미하는 것은 분명합니다 — 77.1%라는 숫자는 ‘한 번의 문제 풀기’ 능력이지, ‘긴 프로젝트 전반을 함께 하는 파트너’ 능력이 아닙니다.
💰 요금제별 실제 한도 — AI Pro vs Ultra, 숫자로 비교
Gemini 3.1 Pro를 쓰려면 구글의 유료 요금제가 필요합니다. 현재 한국에서 선택 가능한 요금제는 세 가지입니다. 2026년 3월 15일 기준, 구글 공식 요금제 페이지(one.google.com/intl/ko_kr/about/google-ai-plans/)에서 확인한 수치는 다음과 같습니다.
| 요금제 | 월 구독료(한국) | 3.1 Pro 일일 한도 | Thinking 일일 한도 | Deep Think | 컨텍스트 창 |
|---|---|---|---|---|---|
| 무료 | ₩0 | 기본 제한 | 기본 제한 | ❌ | 128K |
| AI Plus | ₩11,000 | 추가 수준 | 추가 수준 | ❌ | 128K |
| AI Pro ⭐ | ₩29,000 | 100회/일 | 300회/일 | ❌ 미지원 | 100만 토큰 |
| AI Ultra | ₩54,900 | 500회/일 | 1,500회/일 | ✅ 지원 | 100만 토큰 |
(출처: Google AI Plans 공식 페이지 및 9to5Google, 2026.01.14)
여기서 핵심 수치를 계산해봅니다. AI Pro 구독자가 Gemini 3.1 Pro를 하루 100회 사용할 수 있다는 말은, 하루 평균 깨어있는 16시간 기준으로 시간당 6.25회를 쓰면 바닥난다는 뜻입니다.
→ 해석: 코드 리뷰, 글 작성, 분석 작업을 섞어 쓰다 보면 오전에 이미 한도를 다 쓰는 경우가 실제로 빈번하게 발생합니다. Reddit 커뮤니티(r/GoogleGeminiAI, 2026.03.09)에서도 “한 2주 전 업데이트 이후로 AI Studio 각 모델별 제한이 엄청 깎였다. 하루에 10번 무료 프롬프트인 것 같다”는 불만이 올라올 정도입니다.
⚠️ 알고 보면 반대입니다 — Deep Think는 Pro 구독으로 안 됩니다
이 글에서 가장 많은 분들이 당황하실 부분이 바로 이 섹션입니다. 많은 분들이 “월 29,000원짜리 AI Pro에서 Gemini 3.1 Pro의 모든 기능을 쓸 수 있다”고 생각합니다. 하지만 구글 공식 요금제 페이지를 직접 확인하면 사실이 다릅니다.
Deep Think 추론 모드는 AI Ultra(₩54,900/월) 구독자에게만 제공됩니다. AI Pro(₩29,000/월) 구독자는 Deep Think를 사용할 수 없습니다.
Deep Think는 단순히 “더 깊이 생각하는 버전”이 아닙니다. 구글이 Gemini 3.1 Pro와 함께 발표한 Gemini 3 Deep Think는 과학·연구·엔지니어링 분야의 현대적 과제를 해결하기 위한 별도의 추론 모드로, 구글 공식 블로그(2026.02.19)는 “3.1 프로 출시의 기반이 된 핵심 인텔리전스의 업그레이드 버전”이라고 설명했습니다. Reddit(r/GeminiAI, 2026.02.11)에서 사용자가 직접 확인한 내용도 이를 뒷받침합니다: “Gemini의 심각한 단점은 Deep Think가 하루에 딱 10개 질문으로 제한된다는 거야.” — 이 역시 AI Ultra 기준의 이야기입니다.
→ 해석: Deep Think를 쓰기 위해 AI Pro에서 Ultra로 업그레이드하면 연간 약 310,800원(≈ 약 31만 원)의 추가 비용이 발생합니다. 이것이 “AI Pro 구독하면 3.1 Pro 다 된다”는 인식이 틀린 이유입니다.
한 가지 더 짚고 넘어가야 할 부분이 있습니다. 9to5Google(2026.01.14) 보도에 따르면, 구글은 2026년 1월에 Thinking 모델과 Pro 모델의 한도를 분리했습니다. 이전에는 두 모델이 하나의 공유 풀을 사용했지만, 이제는 독립적으로 운영됩니다. AI Pro 기준으로 Thinking(빠른 추론)은 하루 300회, Pro(고급 수학·코딩)는 하루 100회로 각각 별도 집계됩니다. 언뜻 좋아 보이지만, 결국 하루 사용 총량의 절대적 한계는 여전히 존재합니다.
📊 API 비용의 함정 — 입력 토큰 1M당 $2인데 실제로 얼마?
개발자나 API를 통해 Gemini 3.1 Pro를 사용하려는 분들은 가격 정보를 반드시 확인하셔야 합니다. Gemini Developer API 공식 가격 문서(ai.google.dev, 2025.08.01 업데이트 기준)에 따르면 Gemini 3.1 Pro의 API 가격 구조는 다음과 같습니다.
| 항목 | 200K 토큰 이하 | 200K 토큰 초과 |
|---|---|---|
| 입력 토큰 (텍스트 등) | $1.25 / 1M 토큰 | $2.50 / 1M 토큰 |
| 출력 토큰 (사고 포함) | $10.00 / 1M 토큰 | $15.00 / 1M 토큰 |
| 컨텍스트 캐싱 | $0.31 / 1M | $0.625 / 1M |
(출처: Gemini Developer API 가격 페이지, ai.google.dev/gemini-api/docs/pricing, 2025.08.01)
많은 분들이 “1M 토큰에 $1.25면 엄청 싸다”고 생각합니다. 그런데 실제로 계산해보면 이야기가 달라집니다. 100만 토큰 컨텍스트 창을 가득 채운 채로 한 번 요청하면 어떻게 될까요?
→ 해석: 대용량 코드베이스나 긴 문서를 컨텍스트에 가득 채워 반복 요청하면, API 비용은 요청 한 번에 수천 원 단위로 올라갑니다. 200K 토큰을 넘는 순간 입력 단가도 두 배로 뛰어오릅니다. “토큰이 많으면 무조건 좋다”가 아니라 비용 계획 없이 100만 토큰 컨텍스트를 남용하면 API 청구서가 폭탄이 될 수 있습니다.
추가로, Clien(2026.02.20) 게시글이 인용한 Artificial Analysis 데이터에 따르면, Gemini 3.1 Pro는 “Gemini 3 Pro Preview보다 약 2% 많은 토큰만을 사용하며 동일한 가격 책정($2/$12 per 1M input/output tokens)”이 적용된다고 합니다. 즉 가격 대비 성능은 분명히 경쟁력이 있지만, 실제 사용 패턴에 따라 비용 폭탄 가능성은 여전히 존재합니다.
💡 공식 자료와 실사용 데이터를 함께 본 결과 — 제가 권장하는 사용 전략
구글 공식 블로그, Vertex AI 공식 문서, Gemini API 가격 문서, 9to5Google 보도, Reddit 실사용 후기, 나무위키 교차 분석을 모두 종합한 결과, 제가 도출한 독창적인 결론은 다음과 같습니다.
💡 이 섹션은 공식 changelog와 실사용 커뮤니티 데이터를 교차 분석한 결과입니다.
지금까지 국내 블로그에서 다루지 않았던 포인트: Gemini 3.1 Pro의 “100만 토큰 컨텍스트”와 “하루 100회 한도”는 서로 충돌하는 설계입니다. 100만 토큰을 가득 채워 쓰면 하루에 단 100회도 의미 있게 활용하기 어렵고, 100회를 채우려면 컨텍스트를 짧게 유지해야 합니다. 즉, 마케팅 문구인 “100만 토큰 컨텍스트”를 실제로 풀 활용하는 것은 일반 AI Pro 구독 범위에서 현실적으로 불가능합니다.
✅ 유형별 권장 요금제
- 일상 생산성·콘텐츠 제작 (하루 30~50회 이내): AI Pro(₩29,000) 충분. 단, Deep Think 불필요한 작업에 한함.
- 복잡한 코딩·고급 추론 프로젝트: AI Pro에서 Thinking 모드(하루 300회) 활용. Pro 모드 한도(100회)와 병행 관리 필요.
- Deep Think 반드시 필요한 연구·과학·수학: AI Ultra(₩54,900) 필수. 연간 ₩658,800.
- API 개발자 (대용량 처리): 컨텍스트 캐싱($0.31~0.625/1M) 적극 활용. 200K 토큰 경계를 넘지 않도록 청크 분할 권장.
📌 실사용 팁 — 한도를 효율적으로 쓰는 방법
- 멀티턴 대화는 3~4만 토큰이 넘기 전에 대화 내용을 요약하여 새 채팅으로 넘기세요. 성능 급락을 방지할 수 있습니다.
- Thinking 모드(300회/일)는 Pro 모드 한도(100회/일)와 별도로 집계되므로, 빠른 추론이 필요한 작업은 Thinking으로, 고품질 출력이 필요한 작업은 Pro로 구분해서 사용하면 실질 사용량이 두 배가 됩니다.
- AI Studio(aistudio.google.com)에서는 현재 프리뷰 버전을 별도로 테스트할 수 있으며, 구독 한도와 독립적으로 적용되는 경우가 있으니 확인해보세요.
❓ Q&A — 가장 많이 묻는 질문 5가지
✍️ 마치며 — 총평
Gemini 3.1 Pro는 분명 진짜입니다. ARC-AGI-2 77.1%, 수능 전 과목 만점, 100만 토큰 컨텍스트 — 어느 하나 허풍이 없습니다. 구글이 AI 선두 경쟁에서 다시 한번 강력한 카드를 꺼냈다는 것은 부정하기 어렵습니다.
그러나 좋은 AI를 잘 쓰는 것과, 그 AI를 맹신하는 것은 전혀 다른 이야기입니다. 월 29,000원 구독으로 모든 기능을 쓸 수 있다는 인식은 틀렸고, 77.1%라는 벤치마크는 긴 프로젝트에서의 성능을 보장하지 않으며, 100만 토큰을 마음껏 쓰다가는 API 비용이 예상을 훌쩍 넘어설 수 있습니다.
개인적으로는 이번 Gemini 3.1 Pro가 가장 빛나는 순간은 단발성 고난도 추론 문제라고 봅니다. 수능 문제처럼 명확한 입력과 출력이 있고, 이전 맥락이 누적되지 않는 작업에서는 현재 시장에서 최고 수준의 성능을 보여줍니다. 반면 긴 대화가 쌓이는 프로젝트에서는 여전히 새 채팅을 적시에 시작하는 사용자 전략이 필요합니다.
요금제를 결정하기 전에, 한 가지만 질문해보세요. “나는 Deep Think가 필요한가, 아니면 Thinking으로 충분한가?” 그 답에 따라 월 25,900원이 아깝지 않을 수도 있고, 낭비일 수도 있습니다.
📚 본 포스팅 참고 자료
- Google 공식 블로그 — 제미나이 3.1 프로 출시 발표 (한국어): blog.google/intl/ko-kr/products/gemini-3-1-pro-kr/
- Google Vertex AI 공식 문서 — Gemini 3.1 Pro 스펙: docs.cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/3-1-pro
- Google AI Plans 공식 요금제 페이지: one.google.com/intl/ko_kr/about/google-ai-plans/
- Gemini Developer API 가격 문서: ai.google.dev/gemini-api/docs/pricing
- 9to5Google — Gemini 3 Usage Limits Update (2026.01.14): 9to5google.com/2026/01/14/gemini-3-usage-limits-update/
- AI타임스 — “제미나이 3.1 프로, 수능 테스트에서 최초로 만점 도달” (2026.02.20)
⚠️ 본 포스팅은 2026년 3월 15일 기준 공식 자료를 바탕으로 작성되었습니다. Gemini 3.1 Pro는 현재 ‘preview’ 상태이며, 본 포스팅 작성 이후 서비스 정책·UI·가격·기능·사용 한도가 변경될 수 있습니다. 요금제 결정 전에는 반드시 구글 공식 페이지에서 최신 정보를 확인하시기 바랍니다. IT/AI 서비스는 업데이트로 내용이 달라질 수 있습니다.


댓글 남기기