Gemini 3.1 Deep Think, Pro 요금제로 될까요?

Published on

2026년 3월 20일

2026.03.20 기준 / Gemini 3.1 Pro 프리뷰 (2026.02.19 출시)

결론부터 말씀드리면, 안 됩니다. Deep Think는 Google AI Ultra 전용입니다. 그런데 Ultra를 구독해도 하루에 쓸 수 있는 횟수가 손에 꼽을 정도입니다. ARC-AGI-2 84.6%를 달성한 모드가 왜 이렇게 막혀 있는지, 공식 발표문과 실사용 데이터를 교차해서 살펴봤습니다.

84.6%

ARC-AGI-2 (Deep Think)

77.1%

ARC-AGI-2 (3.1 Pro)

Ultra

Deep Think 전용 요금제

~5회/일

Ultra 구독 시 하루 한도

많이 헷갈리는 부분입니다. Gemini 3.1 Pro와 Gemini 3 Deep Think는 별개입니다. 이름이 비슷하고 같은 Gemini 3 시리즈라서 하나의 기능처럼 보이지만, 실제 사용 조건과 접근 방법이 완전히 다릅니다.

(출처: Google 공식 블로그, 2026.02.19)

반면 Deep Think는 3.1 Pro 위에 얹힌 강화된 추론 모드입니다. 2026년 2월 12일 구글이 업그레이드를 발표했고, 이 모드는 Google AI Ultra 구독자 전용으로만 제공됩니다.
(출처: 구글 코리아 블로그, 2026.02.12)

💡 공식 발표문의 구조를 보면 이 구분이 명확합니다. 구글은 2월 12일에 Deep Think 업그레이드를 먼저 발표하고, 일주일 뒤인 2월 19일에 3.1 Pro를 공개했습니다. 이 순서 자체가 Deep Think를 최상위에, 3.1 Pro를 “Deep Think를 가능하게 하는 기반”으로 포지셔닝했음을 보여줍니다.

▲ 목차로 돌아가기

벤치마크 수치, 직접 따라가 보면 이렇습니다

구글이 발표한 수치를 그냥 나열하는 게 아니라, 각각이 무엇을 의미하는지 짚어봤습니다.

벤치마크	Deep Think	3.1 Pro	의미
ARC-AGI-2	84.6%	77.1%	완전히 새로운 논리 패턴 해결 능력
HLE (툴 없음)	48.4%	미발표	포화 방지용 최고난도 시험
LiveCodeBench	95.4%	미발표	코딩 경쟁 수준 평가

(출처: Google 딥씽크 공식 블로그, 2026.02.12 / Google 3.1 Pro 공식 블로그, 2026.02.19)

ARC-AGI-2 수치를 놓고 보면, Deep Think(84.6%)와 3.1 Pro(77.1%)의 차이는 7.5%p입니다. 그런데 이 수치가 의미하는 바는 단순한 점수 차이가 아닙니다. ARC-AGI-2는 훈련 데이터에서 본 적 없는 패턴을 처음 보고 풀 수 있는지를 측정하는 벤치마크입니다. 여기서 7%p 이상 차이는 모델의 일반 추론 능력에서 실질적인 격차를 뜻합니다.

그리고 구글 공식 발표에 따르면, 3.1 Pro의 ARC-AGI-2 점수(77.1%)는 이전 세대 3 Pro 대비 2배 이상 향상된 수치입니다. 즉 3 Pro가 약 35% 수준이었다는 뜻이며, 불과 3개월 만에 이 정도의 도약이 이뤄진 셈입니다.

비교 대상으로 Claude Opus 4.6는 ARC-AGI-2에서 약 69.2%를 기록했습니다. (출처: Reddit r/agi, 2026.02.13) Deep Think가 이보다 15.4%p 앞서 있다는 뜻인데, 이 수치 자체가 실제 사용에서 체감으로 이어질지는 별개의 문제입니다.

▲ 목차로 돌아가기

Ultra만 된다고요? 실제론 Ultra도 이렇게 막힙니다

Deep Think는 Ultra 전용이라는 사실을 알고 구독한 사람들 중에서 “이게 뭔가 이상하다”는 반응이 나오는 이유가 있습니다. Ultra를 구독해도 Deep Think는 하루에 몇 번밖에 안 됩니다.

실제 사용자들의 보고에 따르면, Ultra 구독 상태에서 Deep Think를 하루에 5회 정도 사용하면 한도에 걸려 다음날까지 기능이 비활성화된다고 합니다. (출처: 네이버 블로그, 구글 제미나이 2.5 딥씽킹 사용자 경험 분석, 2025.08.05) 이 한도는 구글이 공식적으로 수치를 명시한 것이 아니라, 실사용 과정에서 확인된 수준입니다.

💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 구조가 보였습니다. 구글 공식 요금제 페이지(one.google.com)에는 Ultra에서 Deep Think를 제공한다고 명시되어 있지만, 구체적인 일일 한도는 어디에도 적혀 있지 않습니다. “최고 수준의 액세스”라는 표현만 있을 뿐입니다. 한도가 존재한다는 사실은 실사용에서만 확인됩니다.

Ultra 요금제의 가격은 2026년 3월 기준 한국에서 공식 공지된 수치로는 확인 필요 상태이며, 미국 기준 월 $250 수준으로 알려져 있습니다. (확인 필요: 한국 내 원화 요금은 구글 공식 페이지 기준 변동 가능) 이 요금을 내고도 Deep Think를 하루 5회 정도만 쓸 수 있다는 것은, Deep Think를 주 목적으로 구독할 때 상당한 제약입니다.

이 제한이 존재하는 이유는 기술적으로 설명됩니다. Deep Think는 여러 가설을 병렬로 동시에 처리하는 방식을 쓰는데, 이 과정이 일반 추론보다 훨씬 많은 컴퓨팅 자원을 씁니다. 구글이 이 기능을 무제한으로 제공하는 것은 현재 인프라 수준에서는 수익 구조상 불가능하다는 의미이기도 합니다. 이건 단순한 정책 결정이 아니라, 구조적 한계에서 나온 결과입니다.

▲ 목차로 돌아가기

Pro 요금제로 쓰는 사고 기능, 어디까지 되나요

Deep Think는 안 되지만, Pro에서도 Gemini 3.1 Pro의 사고 모드는 작동합니다. 이 두 가지는 구분해서 봐야 합니다.

구글 공식 개발자 문서에 따르면, Gemini 3.1 Pro는 사고(thinking) 기능을 끌 수 없습니다. (출처: Google AI for Developers 공식 문서, 2026.02.19 최종 업데이트) 다른 Flash 모델들은 사고 기능을 minimal 설정으로 줄일 수 있는데, 3.1 Pro는 아예 off가 없습니다. 즉 Pro 요금제에서 3.1 Pro를 쓰면 항상 사고 과정을 거친다는 뜻입니다.

이게 왜 중요하냐면, 사고 기능이 켜진 상태에서는 응답 시간이 일반 모드보다 깁니다. 간단한 질문을 해도 모델이 내부적으로 추론 과정을 거치기 때문입니다. 실제로 일부 사용자들은 간단한 작업에서 속도 저하를 경험한 바 있습니다. (출처: 블로그 simula, 네이버, 2025.08.05)

즉 Pro 구독자 입장에서 Gemini 3.1 Pro는 “항상 추론하는 모델”이고, Ultra 구독자는 그 위에서 Deep Think 모드라는 별도 레이어를 하루 몇 번 쓸 수 있는 구조입니다. 이 구조를 모르면 Pro를 쓰면서 “왜 응답이 느리지?”라는 의문이 생길 수 있습니다. 사고를 끌 수 없는 설계이기 때문입니다.

컨텍스트 창도 요금제마다 다릅니다

Google AI Plus는 128K 토큰, Pro와 Ultra는 100만 토큰(1M)으로 확장됩니다. (출처: Google One 공식 요금제 페이지, 2026.03 확인) Plus에서 Pro로 올라갈 때 컨텍스트 창이 약 8배 늘어납니다. 긴 문서를 분석하거나 대용량 코드베이스를 다루는 경우라면 이 차이가 실질적으로 느껴집니다.

▲ 목차로 돌아가기

공식 발표문과 실제 사용 흐름을 같이 놓고 보니

구글은 2026년 2월 12일 Deep Think 업그레이드를 발표하면서 “과학, 연구, 공학 분야의 난제”를 언급했습니다. 럿거스 대학교 수학자의 논문 오류 검출, 듀크대 초전도체 결정 성장 레시피 설계 같은 사례들이 나왔습니다. (출처: 구글 코리아 블로그, 2026.02.12)

여기서 중요한 점이 있습니다. 이 사례들은 하루 수 번의 사용으로도 의미가 있는 작업 유형입니다. 수학 논문 검토, 초전도체 레시피 설계는 하루에 한 번 질의해도 가치가 있는 작업입니다. 구글이 Deep Think를 “일반적인 코딩 도우미”가 아닌 “연구용 도구”로 프레이밍한 것은 이 하루 5회 한도와 일관성이 있는 설계 선택입니다.

💡 구글의 요금제 구조와 사용 사례를 교차해서 보면 이런 그림이 나옵니다. Deep Think는 “반복 사용”이 아니라 “한 번의 깊은 분석”을 위해 설계되어 있습니다. 대신 일상적인 코딩·글쓰기·분석은 3.1 Pro(사고 모드 항상 ON)로 처리하고, 막혔을 때만 Deep Think를 꺼내는 구조입니다. 이 흐름을 모른 채 Deep Think를 일반 채팅처럼 쓰려고 Ultra를 구독하면 한도에 금방 걸립니다.

솔직히 말하면, 이 구조는 현재 단계에서 Deep Think가 “서비스 제품”이라기보다는 구글의 기술 수준을 보여주는 시연에 더 가깝다는 의미이기도 합니다. 벤치마크 수치는 인상적이지만, 하루 5회라는 한도는 연속적인 작업 흐름에서는 사실상 사용 불가 수준입니다. 이 점은 기존 블로그들이 잘 짚지 않는 부분입니다.

▲ 목차로 돌아가기

그래서 어떤 요금제가 맞을까요

사용 목적에 따라 답이 갈립니다. 아래 기준으로 판단하면 비교적 명확합니다.

요금제	Deep Think	3.1 Pro 사고 모드	컨텍스트 창	맞는 사용
무료	❌	제한적	기본	가볍게 써보기
Plus	❌	추가 수준	128K	일상 업무 보조
Pro	❌	높은 한도	1M	코딩·분석 집중
Ultra	✅ (~5회/일)	최고 수준	1M	연구·난제 분석

※ 위 표의 요금제별 구체적 가격은 지역·시기에 따라 다를 수 있습니다. 구글 공식 요금제 페이지(one.google.com) 기준으로 확인하시기 바랍니다.

개인적인 의견으로는, 일반적인 코딩·글쓰기·분석 작업이 주 목적이라면 Pro면 충분합니다. Gemini 3.1 Pro 자체의 추론 성능이 이전 세대 대비 크게 올라갔고, 1M 컨텍스트 창은 대부분의 실무에서 넘치는 수준입니다. Deep Think를 위해 Ultra를 구독하는 것은 하루 5회 한도를 감수할 수 있는 특수한 목적이 있을 때만 고려할 만합니다.

▲ 목차로 돌아가기

Q&A

Q1. Gemini 3.1 Pro와 Gemini 3 Deep Think는 같은 건가요?

다릅니다. Gemini 3.1 Pro는 2026년 2월 19일 출시된 기반 추론 모델이고, Gemini 3 Deep Think는 그보다 일주일 앞서 공개된 강화 추론 모드입니다. Deep Think는 Ultra 전용 기능이며, 3.1 Pro 자체의 사고 기능과는 접근 경로와 한도가 완전히 다릅니다.

Q2. Pro 요금제로 Deep Think를 사용할 수 있나요?

사용할 수 없습니다. 구글 공식 요금제 페이지(one.google.com)에 따르면 Deep Think는 Google AI Ultra 구독자에게만 제공됩니다. Pro에서는 Gemini 3.1 Pro의 일반 사고 모드(항상 ON)를 사용할 수 있지만, Deep Think 모드 자체는 접근 불가합니다.

Q3. Ultra를 구독하면 Deep Think를 무제한으로 쓸 수 있나요?

아닙니다. 실사용자들의 보고에 따르면 Ultra 구독 상태에서도 Deep Think는 하루 약 5회 수준에서 한도에 걸리는 것으로 확인됩니다. 구글이 공식 문서에 정확한 횟수를 명시하지는 않았으며, 이 한도는 Deep Think의 높은 컴퓨팅 비용에서 비롯된 구조적 제약입니다.

Q4. Gemini 3.1 Pro에서 사고 기능을 끌 수 있나요?

끌 수 없습니다. 구글 공식 개발자 문서에 따르면, Gemini 3.1 Pro는 사고(thinking) 기능을 사용 중지할 수 없습니다. Flash 모델 등 일부 모델은 minimal 설정으로 사고를 줄일 수 있지만, 3.1 Pro는 설계 자체가 항상 추론을 거치는 구조입니다. 이 때문에 간단한 질문에서도 응답 시간이 길어질 수 있습니다.

Q5. Gemini 3.1 Pro를 무료로 테스트할 수 있나요?

개발자라면 Google AI Studio(aistudio.google.com)에서 Gemini 3.1 Pro 프리뷰 모델을 API를 통해 무료로 테스트할 수 있습니다. API 키를 발급받고 모델 코드 gemini-3.1-pro-preview를 지정하면 됩니다. 다만 속도 제한이 있으며, 프리뷰 단계이므로 안정성 변동이 있을 수 있습니다.

▲ 목차로 돌아가기

마치며

그런데 막상 쓰려고 보면 요금제 구조가 생각보다 복잡합니다. Deep Think는 Ultra 전용이고, Ultra에서도 하루 사용 횟수가 제한됩니다. Gemini 3.1 Pro 자체는 Pro·Ultra 모두에서 쓸 수 있지만, 사고 기능을 끌 수 없어서 응답 속도가 느릴 수 있다는 점도 알고 써야 합니다.

정리하면 이렇습니다. 일상적인 AI 작업에는 Pro면 충분합니다. Gemini 3.1 Pro의 기반 추론 성능 자체가 이전 세대 대비 2배 이상 올랐고, 1M 컨텍스트 창은 대부분의 실무에서 부족함이 없습니다. Deep Think는 진짜 복잡한 연구·수학·알고리즘 문제를 하루에 몇 번 집중적으로 다루는 경우에만 Ultra의 가치가 나옵니다. 목적이 맞지 않으면 Ultra 구독 후 한도에 바로 걸려 실망할 수 있습니다.

이 포스팅은 2026년 3월 20일 기준으로 작성됐습니다. 구글은 요금제와 기능을 자주 업데이트하므로, 구독 전 공식 페이지에서 최신 정보를 반드시 확인하시기 바랍니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

Google 공식 블로그 — Gemini 3.1 Pro 발표문 (2026.02.19)
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/
구글 코리아 공식 블로그 — Gemini 3 Deep Think 업그레이드 (2026.02.12)
https://blog.google/intl/ko-kr/company-news/technology/gemini-3-deep-think/
Google AI for Developers — Gemini 3.1 Pro 프리뷰 공식 스펙 (최종 업데이트: 2026.02.19)
https://ai.google.dev/gemini-api/docs/models/gemini-3.1-pro-preview?hl=ko
Google One 공식 AI 요금제 페이지 (2026.03 확인)
https://one.google.com/intl/ko_kr/about/google-ai-plans/
네이버 블로그(simula) — 구글 제미나이 2.5 딥씽킹과 프로 모델 사용자 경험 분석 (2025.08.05)
https://blog.naver.com/simula/223960265323

본 포스팅 작성 이후 Google AI 서비스 정책·요금·UI·기능이 변경될 수 있습니다. 모든 수치는 작성 시점 기준이며, 구독 전 반드시 공식 페이지(one.google.com)에서 최신 정보를 확인하시기 바랍니다. 본문 내 Ultra 하루 사용 한도(약 5회)는 실사용자 보고 기준이며, 구글이 공식 수치로 명시한 내용은 아닙니다.

AI 추론 모델, 구글 AI Ultra, Gemini 3.1 Pro, Gemini Deep Think, Google AI 요금제

Gemini 3.1 Deep Think, Pro 요금제로 될까요?

벤치마크 수치, 직접 따라가 보면 이렇습니다

Ultra만 된다고요? 실제론 Ultra도 이렇게 막힙니다

Pro 요금제로 쓰는 사고 기능, 어디까지 되나요

컨텍스트 창도 요금제마다 다릅니다

공식 발표문과 실제 사용 흐름을 같이 놓고 보니

그래서 어떤 요금제가 맞을까요

Q&A

마치며

본 포스팅 참고 자료

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

Gemini 3.1 Deep Think, Pro 요금제로 될까요?

벤치마크 수치, 직접 따라가 보면 이렇습니다

Ultra만 된다고요? 실제론 Ultra도 이렇게 막힙니다

Pro 요금제로 쓰는 사고 기능, 어디까지 되나요

컨텍스트 창도 요금제마다 다릅니다

공식 발표문과 실제 사용 흐름을 같이 놓고 보니

그래서 어떤 요금제가 맞을까요

Q&A

마치며

본 포스팅 참고 자료

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기