Google AI Ultra 전용
Gemini 3 Deep Think,
하루 10개가 전부입니다
벤치마크 수치는 역대 최고라는데, 막상 쓰려고 하면 조건이 꽤 많습니다. 결론부터 말씀드리면, Deep Think는 월 약 37만 원짜리 Ultra 구독자만 하루 10번 쓸 수 있는 기능입니다.
Deep Think가 정확히 무엇인지부터
Gemini 3 Deep Think는 구글이 2026년 2월 12일 공개한 전문 추론 모드입니다. (출처: Google 공식 블로그, 2026.02.12) 일반적인 Gemini 대화와 달리, 답변을 즉시 내뱉지 않고 문제를 수 분에 걸쳐 내부적으로 탐색한 뒤 응답합니다. 구글이 처음 선보인 건 2025년 11월이었고, 이번 업데이트로 ‘현실 세계의 불완전한 데이터’를 다루는 능력을 크게 보강했다고 밝혔습니다.
실제 활용 사례로 공식 블로그에 소개된 건 수학 논문의 논리 오류 검출(미국 럿거스 대학교), 초전도체 결정 성장 공정 최적화(듀크 대학교 왕 연구실), 스케치를 3D 프린팅 파일로 변환하는 작업입니다. 즉, 일상적인 텍스트 작성 도우미가 아니라 과학·공학 난제를 위해 설계된 모드입니다. 그 전제를 이해하고 써야 합니다.
벤치마크 수치, 어떻게 읽어야 할까요
구글이 공개한 수치는 세 가지입니다. ARC-AGI-2에서 84.6%, Humanity’s Last Exam(도구 없이)에서 48.4%, LiveCodeBench에서 95.4%입니다. (출처: Google 공식 블로그, 2026.02.12) 이게 어느 정도 수준인지 다른 모델과 비교해보면 의미가 명확해집니다.
| 모델 | ARC-AGI-2 | HLE(도구 없음) |
|---|---|---|
| Gemini 3 Deep Think | 84.6% | 48.4% |
| Claude Opus 4.6 | 68.8% | — |
| GPT-5.2 | 52.9% | 37.5% |
출처: LinkedIn (Kumar Gautam, 2026.02.14) / DigitalApplied.com (2026.02.12)
ARC-AGI-2 기준으로 Deep Think는 GPT-5.2보다 31.7%p 앞섭니다. 이 차이는 단순 수치 이상의 의미를 가집니다. ARC-AGI-2는 어린이가 쉽게 푸는 시각적 패턴 추론 문제를 AI가 얼마나 잘 푸는지 측정하는 벤치마크로, ‘암기 기반 성능’이 아닌 ‘진짜 추론 능력’에 가까운 지표로 평가받습니다. 즉, 이 수치는 “학습 데이터에서 외워서 냈다”고 보기 어렵다는 의미입니다.
다만 한 가지 짚고 넘어가야 할 게 있습니다. Humanity’s Last Exam 48.4%는 절반을 못 넘겼다는 뜻이기도 합니다. 해당 시험은 세계 최고 수준 전문가들이 설계한 문항들로, 48.4%는 역대 최고 기록이지만 여전히 인간 전문가에게는 한참 못 미치는 수준이라는 해석도 가능합니다.
Pro 구독자라면 못 씁니다 — 요금 구조
여기서 많은 분들이 놓치는 부분이 생깁니다. 구글의 AI 요금제는 현재 세 단계입니다. Google AI Plus, Google AI Pro, Google AI Ultra. 흔히 “유료 구독이면 된다”고 생각하기 쉽지만, Deep Think 3.1은 Ultra에서만 활성화됩니다. (출처: Google 공식 지원 페이지, support.google.com/gemini, 2026.03.20 확인)
| 요금제 | Deep Think | 월 요금(미국 기준) |
|---|---|---|
| 무료 | ❌ 불가 | — |
| Google AI Plus | ❌ 불가 | 확인 필요 |
| Google AI Pro | ❌ 불가 | 공개 미확인 |
| Google AI Ultra | ✅ 하루 10개 | $249.99 |
출처: Google One 공식 요금제 페이지 (one.google.com/intl/ko_kr/about/google-ai-plans/, 2026.03.20 확인)
Ultra 구독은 신규 사용자 기준 첫 3개월 50% 할인이 적용되기도 했습니다. (출처: Reddit r/Bard, Threads @tilnote, 2025.11.18 게시) 하지만 현재 해당 프로모션이 활성화되어 있는지는 공식 페이지에서 직접 확인해야 합니다.
하루 10개 한도, 실제로 어떻게 소진될까요
공식 지원 문서에 명시된 수치: Ultra 구독자 기준 Deep Think 3.1의 일일 한도는 하루 10개 프롬프트, 컨텍스트 윈도우는 192,000 토큰입니다. (출처: Google 지원 센터 Gemini 앱 한도 페이지, 2026.03.20 확인) 일반 사고 모델(Thinking Model)의 Ultra 한도가 하루 1,500개인 것과 비교하면, Deep Think는 그것의 150분의 1 수준입니다.
이 차이가 실생활에서 어떻게 나타나는지를 생각해보면 이렇습니다. 긴 과학 논문 분석 하나, 복잡한 코드 디버깅 요청 하나, 수학 증명 검토 하나 — 이런 무거운 작업 세 건만 처리해도 하루 한도의 30%가 사라집니다. 게다가 Reddit 커뮤니티에서는 프롬프트를 제출했다가 오류가 반환된 경우에도 카운트가 차감됐다는 보고가 있습니다. (출처: Reddit r/Bard, “3.0 Deep Think 비율 제한은 하루 10입니다”, 2025.12.04)
대기 시간이 수 분인 이유
구글 공식 지원 문서에는 이런 문장이 있습니다. “답변을 생성하는 데 몇 분 정도 걸릴 수 있습니다. 기다리는 동안 해당 채팅에서 나가 새로운 채팅을 시작할 수 있습니다.” (출처: support.google.com/gemini, Deep Think 사용 안내, 2026.03.20 확인) 이 문구가 의미하는 건 단순히 느리다는 게 아닙니다. 아예 알림 기능을 제공한다는 겁니다.
웹 앱에서는 완성된 답변이 있는 채팅 목록 옆에 표시가 생기고, 모바일에서는 기기 알림으로 통보됩니다. 이 구조는 Deep Think가 ChatGPT나 Claude처럼 즉각적인 응답을 기대하는 도구가 아님을 명확히 보여줍니다. 오히려 과학 논문 피어 리뷰나 복잡한 공학 계산처럼 결과를 기다릴 수 있는 작업에 맞는 구조입니다.
이 점이 실사용 후기에서 엇갈리는 이유이기도 합니다. Reddit에서는 “일반 코딩 작업에는 별로 유용하지 않다”는 반응이 있는 반면, 연구·공학 분야 테스터들로부터는 긍정적인 피드백이 나왔습니다. (출처: Reddit r/OpenAI, “Oh damn Gemini Deep Think is far better than o3”, 2025.08.01) 어떤 작업에 쓰느냐에 따라 체감이 크게 다릅니다.
API 얼리 액세스는 어떻게 다른가요
결론적으로 말씀드리면, 지금 당장 Deep Think를 가장 쉽게 접근하는 방법은 Ultra 구독 후 Gemini 앱 내에서 모델 선택기에서 ‘Deep Think’를 고르는 것입니다. API 경로는 신청→심사→승인 대기 과정이 필요합니다.
Q&A
마치며
그런데 이 기능을 실제로 쓰려면 월 약 37만 원을 내야 하고, 그것도 하루 10번이 전부입니다. 오류가 나도 카운트가 차감될 수 있고, 응답을 받는 데 수 분이 걸립니다. 일상적인 작업에 쓰기엔 분명히 과한 조건입니다.
결론적으로 솔직히 말씀드리면, Deep Think는 과학·공학 연구자나 특정 분야 전문가에게는 그 가격을 정당화할 수 있는 도구입니다. 하지만 일반적인 업무나 학습 용도라면, Pro 구독의 사고 모델로도 충분하다는 판단이 맞습니다. 기능의 스펙보다 실제 사용 조건을 먼저 따져보는 게 맞습니다.
본 포스팅 참고 자료
- Google 공식 블로그 — Gemini 3 Deep Think 업데이트 (2026.02.12): blog.google/intl/ko-kr/company-news/technology/gemini-3-deep-think/
- Google 지원 센터 — Gemini 앱 Deep Think 사용 안내: support.google.com/gemini/answer/16345172
- Google 지원 센터 — Gemini 앱 한도 및 요금제 (2026.03.20 확인): support.google.com/gemini/answer/16275805
- Google One 공식 요금제 페이지 (2026.03.20 확인): one.google.com/intl/ko_kr/about/google-ai-plans/
- Gemini API 공식 Changelog: ai.google.dev/gemini-api/docs/changelog
- DigitalApplied — Gemini 3 Deep Think 벤치마크 전체 수치 (2026.02.12): digitalapplied.com/blog/gemini-3-deep-think-reasoning-benchmarks-guide
본 포스팅은 2026년 3월 20일 기준 공식 자료를 토대로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 요금제, 한도, 기능 접근 조건은 구글 공식 페이지에서 최신 정보를 직접 확인하세요.


댓글 남기기