2026.02.12 공식 업데이트 기준
Google AI Ultra 전용

Gemini 3 Deep Think,
하루 10개가 전부입니다

벤치마크 수치는 역대 최고라는데, 막상 쓰려고 하면 조건이 꽤 많습니다. 결론부터 말씀드리면, Deep Think는 월 약 37만 원짜리 Ultra 구독자만 하루 10번 쓸 수 있는 기능입니다.

84.6%

ARC-AGI-2

10회/일

Ultra 전용 한도

$249.99

월 구독료 (Ultra)

Deep Think가 정확히 무엇인지부터

Gemini 3 Deep Think는 구글이 2026년 2월 12일 공개한 전문 추론 모드입니다. (출처: Google 공식 블로그, 2026.02.12) 일반적인 Gemini 대화와 달리, 답변을 즉시 내뱉지 않고 문제를 수 분에 걸쳐 내부적으로 탐색한 뒤 응답합니다. 구글이 처음 선보인 건 2025년 11월이었고, 이번 업데이트로 ‘현실 세계의 불완전한 데이터’를 다루는 능력을 크게 보강했다고 밝혔습니다.

실제 활용 사례로 공식 블로그에 소개된 건 수학 논문의 논리 오류 검출(미국 럿거스 대학교), 초전도체 결정 성장 공정 최적화(듀크 대학교 왕 연구실), 스케치를 3D 프린팅 파일로 변환하는 작업입니다. 즉, 일상적인 텍스트 작성 도우미가 아니라 과학·공학 난제를 위해 설계된 모드입니다. 그 전제를 이해하고 써야 합니다.

💡 공식 블로그와 실제 사용 지원 문서를 같이 놓고 보니, ‘Deep Think’와 일반 ‘사고 모드(Thinking Model)’는 다른 기능입니다. 사고 모드는 Pro 구독자도 쓸 수 있지만, Deep Think는 Ultra 전용입니다.

▲ 목차로 돌아가기

벤치마크 수치, 어떻게 읽어야 할까요

구글이 공개한 수치는 세 가지입니다. ARC-AGI-2에서 84.6%, Humanity’s Last Exam(도구 없이)에서 48.4%, LiveCodeBench에서 95.4%입니다. (출처: Google 공식 블로그, 2026.02.12) 이게 어느 정도 수준인지 다른 모델과 비교해보면 의미가 명확해집니다.

모델	ARC-AGI-2	HLE(도구 없음)
Gemini 3 Deep Think	84.6%	48.4%
Claude Opus 4.6	68.8%	—
GPT-5.2	52.9%	37.5%

출처: LinkedIn (Kumar Gautam, 2026.02.14) / DigitalApplied.com (2026.02.12)

ARC-AGI-2 기준으로 Deep Think는 GPT-5.2보다 31.7%p 앞섭니다. 이 차이는 단순 수치 이상의 의미를 가집니다. ARC-AGI-2는 어린이가 쉽게 푸는 시각적 패턴 추론 문제를 AI가 얼마나 잘 푸는지 측정하는 벤치마크로, ‘암기 기반 성능’이 아닌 ‘진짜 추론 능력’에 가까운 지표로 평가받습니다. 즉, 이 수치는 “학습 데이터에서 외워서 냈다”고 보기 어렵다는 의미입니다.

다만 한 가지 짚고 넘어가야 할 게 있습니다. Humanity’s Last Exam 48.4%는 절반을 못 넘겼다는 뜻이기도 합니다. 해당 시험은 세계 최고 수준 전문가들이 설계한 문항들로, 48.4%는 역대 최고 기록이지만 여전히 인간 전문가에게는 한참 못 미치는 수준이라는 해석도 가능합니다.

▲ 목차로 돌아가기

Pro 구독자라면 못 씁니다 — 요금 구조

여기서 많은 분들이 놓치는 부분이 생깁니다. 구글의 AI 요금제는 현재 세 단계입니다. Google AI Plus, Google AI Pro, Google AI Ultra. 흔히 “유료 구독이면 된다”고 생각하기 쉽지만, Deep Think 3.1은 Ultra에서만 활성화됩니다. (출처: Google 공식 지원 페이지, support.google.com/gemini, 2026.03.20 확인)

요금제	Deep Think	월 요금(미국 기준)
무료	❌ 불가	—
Google AI Plus	❌ 불가	확인 필요
Google AI Pro	❌ 불가	공개 미확인
Google AI Ultra	✅ 하루 10개	$249.99

출처: Google One 공식 요금제 페이지 (one.google.com/intl/ko_kr/about/google-ai-plans/, 2026.03.20 확인)

💡 Reddit 사용자 커뮤니티에서 확인된 패턴: Pro 구독자가 Deep Think를 사용하려고 시도해도 버튼이 아예 활성화되지 않거나 오류가 발생합니다. 이는 UI에서 Deep Think 선택지가 보이지 않기 때문입니다.

Ultra 구독은 신규 사용자 기준 첫 3개월 50% 할인이 적용되기도 했습니다. (출처: Reddit r/Bard, Threads @tilnote, 2025.11.18 게시) 하지만 현재 해당 프로모션이 활성화되어 있는지는 공식 페이지에서 직접 확인해야 합니다.

▲ 목차로 돌아가기

하루 10개 한도, 실제로 어떻게 소진될까요

공식 지원 문서에 명시된 수치: Ultra 구독자 기준 Deep Think 3.1의 일일 한도는 하루 10개 프롬프트, 컨텍스트 윈도우는 192,000 토큰입니다. (출처: Google 지원 센터 Gemini 앱 한도 페이지, 2026.03.20 확인) 일반 사고 모델(Thinking Model)의 Ultra 한도가 하루 1,500개인 것과 비교하면, Deep Think는 그것의 150분의 1 수준입니다.

이 차이가 실생활에서 어떻게 나타나는지를 생각해보면 이렇습니다. 긴 과학 논문 분석 하나, 복잡한 코드 디버깅 요청 하나, 수학 증명 검토 하나 — 이런 무거운 작업 세 건만 처리해도 하루 한도의 30%가 사라집니다. 게다가 Reddit 커뮤니티에서는 프롬프트를 제출했다가 오류가 반환된 경우에도 카운트가 차감됐다는 보고가 있습니다. (출처: Reddit r/Bard, “3.0 Deep Think 비율 제한은 하루 10입니다”, 2025.12.04)

⚠️ 공식 지원 문서에는 “사용량 한도가 변경될 수 있으며, 사전 고지 없이 한도가 조정될 수 있다”고 명시되어 있습니다. 즉, 현재의 10개 한도도 구글의 서버 부하 상황에 따라 언제든 더 낮아질 수 있습니다.

▲ 목차로 돌아가기

대기 시간이 수 분인 이유

구글 공식 지원 문서에는 이런 문장이 있습니다. “답변을 생성하는 데 몇 분 정도 걸릴 수 있습니다. 기다리는 동안 해당 채팅에서 나가 새로운 채팅을 시작할 수 있습니다.” (출처: support.google.com/gemini, Deep Think 사용 안내, 2026.03.20 확인) 이 문구가 의미하는 건 단순히 느리다는 게 아닙니다. 아예 알림 기능을 제공한다는 겁니다.

웹 앱에서는 완성된 답변이 있는 채팅 목록 옆에 표시가 생기고, 모바일에서는 기기 알림으로 통보됩니다. 이 구조는 Deep Think가 ChatGPT나 Claude처럼 즉각적인 응답을 기대하는 도구가 아님을 명확히 보여줍니다. 오히려 과학 논문 피어 리뷰나 복잡한 공학 계산처럼 결과를 기다릴 수 있는 작업에 맞는 구조입니다.

이 점이 실사용 후기에서 엇갈리는 이유이기도 합니다. Reddit에서는 “일반 코딩 작업에는 별로 유용하지 않다”는 반응이 있는 반면, 연구·공학 분야 테스터들로부터는 긍정적인 피드백이 나왔습니다. (출처: Reddit r/OpenAI, “Oh damn Gemini Deep Think is far better than o3”, 2025.08.01) 어떤 작업에 쓰느냐에 따라 체감이 크게 다릅니다.

▲ 목차로 돌아가기

API 얼리 액세스는 어떻게 다른가요

💡 얼리 액세스 API와 앱 내 Deep Think가 동일한 모델인지, 응답 속도나 품질 차이가 있는지는 현재 공식 문서에 명시되지 않았습니다. 확인 필요한 항목입니다.

결론적으로 말씀드리면, 지금 당장 Deep Think를 가장 쉽게 접근하는 방법은 Ultra 구독 후 Gemini 앱 내에서 모델 선택기에서 ‘Deep Think’를 고르는 것입니다. API 경로는 신청→심사→승인 대기 과정이 필요합니다.

▲ 목차로 돌아가기

Q&A

Q. Gemini 3 Deep Think를 무료로 써볼 수 있는 방법이 있나요?

현재 공식적으로는 없습니다. Ultra 구독(월 $249.99)이 유일한 일반 사용자 경로입니다. 다만 Google One Ultra를 처음 구독하는 경우 첫 3개월 50% 할인이 적용된 사례가 보고됐습니다. 공식 프로모션 여부는 one.google.com에서 직접 확인하세요.

Q. 하루 10개 한도가 초기화되는 시점은 언제인가요?

공식 지원 문서에는 “하루 동안 점진적으로 초기화”된다고 명시되어 있습니다. 정확히 자정(어느 시간대 기준인지)에 일괄 초기화되는 게 아닐 수 있습니다. 한도에 도달하면 Gemini 앱이 초기화 시점을 알림으로 안내합니다.

Q. Pro 요금제에서는 Deep Think 대신 어떤 모드를 쓸 수 있나요?

‘사고 모델(Thinking Model)’은 Pro에서도 사용 가능하며, 하루 300개 프롬프트 한도가 있습니다. Deep Think보다는 추론 깊이가 낮지만 일반 복잡한 질문 처리에는 충분합니다. ‘Pro 3.1’ 모델은 하루 100개 한도로 별도 제공됩니다. (출처: Google 지원 센터 Gemini 앱 한도 페이지)

Q. Deep Think를 사용할 때 파일을 업로드할 수 있나요?

공식 문서에 따르면 Deep Think 3.1의 컨텍스트 윈도우는 192,000 토큰입니다. 이는 약 1,500페이지 텍스트에 해당하는 양으로, 상당히 긴 문서 분석도 가능합니다. 다만 이미지, 동영상 등 멀티모달 입력과의 연동 여부는 공식 문서에서 명확히 명시되지 않아 확인이 필요합니다.

Q. Gemini 3 Deep Think는 한국어 질문도 제대로 처리하나요?

구글 공식 블로그의 한국어 버전(blog.google/intl/ko-kr)이 2026년 3월 12일 Deep Think 관련 포스팅을 게재했다는 점에서, 한국어 사용 환경을 지원하는 것으로 보입니다. 다만 과학·수학 난제 처리에서 한국어와 영어 간 품질 차이가 있는지는 공식 발표 자료에 명시되지 않았습니다. 확인 필요합니다.

▲ 목차로 돌아가기

마치며

그런데 이 기능을 실제로 쓰려면 월 약 37만 원을 내야 하고, 그것도 하루 10번이 전부입니다. 오류가 나도 카운트가 차감될 수 있고, 응답을 받는 데 수 분이 걸립니다. 일상적인 작업에 쓰기엔 분명히 과한 조건입니다.

결론적으로 솔직히 말씀드리면, Deep Think는 과학·공학 연구자나 특정 분야 전문가에게는 그 가격을 정당화할 수 있는 도구입니다. 하지만 일반적인 업무나 학습 용도라면, Pro 구독의 사고 모델로도 충분하다는 판단이 맞습니다. 기능의 스펙보다 실제 사용 조건을 먼저 따져보는 게 맞습니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

Google 공식 블로그 — Gemini 3 Deep Think 업데이트 (2026.02.12): blog.google/intl/ko-kr/company-news/technology/gemini-3-deep-think/
Google 지원 센터 — Gemini 앱 Deep Think 사용 안내: support.google.com/gemini/answer/16345172
Google 지원 센터 — Gemini 앱 한도 및 요금제 (2026.03.20 확인): support.google.com/gemini/answer/16275805
Google One 공식 요금제 페이지 (2026.03.20 확인): one.google.com/intl/ko_kr/about/google-ai-plans/
Gemini API 공식 Changelog: ai.google.dev/gemini-api/docs/changelog
DigitalApplied — Gemini 3 Deep Think 벤치마크 전체 수치 (2026.02.12): digitalapplied.com/blog/gemini-3-deep-think-reasoning-benchmarks-guide

본 포스팅은 2026년 3월 20일 기준 공식 자료를 토대로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 요금제, 한도, 기능 접근 조건은 구글 공식 페이지에서 최신 정보를 직접 확인하세요.

Gemini 3 Deep Think, 하루 10개가 전부입니다

Gemini 3 Deep Think,
하루 10개가 전부입니다

Deep Think가 정확히 무엇인지부터

벤치마크 수치, 어떻게 읽어야 할까요

Pro 구독자라면 못 씁니다 — 요금 구조

하루 10개 한도, 실제로 어떻게 소진될까요

대기 시간이 수 분인 이유

API 얼리 액세스는 어떻게 다른가요

Q&A

마치며

본 포스팅 참고 자료

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

Gemini 3 Deep Think, 하루 10개가 전부입니다

Gemini 3 Deep Think,하루 10개가 전부입니다

Deep Think가 정확히 무엇인지부터

벤치마크 수치, 어떻게 읽어야 할까요

Pro 구독자라면 못 씁니다 — 요금 구조

하루 10개 한도, 실제로 어떻게 소진될까요

대기 시간이 수 분인 이유

API 얼리 액세스는 어떻게 다른가요

Q&A

마치며

본 포스팅 참고 자료

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기

Gemini 3 Deep Think,
하루 10개가 전부입니다