Gemini 3 Deep Think, Ultra라도 하루 10번만 됩니다

Published on

in

Gemini 3 Deep Think, Ultra라도 하루 10번만 됩니다

2026.03.22 기준
Gemini App 최신 한도 반영
IT/AI

Gemini 3 Deep Think,
Ultra라도 하루 10번만 됩니다

월 36만 원짜리 Google AI Ultra 요금제에 포함된 Deep Think 3.1은 하루 사용 한도가 10개입니다. 같은 요금제에서 Thinking 모델은 하루 1,500개인데, 이 숫자가 150분의 1로 줄어드는 이유가 뭔지 공식 문서에서 직접 확인했습니다. 72시간 락아웃 사례, 192K 컨텍스트 제한의 실제 의미까지 짚어봤습니다.

10개/일
Deep Think 3.1 일일 한도
1,500개/일
Thinking 모델 일일 한도
₩36만/월
Google AI Ultra 구독료
84.6%
ARC-AGI-2 점수 (2026.02)

Thinking 1,500개인데
Deep Think는 왜 10개인가

Google AI Ultra 요금제 안내 페이지를 보면 헷갈리는 항목이 하나 있습니다. “Thinking” 모델은 하루 1,500개 프롬프트를 쓸 수 있는데, 바로 아래 줄에 “Deep Think 3.1 — 하루 최대 10개”라는 별도 항목이 등장합니다. 같은 울트라 구독인데 왜 이렇게 다를까요?

결론부터 말씀드리면, Thinking 모델과 Deep Think는 완전히 다른 레이어입니다. Thinking은 Gemini 3 Flash 기반으로 ‘빠른 추론’을 하는 모드이고, Deep Think는 Gemini 3 Pro 위에 올라간 병렬 추론(parallel reasoning) 특화 모드입니다. 구글 공식 지원 문서에는 이렇게 나와 있습니다: Thinking은 “복잡한 문제를 빠르게 해결하는 데 최적화”된 반면, Deep Think는 “수학·과학·코딩 등 최고 난이도 과제”를 위한 별도 자원을 소모합니다. (출처: Google Gemini 앱 한도 공식 문서, support.google.com/gemini/answer/16275805, 2026.03 기준)

단순하게 계산해 보면 이렇습니다. Ultra 구독료는 월 $249.99(약 36만 원)입니다. 30일 기준 Deep Think는 하루 10개, 즉 한 달에 최대 300개 사용 가능합니다.

💡 공식 한도 발표문과 실제 요금 구조를 같이 놓고 보니 이런 차이가 보였습니다.

Deep Think 1회당 요금 환산:
$$\text{1회당 비용} = \frac{\$249.99}{300\text{회}} \approx \$0.83 \approx \text{약 }1{,}200\text{원/회}$$
반면 Pro 모델 500개 기준으로 환산하면 1회당 약 240원입니다. 같은 요금제 안에서 Deep Think 1회는 Pro 모델의 5배 비용 효율로 써야 한다는 뜻입니다.

이걸 모르고 Ultra를 결제하면, Thinking을 하루 내내 쓰다가 “Deep Think는 왜 안 돼?”라는 상황이 생깁니다. Thinking 한도를 모두 소진해도 Deep Think 10개는 별개로 남아 있고, 반대로 Deep Think 10개를 먼저 쓰고 나면 Thinking 1,500개가 남아도 Deep Think는 다음 날까지 막힙니다.

▲ 목차로 돌아가기

2026.02.12 업그레이드,
공식 벤치마크 수치 해석

2026년 2월 12일, 구글은 Deep Think를 대규모 업그레이드하면서 공식 블로그에 수치를 공개했습니다. (출처: Google Blog — Gemini 3 Deep Think: Advancing science, research and engineering, 2026.02.12) 숫자만 보면 인상적인데, 실제로 어떤 의미인지 짚어보겠습니다.

벤치마크 2025.12 점수 2026.02 점수 변화
ARC-AGI-2 45.1% 84.6% +39.5%p
Humanity’s Last Exam 41.0% 48.4% +7.4%p
Codeforces Elo 미공개 3,455
CMT-Benchmark (물리학) 미공개 50.5%

ARC-AGI-2 점수 84.6%가 핵심입니다. 이 벤치마크는 훈련 데이터로 풀 수 없는 순수한 추상 추론 능력을 측정합니다. 쉽게 말하면 “한 번도 본 적 없는 퍼즐을 푸는 능력”인데, 두 달 만에 45.1%에서 84.6%로 뛰었습니다. 점진적 개선이 아니라 추론 구조 자체가 바뀌었다고 봐야 합니다. (출처: ARC Prize Foundation 공식 검증, Google Blog 동일 문서)

Humanity’s Last Exam(HLE)에서는 Deep Think 48.4%로 Claude Opus 4.6(40.0%), GPT-5.2(34.5%)를 앞섭니다. HLE는 최신 AI의 한계를 테스트하기 위해 설계된 벤치마크인데, 이 점수 격차는 단순 순위 경쟁을 넘어 실제 연구 작업에서도 차이가 날 수 있다는 신호입니다.

💡 구글이 공개한 실제 적용 사례를 보면 벤치마크가 빈말이 아닙니다.

러트거스 대학 Lisa Carbone 교수는 수학 논문 검토에 Deep Think를 활용했는데, 인간 동료 심사(peer review)가 통과시킨 논리적 결함을 Deep Think가 잡아냈습니다. 듀크 대학 Wang Lab은 반도체 소재 연구에서 기존 방법으로 달성하기 어려웠던 100μm 이상의 박막 성장 레시피를 Deep Think로 설계했습니다. 두 사례 모두 구글 공식 블로그에 직접 이름과 소속까지 공개된 실명 사례입니다.

▲ 목차로 돌아가기

192K 컨텍스트 윈도우 —
Pro의 1M과 얼마나 다른가

Deep Think 3.1의 또 다른 제약이 있습니다. 컨텍스트 윈도우가 192,000 토큰으로 고정됩니다. 같은 Ultra 요금제의 Gemini 3.1 Pro 모델은 100만 토큰을 지원하는데, Deep Think를 켜는 순간 컨텍스트가 5분의 1 이하로 줄어듭니다. (출처: 9to5Google — What Gemini features you get with Google AI Pro [Feb 2026], 2026.03.17 업데이트)

숫자로 비교하면 이렇습니다.

모드 컨텍스트 윈도우 약 텍스트 분량 일일 한도
Deep Think 3.1 192,000 토큰 약 290페이지 10개
Gemini 3 Pro (Ultra) 1,000,000 토큰 약 1,500페이지 500개
Thinking (Ultra) 별도 명시 없음 1,500개

192K 토큰은 약 290페이지 분량의 텍스트를 처리할 수 있는 크기입니다. 일반적인 작업에서는 충분해 보이지만, 장문 코드베이스 분석이나 수십 개 논문을 한 번에 넣고 검토하는 용도라면 벽에 부딪힐 수 있습니다. Pro 모델은 30,000줄의 코드를 한 번에 처리할 수 있지만, Deep Think는 약 6,000줄 수준에서 컨텍스트 한계가 생깁니다.

기존 블로그들은 벤치마크 수치를 나열하는 데 집중하는데, 컨텍스트 윈도우 제약까지 짚은 글은 거의 없습니다. 공식 발표문과 한도 문서를 같이 놓고 봤을 때, Deep Think가 추론 능력은 뛰어나지만 동시에 처리할 수 있는 정보량 자체가 제한된다는 점은 실제 사용 시나리오에서 중요하게 따져봐야 할 부분입니다.

▲ 목차로 돌아가기

월 36만 원 내고도
72시간 차단당한 사례가 있습니다

공식 한도 문서에는 나오지 않는 이야기가 있습니다. 2026년 2월 12일 — 공교롭게도 Deep Think 업그레이드 당일 — Google AI 개발자 포럼에 Ultra 구독자들의 이상 징후 보고가 쏟아졌습니다. (출처: Google Antigravity 공식 개발자 포럼, discuss.ai.google.dev, 2026.02.12~25)

⚠️ 실제 신고 내용 (포럼 원문 기반)
  • Ultra 구독자가 사전 경고 없이 72시간 모델 접근 차단 발생
  • 2월 25일에는 동일 증상이 168시간(7일) 차단으로 확대된 사례 보고
  • 5시간 초기화 주기만 명시된 공식 문서와 달리, 주간 한도가 별도로 존재하는 것으로 의심
  • UI에는 “최고 요금제 구독 중”으로 표시되는 상태에서 차단 발생

포럼의 한 사용자는 이렇게 적었습니다: “Ultra 요금제를 구매할 때 웹사이트에 주간 한도는 없고 5시간 초기화 주기만 있다고 명시되어 있었습니다. 그런데 실제로는 다릅니다. 가장 비싼 요금제라면 무제한이어야 하거나, 추가 사용량을 구매할 방법이 있어야 합니다.”

이 부분은 구글이 공식 답변을 내놓지 않은 부분입니다. 다만 포럼 경험담을 종합하면, 코딩 에이전트처럼 장시간 집중 사용하는 워크플로에서 우선적으로 제한이 걸리는 패턴이 있다는 것을 알 수 있습니다. 그래서 실제로 제한을 경험한 한 사용자는 “컨텍스트 윈도우 크기를 적정 수준으로 관리하고, 에이전트 작업을 여러 개로 분할하니 8~16시간 집중 사용에서도 제한이 없었다”고 공유했습니다.

▲ 목차로 돌아가기

요금제별 한도 전체 비교 —
실제로 어디서 막히나

아래 표는 구글 공식 지원 문서(2026.03 기준)와 9to5Google의 3월 17일 최신 정리를 교차 확인한 수치입니다. 여기서 핵심은 한도가 2026년 1월 14일에 한 번 크게 개편됐다는 점입니다. 이전까지는 Thinking과 Pro가 하나의 풀(pool)을 공유했지만, 이제 각각 독립적인 한도를 갖습니다.

기능 무료 AI Plus
₩11,000/월
AI Pro
₩29,000/월
AI Ultra
₩249.99$/월
Thinking 모델 기본 액세스 90개/일 300개/일 1,500개/일
Pro 3.1 모델 기본 액세스 30개/일 100개/일 500개/일
Deep Think 3.1 10개/일
컨텍스트 윈도우 32K 토큰 128K 토큰 1M 토큰 1M 토큰
(Deep Think는 192K)
Deep Research 5개/월 12개/일 20개/일 120개/일
Veo 3.1 동영상 2개/일 (Fast) 3개/일 (Fast) 5개/일 (Full)

출처: Google Gemini 앱 한도 공식 문서 (support.google.com/gemini/answer/16275805, 2026.03 기준) / 9to5Google 3월 17일 업데이트

표를 보면 AI Plus와 AI Pro 사이에 가장 큰 단절이 있습니다. Plus는 컨텍스트가 128K인데, Pro는 1M입니다. 긴 문서나 코드를 다루는 작업이라면 Pro 이상이 사실상 필수입니다. 반면 Deep Think는 Ultra에서만 열리는 기능이고, 하루 10개 제한은 변하지 않습니다.

▲ 목차로 돌아가기

Deep Think가 맞는 상황,
아닌 상황

하루 10개라는 제약을 알고 나면 어떤 상황에서 써야 하는지가 더 선명해집니다. 구글 공식 블로그와 포럼 실사용 경험을 교차해보면 다음과 같은 패턴이 나옵니다.

✅ Deep Think를 쓸 때
  • 수학 증명 검증 또는 논문 논리 구조 점검
  • 경쟁 프로그래밍 수준의 알고리즘 설계
  • 물리·화학 분야 실험 설계나 데이터 해석
  • 인간 리뷰가 놓친 오류를 찾아야 할 때
  • 복잡한 엔지니어링 시스템을 코드로 모델링할 때
❌ 다른 모델이 나을 때
  • 텍스트 요약, 이메일 초안 같은 일상 업무
  • 빠른 응답이 필요한 대화형 작업
  • 간단한 코드 스니펫 생성이나 오류 수정
  • 이미지·영상 분석 (이번 업그레이드 범위 외)
  • 30,000줄 이상의 대용량 코드베이스 전체 분석
💡 포럼에 나온 실제 워크플로를 공식 발표 내용과 연결해보면 이런 패턴이 보입니다.

Deep Think의 응답 시간은 수 분입니다. 하루 10개라는 한도보다 실제로는 시간이 더 큰 제약이 될 수 있습니다. 포럼에서 장시간 집중 사용에 성공한 사용자는 “한 번에 큰 질문을 던지는 대신, 에이전트 작업을 잘게 나눠 Thinking 모델로 처리하고 Deep Think는 최고 난이도 판단이 필요한 순간에만 아꼈다”고 설명했습니다. 하루 10개를 소중하게 쓴다는 의식이 필요합니다.

▲ 목차로 돌아가기

자주 나오는 질문 5개

Q1. Deep Think 3.1은 Google AI Pro에서도 쓸 수 있나요?
+
아닙니다. Deep Think 3.1은 Google AI Ultra 전용 기능입니다. Pro 요금제(월 $19.99/약 2만9천 원)에서는 Thinking 모델과 Pro 모델만 사용할 수 있고, Deep Think 항목 자체가 표시되지 않습니다. (출처: Google 공식 한도 문서, 2026.03 기준)
Q2. Deep Think 한도 10개는 하루 기준인가요, 주 기준인가요?
+
공식 문서에는 하루(daily) 최대 10개 프롬프트로 명시되어 있습니다. 단, 72시간~168시간 차단 사례(2026년 2월 포럼)에서 보이듯 별도의 주간 한도가 숨겨져 작동할 가능성이 있습니다. 이 부분은 아직 공식 설명이 나오지 않은 상태입니다.
Q3. Deep Think와 Thinking 모델을 함께 쓰면 한도가 합산되나요?
+
아닙니다. 2026년 1월 14일 개편 이후 두 한도는 완전히 독립적입니다. Thinking 1,500개를 모두 써도 Deep Think 10개는 그대로 남아 있고, 반대도 마찬가지입니다. 이전에는 두 모델이 공유 풀을 나눠 썼기 때문에 혼동이 있었습니다. (출처: 9to5Google, 2026.01.14)
Q4. Deep Think API는 지금 한국에서도 신청할 수 있나요?
+
2026년 2월 12일부터 Gemini API를 통한 Deep Think 얼리 액세스 프로그램이 열렸습니다. 현재는 “선별된 연구자·엔지니어·기업”에 한정된 초청 기반으로 운영됩니다. 구글 공식 신청 폼(forms.gle/eEF5natXTQimPhYH9)에서 관심 등록이 가능하며, API 가격은 아직 공개되지 않은 상태입니다.
Q5. ARC-AGI-2 84.6%가 실제 업무에서 어떤 의미인가요?
+
ARC-AGI-2는 훈련 데이터가 없는 순수 추론 능력을 측정합니다. 이전 버전인 ARC-AGI-1에서 인간 평균이 약 85%였고, AI는 오랫동안 이를 넘지 못했습니다. Deep Think의 84.6%는 아직 인간 수준에 완전히 도달한 건 아니지만, 두 달 만에 45.1%에서 이 수준으로 올라선 속도 자체가 이례적입니다. 실무적으로는 “한 번도 접한 적 없는 유형의 문제”를 풀어야 할 때 기대할 수 있는 범위가 넓어졌다는 뜻입니다.

▲ 목차로 돌아가기

마치며

그런데 쓰기로 결정하기 전에 세 가지를 확인해야 합니다. 첫째, Deep Think는 Ultra 전용입니다. 월 36만 원짜리 요금제가 아니면 버튼 자체가 보이지 않습니다. 둘째, 하루 10개 한도는 Thinking 모델의 1,500개와 독립적으로 작동합니다. 셋째, 컨텍스트 윈도우가 192K로 제한되기 때문에 대용량 코드베이스나 장문 문서를 통째로 넣는 작업에는 Pro 모델이 더 적합할 수 있습니다.

솔직히 말하면, Deep Think는 매일 쓰는 도구가 아닙니다. 하루 10개라는 제약 자체가 “정말 필요한 순간에만 꺼내는 도구”로 설계된 신호로 읽힙니다. 수학 증명, 논문 논리 검증, 까다로운 알고리즘 설계처럼 다른 모델로는 만족스러운 답이 안 나오는 상황에서 그 10개를 어떻게 쓸지 미리 계획해두는 것이 핵심입니다.

본 포스팅 참고 자료

  1. Google Blog — Gemini 3 Deep Think: Advancing science, research and engineering (2026.02.12)
  2. Google 공식 지원 — Gemini 앱 한도 및 업그레이드 (2026.03 기준)
  3. 9to5Google — What Gemini features you get with Google AI Pro/Ultra (2026.03.17 업데이트)
  4. 9to5Google — Google separates, raises Gemini 3 Thinking and Pro usage limits (2026.01.14)
  5. Google Antigravity 개발자 포럼 — Ultra 72시간 쿼터 이슈 스레드 (2026.02.12~25)

본 포스팅은 2026년 3월 22일 기준으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Google AI Ultra 요금제 가격 및 한도는 Google의 정책에 따라 사전 고지 없이 변경될 수 있으므로, 구독 전 공식 페이지에서 최신 정보를 반드시 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기