Gemini 3 Deep Think, Ultra 구독자도 하루 10번이 한계입니다

Published on

in

Gemini 3 Deep Think, Ultra 구독자도 하루 10번이 한계입니다

2026.02.12 업데이트 기준
Gemini 3 Deep Think
Google AI Ultra 전용

Gemini 3 Deep Think, Ultra 구독자도 하루 10번이 한계입니다

ARC-AGI-2 84.6%를 찍은 구글의 최강 추론 모드, 막상 쓰려고 보면 조건이 생각보다 빡빡합니다. Ultra 전용인 데다 하루 10회, 컨텍스트 192,000 토큰 제한까지 — 공식 지원 문서에서 직접 확인한 내용입니다.

84.6%
ARC-AGI-2 점수
10회
Ultra 하루 한도
₩360,000
Ultra 월 정가

Deep Think 2월 업그레이드, 뭐가 달라졌나

구글은 2026년 2월 12일, Gemini 3 Deep Think의 대규모 업그레이드를 공식 발표했습니다. 2025년 11월 처음 공개된 이후 약 3개월 만의 변화입니다. 이번 업그레이드의 핵심은 “추상적 이론 단계를 넘어 실질적인 연구·공학 현장 문제를 다룰 수 있도록 했다”는 것입니다. (출처: 구글 공식 블로그, 2026.02.12)

구글이 직접 공개한 사례를 보면, 럿거스 대학의 수학자 리사 카본(Lisa Carbone)이 고에너지 물리학 논문을 검토하는 데 활용했을 때 동료 심사(Peer Review)에서도 발견되지 못한 논리적 오류를 찾아냈다고 합니다. 듀크 대학 왕 연구실(Wang Lab)에서는 반도체 신소재 후보 탐색을 위한 결정 성장 공정 최적화에 활용해 100μm 이상 박막 성장 레시피를 설계하는 데 성공했고요.

이번 업그레이드에서 구글이 특히 강조하는 건 ‘수학적·알고리즘적 엄밀함’입니다. 단순히 답을 내는 게 아니라 추론 과정 자체가 얼마나 정확한지를 높였다는 설명인데, 실제로 국제수학올림피아드(IMO) 2025에서 6문제 중 5문제를 맞혀 금메달 수준인 35점을 기록했습니다. (출처: Google DeepMind 공식 블로그, 2025.07.21) 이건 단순한 마케팅 수치가 아니라 IMO 조직위원회가 학생 기준과 동일하게 직접 채점·인증한 결과입니다.

▲ 목차로 돌아가기

벤치마크 수치, 숫자 그대로 믿으면 안 되는 이유

💡 공식 발표 수치와 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다.

ARC-AGI-2 84.6%라는 수치는 맞습니다. ARC Prize 재단이 직접 검증한 숫자입니다. (출처: Google 공식 블로그, 2026.02.12) ‘Humanity’s Last Exam’이라는 벤치마크에선 도구 사용 없이 48.4%를 기록했고, LiveCodeBench(코딩 경진대회 수준 벤치마크)에선 95.4%를 찍었습니다. 숫자만 보면 충격적입니다.

그런데 ARC-AGI-2는 구체적으로 어떤 테스트냐 하면, 프랑수아 숄레(François Chollet)가 설계한 추상·패턴 추론 과제들로 구성됩니다. AI가 훈련 데이터에서 본 것을 반복하는 게 아니라 새로운 규칙을 스스로 파악해야 하는 문제들입니다. 이 점수가 높다는 건 “모델이 외운 것만 뽑아내는 게 아니라 실제로 추론하고 있다”는 뜻에 가깝습니다. 그냥 시험 점수가 아닙니다.

벤치마크 점수 의미
ARC-AGI-2 84.6% ARC Prize 재단 검증, 추상 추론 능력
Humanity’s Last Exam 48.4% 도구 없이, 프런티어 모델 한계 테스트
LiveCodeBench 95.4% 경쟁 프로그래밍 수준 코딩
IMO 2025 금메달(35점) IMO 조직위 직접 채점 인증

다만 Reddit r/Bard 커뮤니티를 보면, 실제 일상 업무에서는 응답 불일치 문제가 꾸준히 제기됩니다. 구글 개발자 포럼에서도 “Gemini 2.5 대비 성능이 떨어지는 경우가 있다”는 리뷰가 2026년 1월에 공유됐습니다. 벤치마크와 실사용 간의 간극은 아직 존재합니다.

▲ 목차로 돌아가기

Pro 요금제 쓰고 있다면 Deep Think는 아예 없습니다

💡 한도 차이인 줄 알았는데 기능 자체가 없는 겁니다 — 공식 지원 문서에서 직접 확인했습니다.

이 부분이 생각보다 많은 분들이 놓치는 지점입니다. Google AI Pro(월 29,000원)와 Ultra(월 360,000원)의 차이를 “Deep Think를 더 많이 쓸 수 있냐, 더 적게 쓸 수 있냐”의 문제로 생각하기 쉬운데, 실제로는 그게 아닙니다.

구글 공식 지원 페이지(Gemini 앱 한도 및 업그레이드)를 보면 Deep Think 3.1 항목에서 Plus와 Pro는 ‘-‘(대시)로 표기됩니다. 즉, 아예 없습니다. Ultra 구독자에게만 “하루 최대 10개 프롬프트(192,000 토큰 컨텍스트 윈도우)”라고 명시됩니다. (출처: Google 지원 공식 문서, 2026.02 기준) Pro를 쓴다고 해서 Deep Think 횟수가 줄어드는 게 아니라, 버튼 자체가 없는 겁니다.

⚠️ 요금제별 Deep Think 3.1 접근 가능 여부

  • 무료 (Gemini 기본): ❌ 없음
  • Google AI Plus (월 11,000원): ❌ 없음
  • Google AI Pro (월 29,000원): ❌ 없음
  • Google AI Ultra (월 360,000원): ✅ 하루 10회 한도

Pro에서 Ultra로 올라갈 때 가격 차이가 331,000원입니다. 한 달 기준으로 이 금액을 내고 받는 가장 핵심적인 추가 기능이 Deep Think 하루 10회입니다. 이 숫자를 알고 결정하는 것과 모르고 결정하는 건 다릅니다.

▲ 목차로 돌아가기

Ultra 써도 하루 10회, 192K 토큰이 현실 한도

Ultra를 쓰더라도 Deep Think는 하루 10회가 상한선입니다. 이건 Reddit r/Bard에서도 실사용자들이 확인해준 내용이고, 구글 공식 지원 문서에 그대로 적혀 있습니다. (출처: Google 지원 공식 문서, Gemini 앱 한도 기준) 10회라는 숫자가 많아 보일 수 있는데, 실제 추론 작업에서는 1회에 여러 단계의 맥락을 넣어야 하기 때문에 생각보다 빨리 소진됩니다.

두 번째 제약은 컨텍스트 윈도우입니다. Deep Think 3.1의 컨텍스트는 192,000 토큰입니다. 일반 Gemini 3 Pro(Ultra 기준)가 100만 토큰 컨텍스트를 지원하는 것과 비교하면 약 5분의 1 수준입니다. (출처: Google One 공식 요금제 페이지) 192,000 토큰은 대략 300~400페이지 분량의 텍스트를 한 번에 처리할 수 있는 양입니다. 긴 논문 전체나 대형 코드베이스를 한 번에 넣기엔 빠듯합니다.

이 두 제약을 같이 보면 이런 그림이 나옵니다. 매우 어려운 문제를 하루 10번 이상 반복해서 검토하거나, 수십만 줄 규모의 코드베이스 전체를 한 컨텍스트에 올려놓고 Deep Think를 돌리려는 상황이라면 한계에 부딪힙니다. “가장 어려운 문제를 풀 수 있다”는 설명과 “하루 10번만 쓸 수 있다”는 조건은 사실 모순처럼 보이지만, 구글 입장에서는 서버 비용 구조상 불가피한 선택입니다.

▲ 목차로 돌아가기

실제로 어떤 상황에서 쓸 수 있을까

💡 제약 조건을 먼저 파악하고 나니 실제로 효과적인 사용 패턴이 보입니다.

솔직히 말하면, Deep Think는 매일 여러 번 쓰는 도구가 아닙니다. 하루 10회라는 한도는 “빠른 답변이 필요한 일상 작업”용이 아니라, “하루에 몇 개만 처리하더라도 깊은 추론이 필요한 작업”에 맞게 설계된 것입니다. 구글이 공개한 초기 테스터 사례들 — 논문 논리 검증, 반도체 공정 최적화, 물리 부품 설계 — 이 모두 “하루에 10번 이상 반복할 작업”이 아닌 고밀도 단발성 작업들이라는 점이 이 설계 의도를 보여줍니다.

하루 10회를 가장 효율적으로 쓰는 상황을 정리하면 이렇습니다. 첫째, 중요한 결정 전 논리적 허점 점검 — 계약서, 연구 가설, 사업 계획서에서 스스로 발견하지 못한 논리 오류를 잡아내는 용도입니다. 둘째, 복잡한 알고리즘이나 수학적 증명 검토입니다. 셋째, 스케치나 설계도를 3D 프린팅 파일로 전환하는 것처럼 다단계 추론이 필요한 공학 작업입니다.

반면 블로그 초안 작성, 이메일 답변, 간단한 요약 등 일상적인 작업엔 Deep Think를 쓸 필요가 없습니다. 이런 작업에 Deep Think를 쓰면 10회를 순식간에 날리고 정작 필요한 순간에 모자랍니다. 일반 Gemini 3 Pro(Ultra 기준 하루 500회)를 쓰는 게 맞습니다.

▲ 목차로 돌아가기

API 얼리 액세스, 신청해야 할 사람 따로 있습니다

2026년 2월 12일부터 구글은 처음으로 Gemini API를 통한 Deep Think 접근 신청을 받고 있습니다. 기존에는 Gemini 앱(Ultra 구독자 전용)에서만 쓸 수 있었는데, 이번에 API 얼리 액세스 프로그램이 열린 겁니다. 공식 Google 폼에서 신청할 수 있습니다. (출처: 구글 공식 블로그 2026.02.12, 얼리 액세스 신청 폼 링크 포함)

API 접근이 열렸다는 건 기업이나 연구팀이 자체 서비스·워크플로우에 Deep Think를 직접 통합할 수 있다는 뜻입니다. Gemini 앱의 하루 10회 한도는 앱 사용자 기준이고, API 쪽의 한도 구조는 아직 공개되지 않았습니다. 구글이 공식 답변을 내놓지 않은 부분입니다. 다만 얼리 액세스 신청 후 선정된 연구자·엔지니어·기업에 한해 먼저 테스트 기회를 주는 구조입니다.

신청이 의미 있는 대상은 구체적입니다. 과학 논문 검토 자동화, 반도체·소재 연구 워크플로우 통합, 복잡한 수학적 검증 파이프라인 구축 등입니다. 단순히 “API 쓰면 더 편하겠다” 수준의 목적으로 신청하면 선정 가능성이 낮습니다. 구글이 초기 테스터로 공개한 사례가 전부 전문 연구 기관이라는 점이 이 얼리 액세스의 타깃을 보여줍니다.

▲ 목차로 돌아가기

Q&A

Q1. Gemini 3 Deep Think는 일반 Gemini 3 Pro와 어떻게 다른가요?
Deep Think는 일반 Pro와 별도의 ‘전문 추론 모드’입니다. 답변을 생성하기 전에 병렬 사고(parallel thinking) 방식으로 여러 가능성을 동시에 탐색한 후 최종 답변을 냅니다. 일반 Pro는 단일 추론 흐름을 따르는 반면, Deep Think는 여러 경로를 동시에 검토하는 구조입니다. 이 때문에 응답 시간이 더 길고, 하루 한도도 훨씬 적게 설정됩니다.
Q2. Google AI Pro(월 29,000원)로 Deep Think를 쓰는 방법은 없나요?
현재 공식적으로는 없습니다. 구글 공식 지원 문서에서 Pro 및 Plus 요금제는 Deep Think 3.1 항목이 ‘-‘(없음)으로 표기됩니다. Ultra 구독자 전용입니다. API 얼리 액세스를 통해 기업·연구자 단위로 접근하는 방법이 있지만, 이 또한 신청 후 선정 결과를 기다려야 합니다.
Q3. 하루 10회 한도를 넘기면 어떻게 되나요?
Deep Think를 더 이상 쓸 수 없게 되고, 일반 Gemini 3 Pro 모드로 자동 전환됩니다. 한도는 매일 초기화됩니다. 단, 구글 공식 문서에 따르면 한도는 “사전 고지 없이 변경될 수 있다”고 명시됩니다. 즉, 지금 10회가 기준이지만 이 숫자는 바뀔 수 있습니다.
Q4. 192,000 토큰이면 실제로 어느 정도 분량인가요?
한국어 기준으로 대략 25~40만 자 분량입니다. A4 용지 300~400페이지 정도에 해당합니다. 논문 한 편이나 중간 규모의 소설 한 권은 들어가지만, 대형 코드베이스(10만 줄 이상) 전체를 한 번에 넣기는 빠듯합니다. 참고로 일반 Gemini 3 Pro(Ultra 기준)의 컨텍스트는 100만 토큰으로, Deep Think의 약 5배입니다.
Q5. Ultra 첫 3개월 할인이 끝나면 가격이 어떻게 되나요?
한국 정가는 월 360,000원입니다. 첫 3개월은 50% 할인이 적용되어 월 180,000원입니다. 할인 기간이 끝나면 자동으로 월 360,000원이 청구됩니다. (출처: Google One 공식 요금제 페이지, 2026.03 기준) 해지를 원하면 할인 종료 전에 직접 취소해야 합니다.

▲ 목차로 돌아가기

마치며

Gemini 3 Deep Think는 분명히 인상적입니다. IMO 금메달, ARC-AGI-2 84.6% — 이건 과장이 아니라 공인된 숫자입니다. 하지만 월 360,000원짜리 Ultra 구독자도 하루 10번이라는 한도 안에서 사용해야 하고, 컨텍스트도 일반 Pro의 5분의 1 수준입니다. 가장 강력한 추론을 가장 까다로운 조건 아래 써야 하는 구조입니다.

제 생각엔 Deep Think는 현재로선 “가끔 필요한 전문 도구” 수준에 가깝습니다. 일상 업무를 위한 AI 구독이 목적이라면 Pro(월 29,000원)로 충분하고, Ultra까지 올릴 이유는 Deep Think를 포함한 여러 기능이 정말 필요한지 먼저 따져봐야 합니다. 가격 차이가 331,000원이니까요.

API 얼리 액세스가 열린 건 긍정적입니다. 연구·공학 팀 단위에서 직접 통합할 수 있는 길이 생겼고, 앞으로 한도나 가격 구조가 어떻게 바뀔지가 이 기능의 실제 가치를 결정할 겁니다.

▲ 목차로 돌아가기

📚 본 포스팅 참고 자료

  1. 구글 공식 블로그 (한국어) — 제미나이 3 딥 씽크 2월 업그레이드 발표
  2. 구글 공식 블로그 (영문) — Gemini 3 Deep Think major upgrade
  3. Google 지원 공식 문서 — Gemini 앱 한도 및 업그레이드 (요금제별 Deep Think 한도)
  4. Google One 공식 요금제 페이지 — 한국어 가격 및 기능 비교
  5. Google DeepMind 공식 블로그 — IMO 2025 금메달 달성 발표

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 요금·한도는 Google 공식 지원 페이지에서 최신 정보를 확인하세요. 본 포스팅은 2026.03.26 기준으로 작성됐으며, Deep Think 3.1 (2026.02.12 업데이트) 기준입니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기