2026.02.12 업데이트 기준 / Gemini 3 Deep Think

Gemini Deep Think, $249 내야
생기는 것과 안 생기는 것

벤치마크 숫자만 보고 구독하면 막히는 지점이 있습니다.
공식 요금 페이지와 릴리스 문서를 직접 대조해봤습니다.

ARC-AGI-2 84.6%
AI Ultra $249.99/월
API는 얼리 액세스 신청

벤치마크 숫자, 84.6%는 어떤 조건에서 나온 건가

Gemini Deep Think 얘기를 할 때 가장 먼저 나오는 숫자가 ARC-AGI-2 84.6%입니다. 구글이 2026년 2월 12일 공식 블로그에서 직접 발표한 수치입니다. 솔직히 처음 봤을 때 “이게 얼마나 대단한 건가”라는 생각이 먼저 들었습니다.

ARC-AGI-2는 AI 추론 능력의 상한선에 가까운 과제를 모아둔 벤치마크입니다. ARC Prize 재단이 운영하며, 단순 기억 재현으로는 통과하기 어렵게 설계됐습니다. 이전 최고 기록들이 20~30% 대에 머물던 점을 감안하면, 84.6%라는 수치는 확실히 주목할 만한 도약입니다.

그런데 공식 발표문을 자세히 읽으면 한 가지 조건이 따라붙습니다. Humanity’s Last Exam 기준 48.4%는 “도구 없이(without tools)” 달성한 수치입니다. 즉 외부 검색이나 코드 실행 없이 순수 추론만으로 낸 점수라는 뜻입니다. 이 조건을 빼고 단순히 “48.4%”라고만 말하는 글이 많은데, 같은 조건에서 비교하지 않으면 다른 모델과 직접 대조하기 어렵습니다.

💡 공식 발표 수치와 실제 사용 맥락을 같이 놓고 보면 이런 구분이 보입니다: ARC-AGI-2의 84.6%는 “추론 정확도” 기준이고, 실제 업무 코딩 벤치마크(SWE-bench 등)에서는 순위가 달라집니다. 공식 블로그는 과학·수학·공학 분야를 강조하는데, 이는 Deep Think의 설계 의도가 일반 업무보다 전문 연구 쪽에 맞춰져 있음을 보여줍니다. (출처: Google 공식 블로그, 2026.02.12)

▲ 목차로 돌아가기

$249 내면 실제로 뭘 쓸 수 있나 — 공식 요금 페이지 직접 확인

Google AI Ultra 요금은 월 $249.99입니다. 신규 가입 시 첫 3개월은 50% 할인이 적용되어 $124.99입니다. 이 숫자를 원화로 환산하면 정가 기준 약 36만 원입니다. 한 달에 36만 원을 내면 뭐가 달라지는지 구체적으로 확인해봤습니다.

Pro 요금($19.99)과 Ultra 요금($249.99), 실제 차이는 여기입니다

공식 요금 페이지(gemini.google/subscriptions)에서 직접 확인한 핵심 차이는 다음과 같습니다. Pro(월 $19.99)는 Gemini 3.1 Pro 모델에 “높은(higher) 접근”을 제공하고, AI 크레딧이 월 1,000개 입니다. Ultra(월 $249.99)는 “최고(highest) 접근”과 함께 Deep Think 모드, Gemini Agent(미국·영어만 가능), Project Mariner(미국 한정) 접근권이 포함됩니다. AI 크레딧은 월 25,000개로 Pro의 25배입니다. (출처: gemini.google/subscriptions, 2026.03.18 기준)

그런데 여기서 주목할 부분이 있습니다. Deep Think 모드는 Gemini 앱 내에서만 사용 가능합니다. API로 Deep Think를 호출하려면 별도 절차가 필요합니다. 이 부분은 요금 페이지에는 잘 드러나지 않아서, $249 내면 API도 자동으로 열리겠지 하고 생각하면 막히는 지점이 생깁니다.

항목	AI Pro ($19.99/월)	AI Ultra ($249.99/월)
주력 모델	3.1 Pro (높은 접근)	3.1 Pro (최고 접근)
Deep Think	❌	✅ (앱 전용)
AI 크레딧(월)	1,000개	25,000개
Gemini Agent	❌	✅ (미국·영어 한정)
Project Mariner	❌	✅ (미국 한정)
저장 공간	2TB	30TB

(출처: gemini.google/subscriptions, 2026.03.18 직접 확인)

▲ 목차로 돌아가기

API로 쓰려면 여기서 막힙니다

Deep Think를 개발 목적으로 쓰려는 경우라면 이 부분이 핵심입니다. 공식 발표문에는 “연구자·엔지니어·기업을 대상으로 Gemini API를 통해 Deep Think를 제공하며, 얼리 액세스를 통해 신청 가능하다”고 명시되어 있습니다. (출처: blog.google/innovation-and-ai/models-and-research/gemini-3-deep-think, 2026.02.12)

즉, 지금 시점에서 API로 Deep Think를 직접 호출하려면 Google AI Ultra 구독만으로는 부족하고, 별도 얼리 액세스 폼을 제출해서 선택 받아야 합니다. 이 선택 과정이 자동 승인이 아닙니다. Google이 연구·공학 목적에 맞는 사용자를 우선 선발하는 방식으로 운영 중입니다.

⚠️ 주의: $249/월 구독 = API Deep Think 자동 사용 가능 — 이 등호는 성립하지 않습니다. 구독은 Gemini 앱 접근권이고, API는 별도 신청입니다. 개발자 용도로 도입을 검토 중이라면 API 얼리 액세스 승인 여부를 먼저 확인하는 게 맞습니다.

Google Vertex AI 문서에서 확인할 수 있는 Gemini 2.5 Pro 기준 중단일이 2026년 6월 17일로 명시된 점도 같이 참고할 만합니다. AI 모델의 지원 기간은 보통 1년 단위로 관리됩니다. 현재 Deep Think가 Gemini 3 시리즈 위에 얹어진 모드라는 점에서, 모델 버전 업데이트에 따라 접근 방식이 바뀔 가능성이 있습니다. (확인 필요)

▲ 목차로 돌아가기

응답이 수 분 걸리는 건 버그가 아닙니다

Deep Think를 처음 써보면 응답 속도 때문에 당황하는 경우가 꽤 있습니다. 질문을 넣었는데 답이 안 나오고, 화면에 “생각 중…”이 수 분간 유지되는 경험을 한 사용자들 후기가 Reddit에 여럿 올라와 있습니다. 10분을 기다려도 결과가 안 나온다는 사례도 있습니다.

이건 버그가 아닙니다. 공식 발표에서 Gemini 2.5 Deep Think(구버전 기준) 기술 설명에는 “의도적으로 생성 속도를 늦춰 더 광범위하고 깊은 문제 탐색을 허용한다”고 명시되어 있고, “복잡한 태스크에서 수 분이 소요될 수 있다”고 직접 언급합니다. (출처: blog.getbind.co, Gemini 2.5 Deep Think 분석 기준, 2025.08.02)

이 지연 시간이 의미하는 것

응답 지연은 Deep Think의 “헤드리스 추론 사이클” 구조에서 나옵니다. 문제를 하위 단계로 분해하고 여러 가설을 병렬로 탐색한 뒤 자가 검증까지 거칩니다. 수학 올림피아드 금메달 수준의 추론을 구현하려면 컴퓨팅 시간이 실제로 많이 필요합니다. 국제 수학 올림피아드 문제 풀이에는 “수 시간의 추론 시간”이 사용됐다는 점도 공식 자료에 기재되어 있습니다.

결론적으로, Deep Think는 빠른 답변이 필요한 일상 업무보다 “오래 생각해도 되는 대신 정확도가 중요한” 연구·설계 작업에 맞게 설계되어 있습니다. 빠른 응답이 필요한 경우라면 Gemini 3.1 Flash나 일반 3.1 Pro 모드가 더 적합합니다.

▲ 목차로 돌아가기

공식 발표문과 실제 사용 흐름을 같이 놓고 보니

구글이 강조하는 Gemini 3 Deep Think의 벤치마크 수치들은 공식 블로그 기준으로 보면 2026년 2월 12일 발표 당시의 수치입니다. 그런데 같은 날 발표된 건 아니지만, 2026년 2월 19일에 나온 Gemini 3.1 Pro(일반 버전) 역시 ARC-AGI-2에서 84.6%를 기록했다는 점이 눈에 띕니다. (출처: Reddit r/aicuriosity, 2026.02.19 기준 보도)

💡 공식 발표 타임라인과 벤치마크 업데이트를 함께 보면 이런 그림이 나옵니다: Deep Think 전용 기능으로 출발했던 최고 추론 성능이 일반 버전인 Gemini 3.1 Pro에도 탑재됐습니다. 즉 ARC-AGI-2 84.6%라는 수치는 더 이상 Deep Think만의 독점 지표가 아닙니다. 이 변화가 $249짜리 Ultra 구독의 실질 가치를 어디에 두어야 하는지를 다시 생각하게 합니다.

그렇다면 Deep Think가 3.1 Pro 일반 버전과 실제로 다른 점은 뭘까요. 현재 확인 가능한 공식 자료 기준으로는, Deep Think는 과학 논문의 논리적 오류를 발견하거나 반도체 결정 성장 레시피를 설계하는 등 전문가 검증이 필요한 영역에서 사용되는 최상위 추론 모드입니다. 일반 업무의 코딩 지원이나 요약 작업에서 3.1 Pro 일반 버전과 체감 차이가 어느 정도인지에 대한 객관적 측정 데이터는 아직 공개되지 않았습니다. (확인 필요)

▲ 목차로 돌아가기

경쟁 모델과 비교하면 어느 상황에서 유리한가

같은 가격대 경쟁 상황을 보면, OpenAI의 ChatGPT Pro도 월 $200이고, Anthropic의 Claude 구독형 최상위 요금제도 유사한 가격대에 위치합니다. $249짜리 AI Ultra가 어느 지점에서 우위를 갖는지 정리하면 세 가지로 압축됩니다.

첫째, 구독 하나로 구글 생태계(Gmail, Docs, Drive, NotebookLM, YouTube Premium) 전체에 AI 기능이 연동된다는 점입니다. 이것만으로도 실제 사용 편의성이 크게 달라집니다. 둘째, ARC-AGI-2 기준 추론 점수에서 Deep Think는 현재까지 공개된 모델 중 최고 수준입니다. 셋째, 30TB 저장공간은 구글 원 단독 상품으로 구매 시에도 상당한 금액이 드는데, 이게 번들로 포함됩니다.

반면 이 경우라면 적합하지 않습니다

코딩 전문 작업 측면에서는 Claude 4 Opus가 SWE-bench 72.5%로 현 시점 코딩 특화 벤치마크 1위입니다. Deep Think의 Codeforces Elo 3455는 경쟁 프로그래밍 기준 최고 수준이지만, 실제 소프트웨어 엔지니어링 태스크에서는 Claude 쪽이 더 높은 일관성을 보인다는 비교 자료가 있습니다. (출처: blog.getbind.co, 2025.08 기준 Gemini 2.5 Deep Think vs Claude 4 Opus 비교)

또한 Gemini Agent와 Project Mariner는 현재 미국·영어 전용이라 한국 사용자는 이 두 기능을 $249를 내도 사용할 수 없습니다. 이 부분은 공식 요금 페이지 각주에 명시되어 있습니다. Deep Think 자체는 한국에서도 Gemini 앱을 통해 사용 가능하지만, 에이전트 기능 두 개는 실질적으로 잠겨 있는 상태입니다. (출처: gemini.google/subscriptions 각주 11, 12, 2026.03.18 기준)

▲ 목차로 돌아가기

Q&A

Q1. Gemini Deep Think와 일반 Gemini 3.1 Pro는 어떻게 다른가요?

Deep Think는 Gemini 3 시리즈의 최상위 추론 모드입니다. 일반 3.1 Pro보다 더 긴 추론 사이클을 돌려 복잡한 과학·수학·공학 문제에서 높은 정확도를 냅니다. 단, 응답 시간이 수 분까지 걸릴 수 있어 빠른 응답이 필요한 일반 업무에는 오히려 3.1 Pro 일반 모드가 더 적합합니다.

Q2. Google AI Pro($19.99)와 AI Ultra($249.99) 중 어떤 걸 선택해야 하나요?

Deep Think가 꼭 필요한 연구자나 전문 엔지니어, 또는 구글 생태계 전체(YouTube Premium·30TB 스토리지 포함)를 묶어서 쓰는 경우라면 Ultra가 유리합니다. 일반적인 업무 보조, 문서 작성, 코딩 지원 수준이라면 Pro로 충분합니다. 한국 사용자의 경우 에이전트 기능 두 개는 사용 불가 상태임을 감안하면 Ultra 가성비는 더 낮아집니다.

Q3. ARC-AGI-2 84.6%라는 수치는 어떻게 해석하면 되나요?

ARC-AGI-2는 AI 추론 능력의 상한선을 테스트하는 벤치마크로, 이전 모델들이 20~30%대에 머물렀습니다. 84.6%는 확실한 도약이지만, 이 수치는 일반 업무 코딩 성능이나 사용자 경험 속도와는 별개 지표입니다. 실제 소프트웨어 엔지니어링 태스크에서는 Claude 4 Opus(SWE-bench 72.5%)가 더 높은 평가를 받고 있습니다.

Q4. Deep Think를 API로 쓰려면 어떻게 해야 하나요?

AI Ultra 구독만으로는 API에서 Deep Think를 자동으로 사용할 수 없습니다. Google이 제공하는 얼리 액세스 신청 폼(forms.gle/eEF5natXTQimPhYH9)에 연구·엔지니어링 목적을 기재해 신청한 뒤 선발되어야 합니다. 자동 승인이 아닌 심사 과정입니다.

Q5. 한국에서 Gemini Deep Think를 사용할 수 있나요?

Deep Think 모드 자체는 AI Ultra 구독 후 Gemini 앱에서 한국에서도 사용 가능합니다. 단, Gemini Agent와 Project Mariner는 현재 미국·영어 전용으로 한국에서는 사용할 수 없습니다. 구독 요금 $249.99는 동일하게 적용됩니다.

▲ 목차로 돌아가기

마치며

Gemini Deep Think는 분명히 인상적입니다. ARC-AGI-2 84.6%, 국제 수학 올림피아드 금메달 수준, Codeforces Elo 3455 — 숫자만 보면 구독하지 않을 이유가 없어 보입니다.

막상 정리해보면 이런 그림입니다. Deep Think는 Gemini 앱에서만 쓸 수 있고, API는 얼리 액세스 신청 후 심사 통과 필요입니다. 응답은 의도적으로 느린 구조이고, 한국 사용자는 에이전트 기능 두 개를 쓸 수 없습니다. 그리고 ARC-AGI-2 84.6%는 Deep Think 이후 나온 Gemini 3.1 Pro 일반 버전에서도 같은 수치를 기록합니다.

이 모든 조건을 알고 나서도 $249가 합리적으로 느껴진다면 — 전문 연구자, 복잡한 과학·공학 설계가 필요한 엔지니어, 또는 구글 생태계를 전방위로 활용하는 경우라면 — 충분히 가치 있는 선택일 수 있습니다. 단, “AI 벤치마크 1위 모델 쓰고 싶다”는 이유만으로 결제하면 기대와 다른 경험을 할 가능성이 있습니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

※ 본 포스팅은 2026년 3월 18일 기준 공개된 공식 자료를 바탕으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 요금 및 기능 세부 사항은 Google 공식 사이트에서 최신 정보를 확인하시기 바랍니다.

Gemini Deep Think, $249 내야
생기는 것과 안 생기는 것

댓글 남기기응답 취소

최신 글

카테고리

Tags

Gemini Deep Think, $249 내야 생기는 것과 안 생기는 것

Gemini Deep Think, $249 내야생기는 것과 안 생기는 것

벤치마크 숫자, 84.6%는 어떤 조건에서 나온 건가

$249 내면 실제로 뭘 쓸 수 있나 — 공식 요금 페이지 직접 확인

Pro 요금($19.99)과 Ultra 요금($249.99), 실제 차이는 여기입니다

API로 쓰려면 여기서 막힙니다

응답이 수 분 걸리는 건 버그가 아닙니다

이 지연 시간이 의미하는 것

공식 발표문과 실제 사용 흐름을 같이 놓고 보니

경쟁 모델과 비교하면 어느 상황에서 유리한가

반면 이 경우라면 적합하지 않습니다

Q&A

마치며

본 포스팅 참고 자료

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기

Gemini Deep Think, $249 내야
생기는 것과 안 생기는 것