Gemini 3 Pro 정식 전환, 안 바꾸면 끊깁니다

Published on

in

Gemini 3 Pro 정식 전환, 안 바꾸면 끊깁니다

📅 2026.03.26 기준 / Gemini 3 Pro GA 버전 기준
Google DeepMind 공식 발표

Gemini 3 Pro 정식 전환,
안 바꾸면 끊깁니다

2026년 3월 26일, 구글이 Gemini 3 Pro를 Preview에서 공식 GA(정식 안정 버전)로 전환했습니다.
겉보기엔 단순한 이름 정리처럼 보이지만, 모델 ID가 바뀌고 파라미터 구조가 달라졌습니다.
API를 쓰고 있다면 바로 오늘 확인해야 합니다.

LMArena 점수
1,501
기존 1위였던 Gemini 2.5 Pro 제침
HLE 점수 (툴 미사용)
37.5%
Humanity’s Last Exam 최고점
컨텍스트 윈도우
1M
토큰 (최대 입력 1,048,576)

Preview가 사라진 날 — 3월 26일에 정확히 무슨 일이 있었나

2026년 3월 26일, 구글 Vertex AI 공식 문서에 한 줄이 추가됐습니다.
“As of March 26, 2026, gemini-3-pro-preview is discontinued.”
프리뷰 딱지가 붙어 있던 gemini-3-pro-preview가 공식 종료되고,
정식 GA 모델 체계로 전환됐습니다.
(출처: Google Vertex AI 공식 모델 문서, 2026.03.26)

사실 이번 전환은 갑자기 생긴 일이 아닙니다. 구글은 3월 9일에 먼저
Vertex AI 쪽은 3월 26일을 마지막 날로 잡았습니다.
두 곳을 각각 다른 시점에 순차적으로 마감한 셈입니다.
(출처: Google AI for Developers 공식 FAQ, 2026.02.26)

같은 날, 구글은 ‘3월 Gemini Drop’을 통해
Personal Intelligence를 미국 전체 무료 이용자에게 개방했고,
메모리와 채팅 기록을 다른 AI 앱에서 Gemini로 옮겨오는 전환 도구도 공개했습니다.
모델 전환과 앱 기능 확장이 같은 날 이뤄진 것입니다.
(출처: Gemini Release Notes 공식 페이지, 2026.03.26)

모델 ID가 바뀌었다는 건 코드도 바꿔야 한다는 뜻입니다

Preview 단계에서는 gemini-3-pro-preview라는 이름을 썼고,
이걸 코드에 그대로 박아뒀다면 3월 9일(API/AI Studio) 또는 3월 26일(Vertex AI)부터
서비스가 끊겼습니다. 모든 요청이 에러를 반환하게 됩니다.

⚠️ 지금 당장 확인해야 할 것

프로젝트 코드에서 gemini-3-pro-preview 또는
gemini-3.0-pro-preview 문자열을 검색하세요.
있다면 GA 안정 버전 또는 현재 추천 모델인 Gemini 3.1 Pro로 교체해야 합니다.

GA 전환 이후 Vertex AI 기준 정식 모델 ID는 gemini-3-pro입니다.
출시일은 2025년 11월 18일이고, 종료 예정일은 공식 발표되지 않았습니다.
한편 구글 AI API(ai.google.dev) 기준 현재 권장 경로는 gemini-3.1-pro-preview입니다.
두 채널의 권장 모델이 다르다는 점도 확인이 필요합니다.

채널 Preview 종료일 현재 권장 모델 ID 비고
Gemini API / AI Studio 2026.03.09 gemini-3.1-pro-preview 구글 AI for Developers 기준
Vertex AI 2026.03.26 gemini-3-pro Google Cloud Vertex AI 기준

출처: Google AI for Developers 공식 모델 페이지, Vertex AI 공식 모델 문서 (2026.03.26 기준)

Gemini 3 Pro가 잘 못하는 것, 공식 문서에 직접 나와 있습니다

“최고 성능 모델이 모든 걸 다 잘한다”는 건 Gemini 3 Pro에선 사실이 아닙니다.
Vertex AI 공식 문서는 품질 변경 사항 섹션에서 이렇게 명시하고 있습니다.

💡 공식 발표문과 실제 기능 범위를 같이 놓고 보니 이런 차이가 보였습니다

“Gemini 3 Pro models aren’t designed around prioritizing supporting audio understanding or image segmentation use cases.”
(Gemini 3 Pro는 오디오 이해 및 이미지 분할 사용 사례를 우선 지원하도록 설계되지 않았습니다.)

추가로: “For information-dense or complicated graphs, tables, or charts, the model can sometimes incorrectly extract information or misinterpret the provided resources.”
(정보 밀도가 높은 그래프, 표, 차트에서 간혹 정보를 잘못 추출하거나 잘못 해석할 수 있습니다.)

출처: Google Vertex AI 공식 Gemini 3 Pro 모델 문서, 2026.03.26

여기서 놓치면 안 되는 포인트가 있습니다. Gemini 3는 출시 때부터 멀티모달 추론의 최전선이라고 소개됐는데,
막상 공식 문서에는 오디오 이해와 이미지 분할은 다른 전용 모델을 쓰라고 적혀 있습니다.
성능이 뛰어난 게 맞지만, 모든 멀티모달 작업이 다 통하는 건 아닙니다.

오디오 관련 작업이라면 Google AI for Developers 모델 페이지 기준으로
gemini-3.1-flash-live-preview(실시간 오디오-투-오디오 전용)나
gemini-2.5-pro-preview-tts(고품질 음성 합성 전용)가 따로 마련돼 있습니다.

Flash가 코딩 에이전트에서 Pro보다 앞선다는 수치가 나왔습니다

코딩 에이전트 성능을 재보니 순서가 뒤집혔습니다.
구글 공식 발표 기준으로, SWE-bench Verified에서
Gemini 3 Flash가 78%를 기록한 반면
Gemini 3 Pro는 76.2%였습니다.
플래그십 모델보다 경량 모델이 코딩 에이전트 평가에서 더 높은 점수를 낸 것입니다.
(출처: Google Blog KR — Gemini 3 Flash 공식 출시 포스팅, 2025.12.18)

💡 수치를 나란히 놓고 보면 이런 사용 패턴이 보입니다

벤치마크 Gemini 3 Pro Gemini 3 Flash 비고
SWE-bench Verified (코딩 에이전트) 76.2% 78% Flash가 더 높음
GPQA Diamond (박사급 추론) 91.9% 90.4% Pro가 더 높음
HLE 점수 (툴 미사용) 37.5% 33.7% Pro가 더 높음
MMMU-Pro (멀티모달 추론) 81% 81.2% Flash가 근소하게 더 높음
추론 속도 기준 약 3배 빠름 Artificial Analysis 기준

정리하면 이렇습니다. 코드를 반복적으로 생성하고 검증하는 에이전트 워크플로우에는 Flash가 오히려 유리합니다.
Pro를 선택해야 하는 명확한 이유는 복잡한 수학, 과학, 멀티스텝 추론, 대형 문서 분석처럼
더 깊은 사고가 필요할 때입니다. 코딩 자동화에 Pro를 기본으로 쓰고 있었다면, 한 번쯤 Flash로 A/B 테스트를 해볼 만합니다.
속도가 3배 빠르고 비용도 더 낮으면서 코딩 벤치마크 결과는 Pro보다 높게 나옵니다.

thinking_level — budget을 버리고 새로운 파라미터가 왔습니다

Vertex AI 공식 문서에 따르면, Gemini 3 모델부터는 thinking_level이라는 새로운 파라미터를 씁니다.
(출처: Google Vertex AI 공식 Gemini 3 Pro 모델 문서, 2026.03.26)

💡 파라미터 방식이 바뀐 맥락을 짚어보면 이런 의도가 보입니다

기존 thinking_budget은 사용할 추론 토큰 수를 직접 숫자로 지정하는 방식이었습니다.
새로운 thinking_levellow 또는 high라는 레벨 값으로 추론 깊이를 제어합니다.
토큰 수를 직접 계산할 필요 없이, 응답 품질과 비용·속도를 레벨 단위로 균형을 맞출 수 있도록 설계를 바꾼 것입니다.

이와 함께 media_resolution 파라미터도 새로 생겼습니다.
low / medium / high 중 하나를 골라서 이미지·비디오 처리 해상도를 조절할 수 있고,
이 선택이 토큰 사용량과 처리 속도에 직접 영향을 줍니다.

thinking_budget 파라미터가 무시되거나 에러를 일으킬 수 있습니다.
마이그레이션 시 파라미터 목록을 반드시 새로 검토해야 합니다.

Deep Think, 오늘부터 유료 구독자에게 풀렸습니다

3월 28~29일을 기준으로, Gemini 3 Deep Think 모드가 Google AI Ultra 구독자를 넘어
유료 구독자 전반에 순차적으로 개방됐습니다.
Mashable 보도 기준으로 “월 $250 유료 플랜 구독자 누구나 지금 Gemini 앱에서 Deep Think를 쓸 수 있다”고 전했습니다.
(출처: Mashable, “Gemini 3 Deep Think rolls out to paid subscribers”, 2026.03.28)

Deep Think 모드의 성능 수치는 Gemini 3 Pro 자체보다 한 단계 더 높습니다.
GPQA Diamond 기준으로 Pro가 91.9%였다면, Deep Think는 93.8%입니다.
HLE(툴 미사용) 기준으로는 Pro가 37.5%인 반면, Deep Think는 41.0%를 기록했습니다.
(출처: Google Blog KR — Gemini 3 출시 공식 포스팅, 2025.11.19)

ARC-AGI-2 벤치마크(코드 실행 포함, ARC Prize 인증)에서는 45.1%라는 수치를 기록했는데,
이 시험은 새로운 유형의 문제 해결 능력을 평가하는 평가 기준으로, 이전에 어떤 모델도 이 수준에 가까이 온 적이 없었습니다.
Pro만으로도 강력하지만, 정말 복잡한 과학이나 수학 문제라면 Deep Think를 써보는 게 맞습니다.

다만 Deep Think는 “일반 요청”에 쓰기엔 오버스펙입니다.
공식 설명대로 응답 준비에 몇 분이 걸리고, 일상적인 질문에는 구조적으로 과잉 처리가 됩니다.

Q&A — 자주 나오는 질문 5가지

Q1. Gemini 3 Pro는 무료로 쓸 수 있나요?
Gemini 앱에서는 무료 이용자에게도 Gemini 3 Pro 접근이 열려 있습니다.
다만 하루 사용량 한도가 있고, 더 많이 쓰려면 Google AI Pro($19.99/월) 이상 구독이 필요합니다.
API 개발자 관점에서는 Google AI Studio에서 무료 API 키로 제한된 범위 내 테스트가 가능하지만,
프로덕션 수준의 처리량을 위해서는 유료 계획이 필요합니다.
Q2. Gemini 3 Pro와 Gemini 3.1 Pro 중 뭘 써야 하나요?
현재 구글 AI API 기준 권장 경로는 3.1 Pro입니다.
Vertex AI에서는 GA 안정화된 3 Pro도 계속 사용 가능하지만,
신규 프로젝트라면 3.1 Pro 기준으로 시작하는 게 낫습니다.
Q3. thinking_budget 파라미터가 이제 안 되나요?
low 또는 high 값을 사용하면 됩니다. 기존 Gemini 2.5 기반 코드를 그대로 가져오면 해당 파라미터가 무시되거나
오류를 일으킬 수 있으니 반드시 확인해야 합니다.
이유는 아직 공식적으로 별도 발표되지 않았지만, 숫자 기반 제어에서 레벨 기반 제어로의 추상화 방향으로 볼 수 있습니다.
Q4. Gemini 3 Pro의 지식 컷오프 날짜는 언제인가요?
Vertex AI 공식 문서에 따르면 Gemini 3 Pro의 지식 컷오프 날짜는 2025년 1월입니다.
2025년 1월 이후 발생한 사건이나 정보는 학습 데이터에 포함되어 있지 않습니다.
최신 정보가 필요한 경우 Grounding with Google Search 기능을 함께 사용해야 합니다.
Q5. Gemini 3 Pro의 Gemini Live API를 지원하나요?
지원하지 않습니다. Vertex AI 공식 문서에 Gemini 3 Pro의 “Not supported” 항목에
gemini-3.1-flash-live-preview 모델을 사용해야 합니다.

마치며

모델 ID가 바뀌었고, 파라미터 구조가 달라졌으며, API와 Vertex AI의 전환 일정이 달랐습니다.
구글이 안내를 충분히 했다고는 해도, 실제로 프로덕션에서 이걸 빠르게 따라가려면 꼼꼼하게 뜯어봐야 합니다.

솔직히 말하면, 이번에 알게 된 것 중 가장 의외였던 건 Flash의 SWE-bench 점수였습니다.
코딩 에이전트를 만들면서 “당연히 Pro가 더 낫겠지”라고 생각했다면, 그 가정을 한 번은 흔들어봐야 합니다.
속도 3배, 비용 절감, 그리고 코딩 점수는 오히려 더 높다는 수치가 나왔으니까요.

Deep Think가 오늘부로 더 많은 구독자에게 열린 만큼, 앞으로 한 달 정도는 Gemini 생태계가 빠르게 움직일 가능성이 큽니다.
정식 전환 이후 세부 동작 변화나 한도 조정이 있다면 공식 릴리스 노트를 직접 확인하는 것이 가장 빠릅니다.

본 포스팅 참고 자료


  1. Google Blog KR — 제미나이 3: 아이디어의 실현을 돕는 구글의 가장 똑똑한 모델 (2025.11.19)

  2. Google Blog KR — 제미나이 3 플래시 출시 공식 포스팅 (2025.12.18)

  3. Google Vertex AI — Gemini 3 Pro 공식 모델 문서 (2026.03.26 기준)


  4. Google AI for Developers — Gemini API 모델 목록 (2026.03.29 기준)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다.
최신 내용은 공식 문서를 직접 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기