Google DeepMind 공식 발표
Gemini 3 Pro 정식 전환,
안 바꾸면 끊깁니다
2026년 3월 26일, 구글이 Gemini 3 Pro를 Preview에서 공식 GA(정식 안정 버전)로 전환했습니다.
겉보기엔 단순한 이름 정리처럼 보이지만, 모델 ID가 바뀌고 파라미터 구조가 달라졌습니다.
API를 쓰고 있다면 바로 오늘 확인해야 합니다.
Preview가 사라진 날 — 3월 26일에 정확히 무슨 일이 있었나
2026년 3월 26일, 구글 Vertex AI 공식 문서에 한 줄이 추가됐습니다.
“As of March 26, 2026, gemini-3-pro-preview is discontinued.”
프리뷰 딱지가 붙어 있던 gemini-3-pro-preview가 공식 종료되고,
정식 GA 모델 체계로 전환됐습니다.
(출처: Google Vertex AI 공식 모델 문서, 2026.03.26)
사실 이번 전환은 갑자기 생긴 일이 아닙니다. 구글은 3월 9일에 먼저
Vertex AI 쪽은 3월 26일을 마지막 날로 잡았습니다.
두 곳을 각각 다른 시점에 순차적으로 마감한 셈입니다.
(출처: Google AI for Developers 공식 FAQ, 2026.02.26)
같은 날, 구글은 ‘3월 Gemini Drop’을 통해
Personal Intelligence를 미국 전체 무료 이용자에게 개방했고,
메모리와 채팅 기록을 다른 AI 앱에서 Gemini로 옮겨오는 전환 도구도 공개했습니다.
모델 전환과 앱 기능 확장이 같은 날 이뤄진 것입니다.
(출처: Gemini Release Notes 공식 페이지, 2026.03.26)
모델 ID가 바뀌었다는 건 코드도 바꿔야 한다는 뜻입니다
Preview 단계에서는 gemini-3-pro-preview라는 이름을 썼고,
이걸 코드에 그대로 박아뒀다면 3월 9일(API/AI Studio) 또는 3월 26일(Vertex AI)부터
서비스가 끊겼습니다. 모든 요청이 에러를 반환하게 됩니다.
⚠️ 지금 당장 확인해야 할 것
프로젝트 코드에서 gemini-3-pro-preview 또는
gemini-3.0-pro-preview 문자열을 검색하세요.
있다면 GA 안정 버전 또는 현재 추천 모델인 Gemini 3.1 Pro로 교체해야 합니다.
GA 전환 이후 Vertex AI 기준 정식 모델 ID는 gemini-3-pro입니다.
출시일은 2025년 11월 18일이고, 종료 예정일은 공식 발표되지 않았습니다.
한편 구글 AI API(ai.google.dev) 기준 현재 권장 경로는 gemini-3.1-pro-preview입니다.
두 채널의 권장 모델이 다르다는 점도 확인이 필요합니다.
| 채널 | Preview 종료일 | 현재 권장 모델 ID | 비고 |
|---|---|---|---|
| Gemini API / AI Studio | 2026.03.09 | gemini-3.1-pro-preview |
구글 AI for Developers 기준 |
| Vertex AI | 2026.03.26 | gemini-3-pro |
Google Cloud Vertex AI 기준 |
출처: Google AI for Developers 공식 모델 페이지, Vertex AI 공식 모델 문서 (2026.03.26 기준)
Gemini 3 Pro가 잘 못하는 것, 공식 문서에 직접 나와 있습니다
“최고 성능 모델이 모든 걸 다 잘한다”는 건 Gemini 3 Pro에선 사실이 아닙니다.
Vertex AI 공식 문서는 품질 변경 사항 섹션에서 이렇게 명시하고 있습니다.
💡 공식 발표문과 실제 기능 범위를 같이 놓고 보니 이런 차이가 보였습니다
“Gemini 3 Pro models aren’t designed around prioritizing supporting audio understanding or image segmentation use cases.”
(Gemini 3 Pro는 오디오 이해 및 이미지 분할 사용 사례를 우선 지원하도록 설계되지 않았습니다.)
추가로: “For information-dense or complicated graphs, tables, or charts, the model can sometimes incorrectly extract information or misinterpret the provided resources.”
(정보 밀도가 높은 그래프, 표, 차트에서 간혹 정보를 잘못 추출하거나 잘못 해석할 수 있습니다.)
출처: Google Vertex AI 공식 Gemini 3 Pro 모델 문서, 2026.03.26
여기서 놓치면 안 되는 포인트가 있습니다. Gemini 3는 출시 때부터 멀티모달 추론의 최전선이라고 소개됐는데,
막상 공식 문서에는 오디오 이해와 이미지 분할은 다른 전용 모델을 쓰라고 적혀 있습니다.
성능이 뛰어난 게 맞지만, 모든 멀티모달 작업이 다 통하는 건 아닙니다.
오디오 관련 작업이라면 Google AI for Developers 모델 페이지 기준으로
gemini-3.1-flash-live-preview(실시간 오디오-투-오디오 전용)나
gemini-2.5-pro-preview-tts(고품질 음성 합성 전용)가 따로 마련돼 있습니다.
Flash가 코딩 에이전트에서 Pro보다 앞선다는 수치가 나왔습니다
코딩 에이전트 성능을 재보니 순서가 뒤집혔습니다.
구글 공식 발표 기준으로, SWE-bench Verified에서
Gemini 3 Flash가 78%를 기록한 반면
Gemini 3 Pro는 76.2%였습니다.
플래그십 모델보다 경량 모델이 코딩 에이전트 평가에서 더 높은 점수를 낸 것입니다.
(출처: Google Blog KR — Gemini 3 Flash 공식 출시 포스팅, 2025.12.18)
💡 수치를 나란히 놓고 보면 이런 사용 패턴이 보입니다
| 벤치마크 | Gemini 3 Pro | Gemini 3 Flash | 비고 |
|---|---|---|---|
| SWE-bench Verified (코딩 에이전트) | 76.2% | 78% | Flash가 더 높음 |
| GPQA Diamond (박사급 추론) | 91.9% | 90.4% | Pro가 더 높음 |
| HLE 점수 (툴 미사용) | 37.5% | 33.7% | Pro가 더 높음 |
| MMMU-Pro (멀티모달 추론) | 81% | 81.2% | Flash가 근소하게 더 높음 |
| 추론 속도 | 기준 | 약 3배 빠름 | Artificial Analysis 기준 |
정리하면 이렇습니다. 코드를 반복적으로 생성하고 검증하는 에이전트 워크플로우에는 Flash가 오히려 유리합니다.
Pro를 선택해야 하는 명확한 이유는 복잡한 수학, 과학, 멀티스텝 추론, 대형 문서 분석처럼
더 깊은 사고가 필요할 때입니다. 코딩 자동화에 Pro를 기본으로 쓰고 있었다면, 한 번쯤 Flash로 A/B 테스트를 해볼 만합니다.
속도가 3배 빠르고 비용도 더 낮으면서 코딩 벤치마크 결과는 Pro보다 높게 나옵니다.
thinking_level — budget을 버리고 새로운 파라미터가 왔습니다
Vertex AI 공식 문서에 따르면, Gemini 3 모델부터는 thinking_level이라는 새로운 파라미터를 씁니다.
(출처: Google Vertex AI 공식 Gemini 3 Pro 모델 문서, 2026.03.26)
💡 파라미터 방식이 바뀐 맥락을 짚어보면 이런 의도가 보입니다
기존 thinking_budget은 사용할 추론 토큰 수를 직접 숫자로 지정하는 방식이었습니다.
새로운 thinking_level은 low 또는 high라는 레벨 값으로 추론 깊이를 제어합니다.
토큰 수를 직접 계산할 필요 없이, 응답 품질과 비용·속도를 레벨 단위로 균형을 맞출 수 있도록 설계를 바꾼 것입니다.
이와 함께 media_resolution 파라미터도 새로 생겼습니다.
low / medium / high 중 하나를 골라서 이미지·비디오 처리 해상도를 조절할 수 있고,
이 선택이 토큰 사용량과 처리 속도에 직접 영향을 줍니다.
thinking_budget 파라미터가 무시되거나 에러를 일으킬 수 있습니다.
마이그레이션 시 파라미터 목록을 반드시 새로 검토해야 합니다.
Deep Think, 오늘부터 유료 구독자에게 풀렸습니다
3월 28~29일을 기준으로, Gemini 3 Deep Think 모드가 Google AI Ultra 구독자를 넘어
유료 구독자 전반에 순차적으로 개방됐습니다.
Mashable 보도 기준으로 “월 $250 유료 플랜 구독자 누구나 지금 Gemini 앱에서 Deep Think를 쓸 수 있다”고 전했습니다.
(출처: Mashable, “Gemini 3 Deep Think rolls out to paid subscribers”, 2026.03.28)
Deep Think 모드의 성능 수치는 Gemini 3 Pro 자체보다 한 단계 더 높습니다.
GPQA Diamond 기준으로 Pro가 91.9%였다면, Deep Think는 93.8%입니다.
HLE(툴 미사용) 기준으로는 Pro가 37.5%인 반면, Deep Think는 41.0%를 기록했습니다.
(출처: Google Blog KR — Gemini 3 출시 공식 포스팅, 2025.11.19)
ARC-AGI-2 벤치마크(코드 실행 포함, ARC Prize 인증)에서는 45.1%라는 수치를 기록했는데,
이 시험은 새로운 유형의 문제 해결 능력을 평가하는 평가 기준으로, 이전에 어떤 모델도 이 수준에 가까이 온 적이 없었습니다.
Pro만으로도 강력하지만, 정말 복잡한 과학이나 수학 문제라면 Deep Think를 써보는 게 맞습니다.
다만 Deep Think는 “일반 요청”에 쓰기엔 오버스펙입니다.
공식 설명대로 응답 준비에 몇 분이 걸리고, 일상적인 질문에는 구조적으로 과잉 처리가 됩니다.
Q&A — 자주 나오는 질문 5가지
마치며
모델 ID가 바뀌었고, 파라미터 구조가 달라졌으며, API와 Vertex AI의 전환 일정이 달랐습니다.
구글이 안내를 충분히 했다고는 해도, 실제로 프로덕션에서 이걸 빠르게 따라가려면 꼼꼼하게 뜯어봐야 합니다.
솔직히 말하면, 이번에 알게 된 것 중 가장 의외였던 건 Flash의 SWE-bench 점수였습니다.
코딩 에이전트를 만들면서 “당연히 Pro가 더 낫겠지”라고 생각했다면, 그 가정을 한 번은 흔들어봐야 합니다.
속도 3배, 비용 절감, 그리고 코딩 점수는 오히려 더 높다는 수치가 나왔으니까요.
Deep Think가 오늘부로 더 많은 구독자에게 열린 만큼, 앞으로 한 달 정도는 Gemini 생태계가 빠르게 움직일 가능성이 큽니다.
정식 전환 이후 세부 동작 변화나 한도 조정이 있다면 공식 릴리스 노트를 직접 확인하는 것이 가장 빠릅니다.
본 포스팅 참고 자료
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다.
최신 내용은 공식 문서를 직접 확인하시기 바랍니다.

댓글 남기기