2026.03.26 기준
Gemini API · Vertex AI
삭제 완료

Gemini 3 Pro Preview 삭제, 3가지 함정을 직접 확인했습니다

Gemini 3 Pro Preview가 오늘(2026.03.26) Vertex AI에서도 완전히 삭제됩니다. Gemini API 기준으로는 이미 3월 9일에 종료됐고요. “자동 리디렉션이 되니까 괜찮다”고 넘어갔다면, 막상 배포 환경에서 예상 못한 문제를 만날 수 있습니다.

3월 9일

Gemini API 종료일

3월 26일

Vertex AI 삭제일 (오늘)

2배 이상

3.1 Pro 응답 지연 실측

두 플랫폼, 삭제 일자가 다릅니다

대부분의 글이 “3월 9일에 종료됐다”고만 적고 넘어갑니다. 그런데 Vertex AI에서는 그게 오늘, 즉 2026년 3월 26일입니다. 구글 공식 Vertex AI 마이그레이션 문서에 직접 이렇게 나옵니다:

“Caution: gemini-3-pro-preview will be deprecated and removed on March 26, 2026. Migrate any workflows to gemini-3.1-pro-preview.”

(출처: Google Cloud Vertex AI — Migrate to the latest Gemini models)

즉, 같은 모델이라도 쓰는 플랫폼에 따라 삭제 일자가 달랐습니다. Gemini API(AI Studio 기준)는 3월 9일 종료, Vertex AI는 3월 26일 삭제. 이미 Gemini API로 작업 중인 팀은 17일 전에 강제 전환된 거고, Vertex AI 기반 팀은 오늘이 데드라인입니다.

💡 공식 발표문과 실제 플랫폼별 적용 날짜를 같이 놓고 보면 이런 차이가 보입니다 — Gemini API용 코드와 Vertex AI용 코드를 둘 다 쓰는 팀이라면 한쪽은 이미 전환됐고 나머지는 오늘 전환되는 상황입니다.

Deprecation 공지는 2026년 2월 26일에 나왔고, Gemini API 기준 shutdown까지는 11일 간격이었습니다. 구글의 자체 정책인 “최소 14일 이전 공지” 기준을 지키지 않았다는 지적이 공개 포럼에 올라오기도 했습니다. (출처: Google AI Developers Forum — “Migrate from Gemini 3 Pro Preview”, 2026.02.26)

▲ 목차로 돌아가기

alias를 쓰던 개발자는 이미 모델이 바뀐 상태입니다

코드에 모델 이름을 직접 명시하지 않고 gemini-pro-latest 같은 alias를 쓰는 경우가 많습니다. 이 alias는 2026년 3월 6일에 이미 gemini-3.1-pro-preview로 변경됐습니다. 공식 changelog에 정확히 이렇게 기록돼 있습니다:

📋 March 6, 2026 — alias 변경 이력

gemini-pro-latest → gemini-3.1-pro-preview 로 변경
gemini-flash-latest → gemini-3-flash-preview 로 변경

(출처: Gemini API Release Notes — ai.google.dev/gemini-api/docs/changelog)

아무것도 건드리지 않았는데 3월 6일 이후부터 실질적으로 3.1 Pro를 쓰고 있던 겁니다. 이걸 모르고 “최근 들어 왜 이렇게 느리지?” 했던 팀이 적지 않았습니다.

또한 3월 9일 종료 이후에도 gemini-3-pro-preview를 명시적으로 호출하면 에러가 아니라 그냥 gemini-3.1-pro-preview로 리디렉션됩니다. 에러가 안 뜨니까 모델이 바뀐 걸 눈치채지 못하는 경우도 있었습니다.

▲ 목차로 돌아가기

리디렉션된다고 했는데 응답이 2배 느려진 이유

“자동으로 3.1 Pro로 연결해준다니까 별문제 없겠지”라고 생각하기 쉽습니다. 실제로는 다릅니다. Reddit r/GeminiAI에 올라온 실사용 보고에 따르면, 동일한 프롬프트 구조와 입력 사이즈를 그대로 쓴 상태에서 복잡한 작업 처리 시간이 약 60초 → 2분 이상으로 늘었다는 사례가 보고됐습니다.

실측 사례 요약 (Reddit r/GeminiAI, 2026.03.02, upvote 27)
— 동일 프롬프트, 동일 입력으로 3.0 Pro는 약 60초, 3.1 Pro는 2분 이상 소요
— 사용자 표현: “latency가 직접 UX에 영향을 주는 앱에서는 치명적”
— “3.0이 가능하다면 3.0 그대로 쓰고 싶다”는 반응 다수

왜 이런 차이가 날까요. Gemini 3.1 Pro는 추론 깊이(thinking level)가 기본적으로 더 높게 설정돼 있고, 더 많은 compute를 씁니다. 동일한 결과를 내더라도 처리 경로가 달라집니다. 추가로 Reddit 다른 답글에서는 “3.1 Flash Thinking”이 3.0 Pro와 성능이 유사하면서 속도는 더 낫다는 의견도 있었습니다 — 무조건 3.1 Pro로만 가야 하는 건 아니라는 뜻입니다.

공식 마이그레이션 문서도 이렇게 안내합니다: “일부 앱은 프롬프트 조정이 필요하며, 사전 테스트 없이 전환하는 건 권장하지 않습니다.” 단순 코드 한 줄 교체로 끝나는 문제가 아닙니다. (출처: Google Cloud — Migrate to the latest Gemini models, 2026.03.26 기준)

▲ 목차로 돌아가기

temperature 건드리면 루프에 빠지는 조건이 있습니다

이건 기존 블로그 글에서 거의 안 다루는 부분입니다. Gemini 3.1 Pro로 넘어오면서 temperature 파라미터 동작 방식이 근본적으로 바뀌었습니다. Vertex AI 공식 마이그레이션 문서에 이렇게 나와 있습니다:

“Google strongly recommends keeping the temperature parameter at its default value of 1.0. Changing the temperature (setting it to less than 1.0) may lead to unexpected behavior, such as looping or degraded performance, particularly in complex mathematical or reasoning tasks.”

(출처: Google Cloud — Migrate to the latest Gemini models, docs.cloud.google.com, 2026.03.26 기준)

Gemini 3 Pro(이전 버전)는 temperature를 낮게 설정할수록 더 일관된 출력이 나왔고, 많은 팀이 이 방식으로 프로덕션 시스템을 구성했습니다. 그런데 3.1 Pro에서 그대로 낮은 temperature를 유지하면 추론 루프가 생기거나 수학·코딩 태스크 품질이 떨어질 수 있습니다. 이전 설정을 그대로 복사해 붙여넣은 팀이 가장 많이 당하는 문제입니다.

💡 공식 문서와 실제 사용 흐름을 같이 보니 이런 패턴이 보였습니다 — 이전 모델에서 최적화한 temperature 값이 신규 모델에서는 오히려 성능 저하를 유발합니다. 마이그레이션 전에 temperature를 1.0으로 초기화하고 테스트부터 시작하는 게 순서입니다.

Google AI Developers Forum에서도 3.1 Pro 마이그레이션 이후 timeout 20분 대기, 셸 명령만 실행되고 코드를 작성하지 않는 현상이 보고됐습니다. 응답자 중 한 명은 “먼저 3.1 Flash Lite Preview로 작은 변경을 해보고, 그 다음에 3.1 Pro를 시도하라”고 제안했습니다. (출처: Google AI Developers Forum — “Gemini 3.1 Pro migration problems”, 2026.03.05)

▲ 목차로 돌아가기

breaking change 7가지, 코드에서 직접 찾아야 합니다

Vertex AI 공식 마이그레이션 문서에서 명시한 breaking change 목록입니다. 한 줄씩 짚어보겠습니다.

변경 항목	실제 영향
thinking_budget → thinking_level	파라미터 이름 자체가 바뀜. 기존 코드는 무시됨
thought signatures 오류 처리	3.0은 경고만, 3.1은 바로 에러 반환
Top-K 파라미터 미지원	Top-K 설정하던 코드, 3.1에서 동작 안 함
이미지 토큰 비용 변경	Pan and Scan → 가변 시퀀스 방식으로 변경. 비용 달라짐
PDF 토큰 집계 방식	usage_metadata에서 DOCUMENT → IMAGE로 분류
image segmentation 미지원	3.1 Pro 이상에서 이미지 분할 기능 제거됨
스캔 PDF OCR 기본값 변경	OCR 기본값이 OFF로 바뀜. 별도 명시 필요

(출처: Google Cloud — Migrate to the latest Gemini models, docs.cloud.google.com/vertex-ai/generative-ai/docs/migrate, 2026.03.26 기준)

이 중에서 실무에서 가장 많이 걸리는 건 thinking_budget → thinking_level 변경과 Top-K 미지원입니다. 이전 모델에서 thinking_budget을 직접 조작하던 코드는 3.1 Pro에서 아무런 에러 없이 그냥 무시됩니다. 의도한 대로 추론 깊이가 제어되지 않아도 코드 자체는 정상 실행처럼 보이는 겁니다.

이미지 토큰 비용 변경은 특히 이미지를 대량으로 처리하는 앱에서 청구 금액에 직접 영향을 줍니다. 가변 시퀀스 방식으로 바뀌면서 같은 이미지도 해상도나 콘텐츠에 따라 토큰 수가 달라집니다.

▲ 목차로 돌아가기

자주 묻는 질문

▶ gemini-3-pro-preview를 아직도 코드에 쓰고 있으면 어떻게 됩니까?

▶ Gemini API와 Vertex AI 중 어디로 마이그레이션해야 합니까?

개발·실험 단계라면 Gemini API(AI Studio 기반)가 간편합니다. 프로덕션·엔터프라이즈 환경이라면 Vertex AI가 SLA, 데이터 거버넌스, 지역 엔드포인트 측면에서 유리합니다. 두 환경 모두 대체 모델은 gemini-3.1-pro-preview입니다.

▶ 3.1 Pro가 느린 경우, 대안은 없습니까?

있습니다. Reddit 실사용자들의 경험에 따르면 Gemini 3 Flash Thinking이 3.0 Pro와 성능이 비슷하면서 속도는 더 나은 경우가 있습니다. 응답 속도가 핵심인 고객 대면 서비스라면 Flash Thinking을 함께 평가해보는 걸 권장합니다. 단, 평가 결과는 태스크 유형에 따라 달라집니다.

▶ gemini-2.5-flash-lite-preview-09-2025도 곧 삭제됩니까?

맞습니다. 공식 deprecation 표 기준으로 gemini-2.5-flash-lite-preview-09-2025는 2026년 3월 31일이 shutdown 날짜입니다. 대체 모델은 gemini-3.1-flash-lite-preview입니다. (출처: Gemini API Deprecations 공식 페이지, 2026.03.25 업데이트)

▶ 3.1 Pro로 넘어갔는데 기존 파인튜닝 모델도 그대로 쓸 수 있습니까?

쓸 수 없습니다. Vertex AI 공식 문서에서 “이전 Gemini 버전으로 파인튜닝한 모델을 새 버전으로 이전하는 것은 불가능하며, 새 모델에 맞춰 튜닝 작업을 새로 실행해야 한다”고 명시합니다. 다만 3.1 Pro의 기본 성능이 향상된 만큼, 먼저 파인튜닝 없이 새 모델을 테스트해보고 그 결과에 따라 재튜닝 여부를 결정하는 걸 권장합니다.

▲ 목차로 돌아가기

마치며

Gemini 3 Pro Preview 삭제가 별거 아닌 것처럼 느껴지는 이유는 구글이 자동 리디렉션을 제공하기 때문입니다. 근데 리디렉션이 된다는 게 “동일하게 작동한다”는 뜻은 아닙니다. 응답 속도, temperature 동작 방식, breaking change 7가지가 있고, 그 중 하나라도 기존 코드에서 걸리면 예상 못한 결과가 나옵니다.

직접 확인해보니 핵심은 세 가지였습니다. 첫째, Gemini API(3월 9일)와 Vertex AI(3월 26일) 삭제 일자가 달랐습니다. 둘째, alias(gemini-pro-latest)를 쓰던 코드는 3월 6일 이후 이미 3.1 Pro로 전환된 상태입니다. 셋째, temperature를 1.0 이하로 낮추면 루프나 성능 저하가 생기는 조건이 공식 문서에 명시돼 있습니다.

마이그레이션은 “코드 한 줄 교체”가 아니라 실제 테스트가 먼저입니다. 구글 공식 가이드도 “충분한 사전 테스트 없이 전환하는 건 권장하지 않는다”고 못을 박아뒀습니다. 아직 코드 점검을 못 했다면 지금이 타이밍입니다.

▲ 목차로 돌아가기

📎 본 포스팅 참고 자료

Gemini API Release Notes — ai.google.dev/gemini-api/docs/changelog
Gemini API Deprecations — ai.google.dev/gemini-api/docs/deprecations
Google Cloud Vertex AI — Migrate to the latest Gemini models — docs.cloud.google.com/vertex-ai/generative-ai/docs/migrate
Google AI Developers Forum — “Migrate from Gemini 3 Pro Preview to Gemini 3.1 Pro Preview before March 9, 2026” (2026.02.26)
Reddit r/GeminiAI — “Gemini 3.0 is being shut down March 9 — but 3.1 is significantly slower” (2026.03.02)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Gemini API 및 Vertex AI 서비스는 구글의 업데이트에 따라 모델 지원 범위, 파라미터 동작 방식, 요금이 달라질 수 있습니다. 최신 정보는 Google AI 공식 문서에서 직접 확인하시기 바랍니다.

Gemini 3 Pro Preview 삭제, 3가지 함정을 직접 확인했습니다

두 플랫폼, 삭제 일자가 다릅니다

alias를 쓰던 개발자는 이미 모델이 바뀐 상태입니다

리디렉션된다고 했는데 응답이 2배 느려진 이유

temperature 건드리면 루프에 빠지는 조건이 있습니다

breaking change 7가지, 코드에서 직접 찾아야 합니다

자주 묻는 질문

마치며

📎 본 포스팅 참고 자료

댓글 남기기응답 취소

최신 글

카테고리

Tags

Gemini 3 Pro Preview 삭제, 3가지 함정을 직접 확인했습니다

Gemini 3 Pro Preview 삭제, 3가지 함정을 직접 확인했습니다

두 플랫폼, 삭제 일자가 다릅니다

alias를 쓰던 개발자는 이미 모델이 바뀐 상태입니다

리디렉션된다고 했는데 응답이 2배 느려진 이유

temperature 건드리면 루프에 빠지는 조건이 있습니다

breaking change 7가지, 코드에서 직접 찾아야 합니다

자주 묻는 질문

마치며

📎 본 포스팅 참고 자료

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기