Gemini 3.1 Pro, 코드만 바꾸면 끝날 줄 알았습니다

Published on

in

Gemini 3.1 Pro, 코드만 바꾸면 끝날 줄 알았습니다

📅 2026.03.18 기준 / gemini-3.1-pro-preview 기준

2026년 3월 9일, gemini-3-pro-preview 가 완전히 종료됐습니다. 구글은 “gemini-3.1-pro-preview 로 마이그레이션하세요”라고 했고, 대부분은 모델명 하나만 바꾸면 끝이라고 생각했습니다. 막상 바꿔보면 다릅니다.

🔢 ARC-AGI-2: 3 Pro 31.1% → 3.1 Pro 77.1%
⚠️ 2.5 Pro도 2026.06.17 종료 예정
🔀 자동 리다이렉트: 3월 6일부터 적용

3월 9일에 정확히 무슨 일이 벌어졌나요

결론부터 말씀드리면, gemini-3-pro-preview 엔드포인트 자체가 꺼졌습니다. 구글 AI 공식 changelog(출처: ai.google.dev, 2026.03.09)에 따르면 “Gemini 3 Pro 프리뷰 모델이 종료되었습니다. 이제 gemini-3-pro-preview가 gemini-3.1-pro-preview를 가리킵니다”라고 명시되어 있습니다. 엔드포인트 자체는 살아있지만, 호출 시 3 Pro가 아닌 3.1 Pro로 응답이 넘어가는 구조입니다.

여기서 중요한 것은 종료 공지 타이밍입니다. 구글 공식 정책(ai.google.dev/gemini-api/docs/models#preview)에는 프리뷰 모델 종료 시 최소 2주 전 공지를 약속하고 있습니다. 그런데 실제 종료 공지는 2026년 2월 26일에 나왔고, 종료일은 3월 9일 — 11일 차이였습니다. 공식 포럼(discuss.ai.google.dev, 2026.03.02)에서 개발자들이 정책 위반 아니냐고 지적한 이유가 바로 이것입니다.

한 발 더 나아가면, 3월 6일부터는 -latest 별칭도 gemini-3.1-pro-preview로 전환됐습니다. 즉 코드에서 명시적 버전명 대신 latest를 사용하던 서비스는 이미 3.1 Pro로 응답을 받고 있습니다 — 인지하든 못하든 관계없이.

(출처: Google AI for Developers changelog, 2026.03.09 / Google AI Developer Forum, 2026.02.26~03.09)

▲ 목차로 돌아가기

자동 리다이렉트, 그냥 두면 안 될까요

더 직접적인 문제는 503 UNAVAILABLE 오류입니다. 공식 포럼 게시물(2026.03.05~09)에는 “Tier 3 계정인데도 3.1 Pro 호출 시 수일째 UNAVAILABLE 오류가 반환된다”는 보고가 여러 건 올라왔습니다. 모델이 종료된 게 아니라 3.1 Pro 출시 초반 수요 폭증으로 서버가 불안정했던 것입니다 — 즉, 코드 한 줄만 바꿔 배포했다가 서비스 장애로 이어질 수 있는 실제 시나리오입니다.

따라서 프로덕션 환경이라면 “자동 리다이렉트 되니까 괜찮겠지”는 위험한 가정입니다. 모델명 교체 후 반드시 기존 프롬프트·시스템 지침의 응답 품질을 검증하는 단계가 필요합니다. 특히 few-shot 예제나 structured output 스키마를 사용하던 경우라면 더욱 그렇습니다.

▲ 목차로 돌아가기

성능이 2배 올랐다는데, 어디서 올랐나요

💡 공식 발표 수치와 실제 사용 맥락을 나란히 놓고 보니 이런 차이가 보였습니다 — “추론 2배 향상”이 모든 작업에서 2배는 아닙니다.

구글 공식 발표(Google Blog, 2026.02.19)에서 강조한 수치는 ARC-AGI-2 점수 77.1%입니다. Gemini 3 Pro는 31.1%였으니 정확히 2.48배 향상입니다. ARC-AGI-2는 완전히 새로운 논리 패턴을 푸는 벤치마크 — 이것이 “2배 이상의 추론 성능”이라는 표현의 출처입니다. 이 수치 하나만 보면 압도적으로 들립니다.

그런데 같은 발표 문서에 담긴 DeepMind Model Card(deepmind.google/models/model-cards/gemini-3-1-pro/, 2026.02.19 기준) 벤치마크 전체 표를 보면 다른 그림이 나옵니다. MMMU-Pro(멀티모달 이해·추론)에서 Gemini 3.1 Pro는 80.5%이고 Gemini 3 Pro가 81.0%로 3.1 Pro가 오히려 낮습니다. GDPval-AA(전문가 태스크 Elo 평가)에서는 3.1 Pro가 1317인 반면 Claude Sonnet 4.6이 1633으로 크게 앞섭니다. 즉, 전방위 업그레이드가 아니라 추론·코딩 특화 업그레이드입니다.

SWE-Bench Verified(에이전틱 코딩) 기준으로 보면 3.1 Pro 80.6%, Opus 4.6이 80.8%로 매우 근소한 차이입니다. LiveCodeBench Pro Elo는 3.1 Pro 2887로 3 Pro의 2439 대비 명확한 우위입니다 — 경쟁 코딩 문제에서는 분명히 강해졌습니다. 어떤 작업을 쓰느냐에 따라 마이그레이션 편익이 완전히 다르게 체감된다는 뜻입니다.

(출처: Google DeepMind Model Card — Gemini 3.1 Pro, 2026.02.19 / Google Blog, 2026.02.19)

▲ 목차로 돌아가기

코딩 말고 글쓰기·창작에 쓰던 분들은 다른 얘기입니다

💡 공식 포럼의 실사용 데이터를 들여다보면, “업그레이드”라는 단어가 맥락마다 전혀 다른 의미가 됩니다.

구글 공식 AI Developer Forum(discuss.ai.google.dev, 2026.03)에 올라온 실사용자 반응을 보면 상당히 분명한 패턴이 있습니다. 코딩과 수학 작업에서는 대부분 3.1 Pro가 낫다고 평가하지만, 글쓰기·시나리오 작성·롤플레이·일본어 창작 작업에서는 정반대 평가가 많습니다. 한 사용자는 “글쓰기 시나리오 작업에서는 3 Pro가 훨씬 낫다. 3.1 Pro는 유머에서 특히 부족하다”고 적었고, 일본어 사용자는 “EQ-Bench3 벤치마크에서도 오히려 퇴보가 확인된다”며 종료 재검토를 요청했습니다.

이것이 단순히 주관적 취향 문제일까요? DeepMind Model Card 벤치마크 표에서 MMMU-Pro 점수가 3.1 Pro(80.5%)가 3 Pro(81.0%)보다 낮다는 공식 수치가 이 방향을 지지합니다. 창작·감성 표현과 밀접한 다중모달 이해 영역에서 실제로 수치가 낮아졌습니다. 숫자 1개의 차이지만, 이것이 실사용 체감과 방향이 일치한다는 점이 흥미롭습니다.

솔직히 말하면 구글이 이 부분을 공식 발표에서 전혀 언급하지 않은 것도 아쉬운 지점입니다. “추론 2배 향상”은 사실이지만, 그것이 모든 사용자에게 해당하지는 않습니다. 창작 작업 중심으로 3 Pro를 쓰고 있었다면, 마이그레이션 전에 같은 프롬프트로 응답 품질을 비교하는 과정이 생략되어서는 안 됩니다.

(출처: Google AI Developer Forum, 2026.03 / DeepMind Model Card — Gemini 3.1 Pro, 2026.02.19)

▲ 목차로 돌아가기

마이그레이션, 실제로 이 부분에서 오류가 납니다

공식 포럼(discuss.ai.google.dev)에서 보고된 실제 오류 유형을 정리하면 크게 세 가지입니다. 첫 번째는 503 UNAVAILABLE — 3.1 Pro 출시 초반 수요 집중으로 서버 과부하가 발생했습니다. 구글 공식 에러 메시지는 “This model is currently experiencing high demand. Spikes in demand are usually temporary. Please try again later.”였습니다. 이것은 모델 교체 문제가 아닌 인프라 문제였기 때문에, 코드를 아무리 고쳐도 해결이 안 됩니다.

두 번째는 시스템 프롬프트 미준수입니다. 3 Pro에서 설정한 동일한 시스템 지침을 3.1 Pro에 그대로 넣었을 때 응답 패턴이 달라진다는 보고가 있었습니다. 특히 특정 출력 포맷을 강제하거나 역할극 컨텍스트를 유지해야 하는 경우에서 이 문제가 두드러졌습니다. 구글 공식 마이그레이션 안내(discuss.ai.google.dev, 2026.02.26)는 “코드 또는 AI Studio의 저장된 프롬프트를 업데이트하고 출력이 요구사항을 여전히 충족하는지 검증할 것”을 명시하고 있습니다.

세 번째는 Android 앱에서의 타임아웃입니다. okHttp 등 HTTP 클라이언트로 직접 API를 호출하는 경우 3.1 Pro로 교체 후 타임아웃이 증가한다는 보고가 있었습니다. 3.1 Pro가 3 Pro 대비 응답 생성 시간이 늘어나는 작업에서 기존에 설정한 타임아웃 임계값이 맞지 않는 경우로 추정됩니다 — 정확한 원인은 구글 공식 확인이 필요한 상태입니다.

▲ 목차로 돌아가기

3 Pro만의 문제가 아닙니다 — 2.5 Pro도 카운트다운 중

💡 종료 일정 표를 세로로 읽어보면, 이번 마이그레이션은 단발성 이벤트가 아니라 구글 전체 모델 교체 주기의 일부입니다.

구글 공식 Gemini 지원 중단 페이지(ai.google.dev/gemini-api/docs/deprecations?hl=ko, 최종 업데이트 2026.03.11)를 보면 3 Pro 종료가 끝이 아닙니다. gemini-2.5-pro의 종료일은 2026년 6월 17일이며, 권장 교체 모델은 역시 gemini-3.1-pro-preview입니다. gemini-2.0-flash 계열도 2026년 6월 1일 종료 예정입니다. 이 흐름은 구글이 2.x 및 3.0 계열 전체를 3.1 계열로 통합하는 방향임을 보여줍니다.

이것이 실질적으로 의미하는 바는 간단합니다. 지금 2.5 Pro를 쓰고 있다면, 3개월 안에 같은 작업을 반복해야 합니다. 3 Pro 마이그레이션 과정에서 겪는 프롬프트 재검증, 타임아웃 재설정, 응답 품질 비교 작업이 2.5 Pro에도 동일하게 적용됩니다. 지금 3.1 Pro로 한 번만 제대로 이전해두면 적어도 2026년 6월 시점까지는 추가 작업 없이 대응이 가능합니다.

단, gemini-3.1-pro-preview 자체의 종료 날짜는 아직 미정(종료 날짜 미정)입니다. 프리뷰 딱지가 떼어지고 GA(정식 버전)로 전환되면 별도 안내가 나올 것으로 예상됩니다. 구글 블로그(2026.02.19)에서는 “현재 프리뷰로 배포 중이며, 추가 개선 후 곧 GA로 출시할 예정”이라고 명시했습니다.

(출처: Google Gemini 지원 중단 페이지, 2026.03.11 / Google Blog — Gemini 3.1 Pro, 2026.02.19)

▲ 목차로 돌아가기

자주 묻는 것들

▶ gemini-3-pro-preview 코드를 그냥 두면 서비스가 완전히 멈추나요?

멈추지는 않습니다. 2026년 3월 9일 이후 gemini-3-pro-preview를 호출하면 자동으로 gemini-3.1-pro-preview로 리다이렉트됩니다. 다만 응답 품질, 시스템 프롬프트 준수 여부, 타임아웃이 달라질 수 있어 프로덕션 환경에서는 검증 후 명시적으로 교체하는 것이 안전합니다. (출처: Google AI changelog, 2026.03.09)

▶ AI Studio에 저장해둔 프롬프트는 어떻게 되나요?

프로젝트, API 키, 저장된 프롬프트는 그대로 유지됩니다. 다만 저장된 프롬프트에서 gemini-3-pro-preview를 모델로 선택해둔 경우, 이제 실행하면 3.1 Pro로 응답이 나옵니다. 중요한 프롬프트라면 3.1 Pro 기준으로 응답 품질을 한 번 점검하는 것이 좋습니다. (출처: Google AI Developer Forum, 2026.02.26 — 공식 답변)

▶ Gemini 3.1 Pro도 언젠가 종료되나요?

현재(2026.03.18 기준) gemini-3.1-pro-preview의 종료 날짜는 미정입니다. 구글 공식 지원 중단 페이지(2026.03.11 기준)에도 “종료 날짜 미정”으로 표기되어 있습니다. GA로 전환된 이후 별도 수명 주기가 적용될 것으로 보이며, 구글 발표에 따르면 GA 출시가 가까운 시일 내 예정되어 있습니다.

▶ 2.5 Pro를 쓰고 있는데, 지금 당장 바꿔야 하나요?

▶ 창작·글쓰기 작업에서 3 Pro가 더 낫다고 느낀다면 어떻게 하나요?

현재로서는 3 Pro로 다시 돌아가는 방법이 없습니다. 종료된 모델이기 때문입니다. 공식 포럼에서도 같은 요청이 많이 나왔지만 구글의 공식 답변은 없었습니다. 실용적인 대안은 프롬프트를 3.1 Pro 스타일에 맞게 재조정하거나, 창작 특화 작업에서 Claude Sonnet이나 GPT-5.2 등 다른 모델과 비교해보는 것입니다. (DeepMind Model Card 기준 GDPval-AA 창의 영역 Elo에서 Claude Sonnet 4.6이 1633으로 3.1 Pro의 1317보다 높습니다.)

▲ 목차로 돌아가기

마치며

ARC-AGI-2 77.1%라는 수치는 인상적입니다. 하지만 그 수치가 내 작업에서도 그대로 2배 향상으로 나타나지 않을 수 있다는 걸 이 글이 보여주는 게 중요하다고 생각합니다. 구글의 모델 교체 주기는 빨라지고 있고, 이번 종료는 2.5 Pro 종료(2026.06.17)와 2.0 Flash 종료(2026.06.01)로 이어집니다.

기대했던 것과 달랐다면, 그건 성능이 나빠서가 아니라 업그레이드된 방향이 내 사용 방식과 다르기 때문일 가능성이 높습니다. 이 부분이 공식 발표에서 가장 잘 안 보이는 부분이기도 합니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. Google AI for Developers — Gemini API 출시 노트 (changelog)
    https://ai.google.dev/gemini-api/docs/changelog?hl=ko
  2. Google AI for Developers — Gemini 지원 중단 일정 (deprecations)
    https://ai.google.dev/gemini-api/docs/deprecations?hl=ko
  3. Google Blog — Gemini 3.1 Pro: A smarter model for your most complex tasks (2026.02.19)
    https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/
  4. Google DeepMind — Gemini 3.1 Pro Model Card (2026.02.19)
    https://deepmind.google/models/model-cards/gemini-3-1-pro/
  5. Google AI Developer Forum — Migrate from Gemini 3 Pro Preview (2026.02.26~03.09)
    https://discuss.ai.google.dev/t/migrate-from-gemini-3-pro-preview-to-gemini-3-1-pro-preview-before-march-9-2026/127062

⚠️ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 모든 수치와 종료 일정은 2026년 3월 18일 기준이며, 구글의 업데이트에 따라 달라질 수 있습니다. 최신 정보는 Google AI for Developers 공식 문서를 직접 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기