Gemini 2.5 Flash-Lite 종료, 3월 31일이 전부가 아닙니다

Published on

2026년 3월 21일

2026.03.21 기준
gemini-2.5-flash-lite-preview-09-2025 기준
D-10 종료 임박

Gemini 2.5 Flash-Lite 종료,
3월 31일이 전부가 아닙니다

2026년 3월 31일, gemini-2.5-flash-lite-preview-09-2025가 Google AI Studio와 Gemini API에서 완전히 꺼집니다.
문제는 종료 날짜가 아니라 그 이후에 어디로 가느냐입니다. 가격이 달라지고, 버그가 있고, 플랫폼마다 상황이 다릅니다.

3월 31일

프리뷰 종료일

3.75×

출력 토큰 가격 상승

7월 22일

Vertex AI 안정화 버전 종료

종료 대상이 정확히 어떤 모델인가

이번에 종료되는 건 gemini-2.5-flash-lite-preview-09-2025입니다.
2025년 9월 25일에 나온 프리뷰 버전으로, Google AI Studio와 Gemini API에서 쓸 수 있었던 그 모델입니다.
(출처: Google Gemini API 지원 중단 공식 페이지, 2026.03.11)

헷갈리기 쉬운 게, 이름이 거의 같은 모델이 두 개 더 있습니다.
하나는 gemini-2.5-flash-lite-preview-06-17(2025년 6월 출시), 다른 하나는 안정화 버전인 gemini-2.5-flash-lite입니다.
이 중 3월 31일에 종료되는 건 09-2025 프리뷰 하나뿐입니다.

모델 ID	종료일	비고
`gemini-2.5-flash-lite-preview-09-2025`	2026.03.31	이번 종료 대상
`gemini-2.5-flash-lite-preview-06-17`	2025.11.18 (이미 종료)	6월 프리뷰, 이미 끝남
`gemini-2.5-flash-lite` (안정화)	2026.07.22	Vertex AI 기준, AI Studio도 운영 중

즉, 이름에 “2.5 Flash-Lite”가 들어있다고 해서 무조건 종료되는 게 아닙니다. 버전 suffix를 직접 확인하는 게 맞습니다.

▲ 목차로 돌아가기

-latest 앨리어스를 쓰고 있다면 지금 바로 확인해야 합니다

💡 공식 이메일과 실제 앨리어스 전환 흐름을 같이 놓고 보니 이런 차이가 보였습니다.
모델을 명시적으로 고정해 쓴 팀은 3월 31일 이후에도 에러만 날 뿐 자동 전환이 없습니다.
반대로 -latest 앨리어스를 쓴 팀은 공지를 모르더라도 조용히 모델이 바뀝니다.

Google이 개발자들에게 이메일로 공지한 내용을 보면, gemini-flash-latest 앨리어스는 3월 31일 이후 자동으로 gemini-3.1-flash-lite-preview로 전환됩니다.
(출처: piunikaweb.com Google 공지 이메일 보도, 2026.03.11)

쉽게 말해 앨리어스 유저는 4월 1일 아침에 갑자기 다른 모델을 쓰게 될 수 있습니다. 프롬프트 응답 형식이 바뀌거나, 비용이 올라가도 대시보드를 확인하기 전까지 모를 수 있습니다.
반면 모델 ID를 하드코딩한 팀은 3월 31일 이후 API 호출 자체가 실패하므로 즉시 알아챌 수 있습니다.

어느 쪽이 더 안전하냐는 상황에 따라 다릅니다. 서비스 무중단이 우선이라면 -latest 앨리어스가 낫고,
비용과 응답 품질을 정밀하게 관리해야 한다면 버전을 명시하고 직접 마이그레이션 시점을 정하는 게 맞습니다.

API 키 대시보드에서 gemini-2.5-flash-lite-preview-09-2025 사용량이 있는지 지금 확인해보는 게 첫 번째 순서입니다.

▲ 목차로 돌아가기

비용 충격: 입력 2.5배, 출력 3.75배

Google이 권장하는 대체 모델은 gemini-3.1-flash-lite-preview입니다.
공식 발표 기준 가격은 입력 $0.25/1M 토큰, 출력 $1.50/1M 토큰입니다.
(출처: Google Gemini API 공식 가격 페이지 / blog.google 발표, 2026.03.03)

기존 gemini-2.5-flash-lite-preview-09-2025는 입력 $0.10/1M, 출력 $0.40/1M이었습니다.
계산해보면 입력은 2.5배, 출력은 3.75배 오른 겁니다.

모델	입력 (1M 토큰)	출력 (1M 토큰)	상승 배율
`gemini-2.5-flash-lite-preview-09-2025`	$0.10	$0.40	기준
`gemini-3.1-flash-lite-preview`	$0.25 (+2.5×)	$1.50 (+3.75×)	최대 3.75×

💡 입력보다 출력이 많은 워크로드일수록 비용 충격이 더 큽니다.
예를 들어 월 100만 건 호출에서 출력이 입력의 3배라면, 지금까지 월 $130이던 비용이 약 $475로 뜁니다. 같은 토큰 수인데도 플랫폼 전환 하나로 청구서가 달라집니다.

실제 개발자 반응도 비슷했습니다. 한 개발자는 “$4,000어치 처리할 게 있는데, 3.1 Flash-Lite로 가면 $10,000이 된다”고 밝혔습니다.
(출처: piunikaweb.com, 2026.03.11 — 개발자 코멘트 인용)

Google은 3.1 Flash-Lite가 “이전 세대보다 더 저렴하다”고 홍보하는데, 이건 Gemini 3 시리즈 내에서 상대적으로 가장 저렴하다는 뜻이지,
현재 쓰고 있는 2.5 Flash-Lite 프리뷰보다 싸다는 얘기가 아닙니다.

▲ 목차로 돌아가기

Vertex AI 쓰면 3월 31일 관계없습니다

💡 “3월 31일 종료”라는 공지가 나왔을 때, Vertex AI 유저들은 이 알림을 받지 않았습니다. Google의 공지 이메일에 명시된 대로, 이번 종료는 Gemini API와 Google AI Studio 전용 변경입니다.

공식 Vertex AI 모델 버전 페이지를 보면 안정화 버전 gemini-2.5-flash-lite의 종료 예정일은 2026년 7월 22일입니다.
(출처: Google Vertex AI 모델 버전 및 수명 주기 페이지, 최종 업데이트 미표시 / Gemini API 지원 중단 페이지)

기업 플랜으로 Vertex AI를 통해 이 모델을 쓰고 있다면, 3월 31일은 사실상 아무 영향이 없습니다. 마이그레이션 기한이 4개월 더 남아있는 셈입니다.

이 차이가 중요한 이유는, 인터넷에 도는 “2.5 Flash-Lite 3월 31일 종료”라는 정보가 Vertex AI 사용자에게는 그대로 적용되지 않기 때문입니다.
자신이 어떤 엔드포인트를 쓰는지 먼저 확인하는 게 맞습니다.

플랫폼	대상 모델	종료일
Gemini API / AI Studio	`gemini-2.5-flash-lite-preview-09-2025`	2026.03.31
Vertex AI	`gemini-2.5-flash-lite` (안정화)	2026.07.22

▲ 목차로 돌아가기

3.1 Flash-Lite에서 지금 확인된 버그

Google이 권장하는 대체 모델인 gemini-3.1-flash-lite-preview는 출시 직후부터 실제 사용 중 문제가 보고되고 있습니다.

⚠️ 다단계 도구 사용 시 조기 종료 버그

2026년 3월 4일 출시 직후부터 멀티스텝 function calling 도중 FINISH_REASON=STOP이 중간에 반환되는 버그가 Reddit r/Bard에 다수 보고됐습니다.
기존 Gemini 2.5 Flash-Lite 프리뷰에서는 없던 현상입니다.
(출처: reddit.com/r/Bard, 2026.03.09 게시 — 다수 개발자 확인)

Function calling이나 에이전트 파이프라인처럼 여러 단계로 도구를 호출하는 구조라면 마이그레이션 전에 반드시 테스트가 필요합니다.
Google 공식 답변은 아직 나오지 않았습니다.

반면 단순 텍스트 생성, 번역, 콘텐츠 모더레이션처럼 단일 호출로 끝나는 작업에서는 이 버그가 사실상 무관합니다.
3.1 Flash-Lite의 공식 발표에서도 번역, 콘텐츠 모더레이션, UI 생성 등 단일 호출 위주 태스크가 주요 사용 사례로 제시됐습니다.
(출처: blog.google Gemini 3.1 Flash-Lite 출시 공지, 2026.03.03)

요약하면, 마이그레이션이 급하지 않고 에이전트 구조를 쓰고 있다면 지금 당장 전환하는 게 꼭 맞는 선택은 아닐 수 있습니다.

▲ 목차로 돌아가기

대체 모델 선택 기준: 상황별 정리

지금 쓰던 모델이 종료된다고 해서 무조건 Google이 가리키는 대체 모델로 가야 할 이유는 없습니다.
상황에 따라 맞는 선택지가 다릅니다.

상황	권장 선택	근거
단순 번역·모더레이션, 단일 호출	gemini-3.1-flash-lite-preview	속도 2.5×, 버그 미해당 영역
멀티스텝 function calling / 에이전트	관망 또는 gemini-2.5-flash	조기 종료 버그 미해결 상태
비용 최우선, 대용량 출력	gemini-2.5-flash-lite (안정화)	AI Studio·Vertex AI 모두 7월 22일까지 사용 가능
기업 플랜 Vertex AI 사용	기한 7월 22일, 현행 유지 가능	이번 종료 공지 비해당 영역

특히 비용 최우선이라면 안정화 버전인 gemini-2.5-flash-lite를 아직 7월 22일까지 쓸 수 있습니다.
입력 $0.10, 출력 $0.40 — 가격은 프리뷰와 동일합니다.
(출처: Google Gemini API 공식 가격 페이지 — Gemini 2.5 Flash-Lite 항목, 2026.03 기준)

3월 31일이 지나도 4개월의 시간이 더 있는 셈입니다. 급하게 3.1로 갈아타지 않아도 됩니다.

▲ 목차로 돌아가기

Q&A

Q1. 3월 31일에 API 호출이 바로 실패하나요?

모델 ID를 명시적으로 gemini-2.5-flash-lite-preview-09-2025로 고정해 쓰고 있다면 3월 31일 이후 호출이 실패합니다.
반면 gemini-flash-latest 앨리어스를 쓰고 있다면 실패 없이 자동으로 3.1 Flash-Lite Preview로 전환되지만, 가격과 응답 품질이 달라질 수 있습니다.

Q2. Vertex AI에서도 3월 31일에 종료되나요?

아닙니다. 이번 종료 공지는 Gemini API와 Google AI Studio에만 해당합니다.
Vertex AI의 안정화 버전 gemini-2.5-flash-lite는 2026년 7월 22일까지 유효합니다.
(출처: Google Vertex AI 모델 버전 및 수명 주기 페이지)

Q3. 3.1 Flash-Lite Preview가 진짜 더 좋은 모델인가요?

벤치마크 기준으로는 GPQA Diamond 86.9%, MMMU Pro 76.8%로 이전 2.5 Flash-Lite보다 높습니다.
응답 속도도 2.5배 빠릅니다.
다만 멀티스텝 도구 사용 시 조기 종료 버그가 보고된 상태이고, 가격은 최대 3.75배 올랐습니다.
성능이 올라간 건 맞지만, 모든 워크로드에서 더 나은 선택인지는 별개입니다.
(출처: blog.google, 2026.03.03 / Artificial Analysis 벤치마크)

Q4. 비용을 최소화하면서 버티는 방법이 있나요?

안정화 버전 gemini-2.5-flash-lite를 쓰면 됩니다. 가격은 프리뷰 버전과 동일한 입력 $0.10, 출력 $0.40이고, 2026년 7월 22일까지 운영됩니다.
AI Studio와 Vertex AI 모두 지원됩니다. 사실상 같은 가격에 4개월을 더 벌 수 있습니다.

Q5. 이번 종료 공지를 공식 문서에서 직접 확인하려면 어디를 봐야 하나요?

ai.google.dev/gemini-api/docs/deprecations에서 모든 모델의 종료 일정을 확인할 수 있습니다.
Changelog는 ai.google.dev/gemini-api/docs/changelog에 날짜순으로 정리돼 있습니다.
Vertex AI 수명 주기는 별도로 cloud.google.com/vertex-ai에서 확인해야 합니다.

▲ 목차로 돌아가기

마치며

솔직히 말하면, 이번 공지에서 제일 불편한 부분은 가격 인상보다 커뮤니케이션 방식입니다.
이메일 공지가 개발자에 따라 늦게 도달했고, 공식 지원 중단 페이지에도 상당 기간 3월 31일 날짜가 명확히 표기되지 않았습니다.

3.1 Flash-Lite가 더 좋은 모델인 건 맞습니다. 벤치마크도 올랐고 속도도 빨라졌습니다.
그런데 지금 프리뷰 단계에서 멀티스텝 버그가 있고, 가격은 기존보다 최대 3.75배 높고, Vertex AI와 Gemini API 간 종료 기준이 달라 혼란도 있습니다.

결론부터 말씀드리면, 급하게 전환하기 전에 세 가지만 확인하면 됩니다.
어떤 모델 ID를 쓰는지, -latest 앨리어스인지 고정 버전인지, 그리고 Gemini API인지 Vertex AI인지.
이 세 가지에 따라 3월 31일이 당장의 문제일 수도 있고, 7월까지 여유가 있을 수도 있습니다.

📌 본 포스팅 참고 자료

※ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Gemini API 모델 종료 일정, 가격, 기능은 Google의 정책에 따라 언제든지 달라질 수 있으며, 최신 내용은 반드시 공식 문서에서 직접 확인하시기 바랍니다. 본 내용은 2026년 3월 21일 기준으로 작성된 정보입니다.

Gemini 3.1 Flash-Lite, Gemini API, Gemini API 마이그레이션, Gemini 모델 종료, Google AI Studio

Gemini 2.5 Flash-Lite 종료, 3월 31일이 전부가 아닙니다

Gemini 2.5 Flash-Lite 종료,
3월 31일이 전부가 아닙니다

종료 대상이 정확히 어떤 모델인가

-latest 앨리어스를 쓰고 있다면 지금 바로 확인해야 합니다

비용 충격: 입력 2.5배, 출력 3.75배

Vertex AI 쓰면 3월 31일 관계없습니다

3.1 Flash-Lite에서 지금 확인된 버그

대체 모델 선택 기준: 상황별 정리

Q&A

마치며

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

Gemini 2.5 Flash-Lite 종료, 3월 31일이 전부가 아닙니다

종료 대상이 정확히 어떤 모델인가

-latest 앨리어스를 쓰고 있다면 지금 바로 확인해야 합니다

비용 충격: 입력 2.5배, 출력 3.75배

Vertex AI 쓰면 3월 31일 관계없습니다

3.1 Flash-Lite에서 지금 확인된 버그

대체 모델 선택 기준: 상황별 정리

Q&A

마치며

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기