Gemini 2.5 Flash-Lite 종료, 3월 31일 전에 볼 수치가 있습니다

Published on

in

Gemini 2.5 Flash-Lite 종료, 3월 31일 전에 볼 수치가 있습니다

2026.03.22 기준
gemini-2.5-flash-lite-preview-09-2025 기준

Gemini 2.5 Flash-Lite 종료, 3월 31일 전에 볼 수치가 있습니다

2026년 3월 31일, gemini-2.5-flash-lite-preview-09-2025가 완전히 꺼집니다. 그런데 막상 Google 공식 문서를 열어보면 상황이 생각보다 복잡합니다. GA 버전은 따로 살아있고, 오디오 가격은 Preview 때보다 오히려 40% 낮아졌습니다. “그냥 종료되는 거 아니었어?” 싶었던 분들을 위해 공식 수치만 추려 정리했습니다.

종료 날짜
2026.03.31
GA 버전 유지 기간
~2026.07.22
오디오 가격 변화
40% 인하

종료되는 건 ‘Preview’뿐 — GA 버전은 별도입니다

대부분 “Gemini 2.5 Flash-Lite 종료”라는 말을 들으면 이 모델 자체가 사라지는 것으로 이해합니다. 그런데 Google 공식 지원 중단 페이지를 열어보면 이야기가 다릅니다. 종료되는 건 gemini-2.5-flash-lite-preview-09-2025 — 2025년 9월 25일에 출시된 Preview 버전입니다. GA(정식) 버전인 gemini-2.5-flash-lite는 2026년 7월 22일까지 그대로 유지됩니다.

💡 공식 종료 일정 비교 (Google 공식 문서, 2026.03.11 업데이트 기준)
모델 ID 출시일 종료일
gemini-2.5-flash-lite-preview-09-2025 2025.09.25 2026.03.31 ❌
gemini-2.5-flash-lite 2025.07.22 2026.07.22 ✅

(출처: Google AI for Developers — Gemini 지원 중단 공식 페이지, 2026.03.11 업데이트)

이 두 개를 같은 모델로 보는 경우가 많은데, 실제로는 완전히 별개 엔드포인트입니다. Preview는 사라지고 GA는 남는 구조라는 점 — 이것만 알아도 대응 방향이 달라집니다.

▲ 목차로 돌아가기

Preview에서 GA로 넘어가면 뭐가 달라지나요

솔직히 말하면, 가격 구조는 거의 같습니다. GA 버전의 공식 가격은 입력 토큰 100만 개당 $0.10, 출력 토큰 100만 개당 $0.40입니다. Preview(`gemini-2.5-flash-lite-preview-09-2025`) 시절과 동일한 수준입니다. (출처: Gemini API 공식 가격 페이지)

그런데 GA 전환 시 달라지는 것들도 있습니다. Google이 공식 블로그에 명확히 적어 둔 부분입니다. 먼저 1M 토큰 컨텍스트 윈도우, 제어 가능한 사고 예산(Thinking Budget), Google 검색 그라운딩, 코드 실행, URL 컨텍스트가 정식 지원으로 확정됩니다. Preview 단계에서는 기능과 동작이 언제든 바뀔 수 있었지만, GA부터는 지원 수명 주기가 명시적으로 고정됩니다. 서비스 안정성 관점에서 실제로 의미 있는 차이입니다.

📌 Preview → GA 전환 시 주요 변화 요약
  • 가격: 입력 $0.10/M, 출력 $0.40/M — Preview와 동일 유지
  • 오디오 입력 가격: Preview 대비 40% 인하 (Google 공식 블로그, 2025.07.22)
  • 지원 기간: 명시적 종료일 2026.07.22로 확정 (→ 예측 가능한 운영 가능)
  • 기능 안정성: API 인터페이스·동작 변경 없이 사용 가능
  • Google 검색 그라운딩: 정식 지원으로 전환 (RPD 한도 내 무료)

▲ 목차로 돌아가기

오디오 가격이 오히려 내려간 이유

“종료”라는 단어가 붙으면 자연스럽게 불리해진다고 생각하기 쉽습니다. 그런데 GA 전환 공식 발표문을 보면 오히려 반대인 항목이 하나 있습니다. Google이 2025년 7월 22일 공식 블로그에서 직접 밝힌 내용입니다.

“오디오 입력 가격을 미리보기 버전 출시 때보다 40% 낮췄습니다.

(출처: Google Developers 공식 블로그, 2025.07.22)

오디오 처리 비용이 높다는 이유로 Flash-Lite 대신 텍스트 전용 파이프라인을 유지한 팀이라면, GA 이후의 가격표를 다시 확인해 볼 시점입니다. 오디오 입력 가격이 40% 낮아졌다는 건, 동일한 오디오 처리 워크로드의 비용이 Preview 대비 자동으로 줄어든다는 뜻입니다.

💡 공식 발표문과 실제 운영 흐름을 나란히 놓고 보니 이런 차이가 보였습니다

Preview 종료가 ‘비용 상승’으로 이어진다고 보는 시각이 있지만, 실제로는 오디오 처리 비용이 내려가는 항목이 GA에 포함되어 있습니다. 오디오 워크로드 비중이 높은 서비스라면 오히려 GA 전환이 이득입니다.

▲ 목차로 돌아가기

대체 모델로 3.1 Flash-Lite를 바로 쓰면 되는 게 아닌 상황

공식 종료 페이지에는 gemini-2.5-flash-lite-preview-09-2025의 권장 교체 모델로 gemini-3.1-flash-lite-preview가 명시되어 있습니다. 3.1 Flash-Lite는 2026년 3월 3일 출시된 신형 경량 모델로, 공식 수치 기준 출력 속도가 약 380 tokens/s에 달하고 첫 토큰 응답이 2.5 Flash 대비 2.5배 빠릅니다. 성능 면에서는 확실히 올라갔습니다.

문제는 3.1 Flash-Lite가 아직 Preview 상태라는 점입니다. Preview 모델은 API 인터페이스와 동작이 언제든 바뀔 수 있고, 별도 종료 예고 없이 바뀐 사례가 2025년에 여러 번 있었습니다. 실제로 Reddit r/Bard에서는 3.1 Pro Preview가 자주 503 에러를 내뱉는다는 불만이 3월 초에 집중됐습니다. 프로덕션 워크로드에 Preview 모델을 바로 붙이는 건 다른 리스크를 새로 짊어지는 셈입니다.

⚠️ 3.1 Flash-Lite Preview 전환 시 주의할 점
  • 현재 Preview 단계 → 종료 예고 없이 API 변경 가능
  • 입력 가격 $0.25/M — 2.5 Flash-Lite GA($0.10/M) 대비 2.5배 높음
  • 출력 가격 $1.50/M — GA($0.40/M) 대비 3.75배 높음
  • Thinking Mode 지원은 장점이지만, 사용량에 따라 예산 초과 위험

즉, 3월 31일 이후의 “안전한 교체”는 GA 버전인 gemini-2.5-flash-lite로 먼저 넘어가는 것이고, 3.1 Preview는 기능 테스트 목적으로만 병행하는 게 현실적인 접근입니다.

▲ 목차로 돌아가기

코드를 실제로 어떻게 바꾸면 되는가

Google 공식 블로그에는 전환 방법이 명확하게 나와 있습니다. 코드에서 모델 ID 한 줄만 바꾸면 됩니다.

# 기존 코드 (2026.03.31 이후 오류 발생)
model = "gemini-2.5-flash-lite-preview-09-2025"
# 교체 코드 (GA 버전 — 2026.07.22까지 유효)
model = "gemini-2.5-flash-lite"

Google 공식 블로그 발표문(2025.07.22)에 “미리보기 버전을 사용하고 있는 경우 동일한 기본 모델인 gemini-2.5-flash-lite로 전환할 수 있습니다”라고 명시되어 있습니다. 기능 스펙, 컨텍스트 윈도우(1M), 출력 한도(65,535 토큰)는 GA 버전에서 동일하게 유지됩니다. 추가적인 파라미터 수정이 없어도 동작이 그대로 이어지는 구조입니다.

Firebase AI Logic를 쓰는 경우는 다릅니다. Firebase 공식 FAQ에 따르면 gemini-2.0-flash, gemini-2.0-flash-lite도 2026년 3월 31일에 동시 종료됩니다. Firebase SDK를 쓰는 앱은 모델 ID 교체와 별도로 SDK 자체 업데이트도 함께 확인해야 합니다.

▲ 목차로 돌아가기

3.1 Flash-Lite Preview와 수치로 비교했더니

공식 권장 교체 모델인 3.1 Flash-Lite Preview를 선택지에 넣었을 때, 실제로 어떤 차이가 있는지 수치로 확인했습니다. Artificial Analysis 벤치마크 데이터와 Google 공식 API 가격 페이지를 함께 놓으면 이런 표가 나옵니다.

항목 2.5 Flash-Lite (GA) 3.1 Flash-Lite (Preview)
입력 가격 $0.10/M $0.25/M
출력 가격 $0.40/M $1.50/M
출력 속도 약 249 tok/s 약 380 tok/s ⚡
컨텍스트 윈도우 1M 토큰 1M 토큰
Thinking Mode ✅ 지원 ✅ 지원
모델 상태 GA (정식) Preview (불안정 가능)
지원 종료일 2026.07.22 미정

(출처: Gemini API 공식 가격 페이지, Artificial Analysis 벤치마크 데이터 기준 — 2026.03 기준)

3.1 Flash-Lite Preview는 2.5 GA 대비 입력이 2.5배, 출력이 3.75배 비쌉니다. 대신 속도는 약 53% 빠릅니다. 트래픽 규모가 크고 응답 속도가 곧 매출과 연결되는 서비스라면 3.1 Preview가 합리적인 선택일 수 있습니다. 하지만 비용이 민감한 배치 작업이나 분류·번역 워크로드라면, 2.5 GA가 3월 31일 이후에도 넉 달 더 유지된다는 점이 훨씬 현실적인 선택지입니다.

💡 두 버전을 실제 비용으로 계산해보면

월 5억 토큰 입력 처리 기준으로 단순 계산하면, 2.5 GA는 $50, 3.1 Preview는 $125입니다. 월 $75 차이가 납니다. 속도 차이가 이 비용을 정당화하는지는 워크로드 성격에 따라 다릅니다.

▲ 목차로 돌아가기

Q&A — 자주 나오는 질문 5가지

Q1. 3월 31일 이후에도 gemini-2.5-flash-lite-preview-09-2025를 호출하면 어떻게 되나요?

API 엔드포인트가 완전히 꺼집니다. Google 공식 문서에 “모델이 ‘종료’되면 완전히 꺼지고 엔드포인트를 더 이상 사용할 수 없습니다”라고 나옵니다. 호출 시 오류가 반환되며, 서비스에 직접 영향을 줍니다. 3월 31일 전에 모델 ID를 교체하는 작업을 마쳐야 합니다.

Q2. GA 버전으로 바꾸면 응답 품질에 차이가 생기나요?

공식적으로는 같은 기반 모델입니다. Google 블로그에서 “미리보기 버전을 사용하고 있는 경우 동일한 기본 모델인 gemini-2.5-flash-lite로 전환할 수 있습니다”라고 명시했습니다. 단, 응답의 미세한 차이는 모델 서빙 환경에 따라 발생할 수 있으며, 이유는 공식 문서에서 별도로 밝히지 않았습니다. 중요 워크로드라면 전환 후 기존 테스트 케이스를 재검증하는 게 안전합니다.

Q3. Firebase AI Logic SDK를 쓰는 경우 추가로 해야 할 작업이 있나요?

있습니다. Firebase 공식 FAQ에 따르면 gemini-2.0-flash, gemini-2.0-flash-lite 계열도 2026년 3월 31일에 동시 종료됩니다. Firebase AI Logic SDK를 사용 중이라면 모델 ID 교체와 함께 SDK 버전 업데이트 여부도 확인해야 합니다. 특히 Android 및 Apple 플랫폼에서는 SDK 업데이트 없이 신규 모델 호출이 제한될 수 있습니다.

Q4. Vertex AI에서 쓰는 경우도 3월 31일에 영향을 받나요?

Vertex AI의 gemini-2.5-flash-lite(GA) 종료일은 2026년 7월 22일로 Gemini API와 동일합니다. 단, Vertex AI에는 별도 모델 수명 주기 페이지가 존재하므로, 사용 중인 리전과 모델 ID를 Google Cloud Vertex AI 공식 문서에서 직접 확인하는 것이 권장됩니다.

Q5. 지금 2.5 GA로 바꿨다가 나중에 다시 3.1 Preview로 올려타는 게 가능한가요?

가능합니다. 모델 ID만 바꾸면 됩니다. 다만 3.1 Flash-Lite Preview는 현재 Preview 단계이므로, 언제든 인터페이스 변경이나 종료 예고가 올 수 있습니다. 업그레이드 타이밍은 3.1 Flash-Lite가 GA로 전환되는 시점을 기다렸다가 결정하는 것이 가장 안전한 접근입니다.

▲ 목차로 돌아가기

마치며 — 총평

“Gemini 2.5 Flash-Lite 종료”는 말이 그렇게 들릴 뿐, 실제로는 Preview 수명 주기의 정상적 마감입니다. GA 버전은 7월 말까지 유지되고, 오디오 가격은 오히려 낮아졌습니다. 막상 공식 문서를 열어보면 패닉할 상황이 아니라는 게 바로 보입니다.

정리하면 이렇습니다. 3월 31일 전에 모델 ID 하나만 바꾸면 됩니다. 비용이 우선이라면 2.5 GA를 유지하는 게 맞고, 속도가 우선이라면 3.1 Preview를 병행 테스트하면서 GA 전환을 기다리는 게 현실적입니다. 공식 종료 일정은 언제든 바뀔 수 있으니, 공식 지원 중단 페이지를 북마크해 두는 게 가장 확실한 대비입니다.

핵심 요약
  • 3월 31일 종료 대상: gemini-2.5-flash-lite-preview-09-2025 만 해당
  • 당장 교체 방법: 모델 ID를 gemini-2.5-flash-lite로 변경
  • GA 버전 유효 기간: 2026년 7월 22일까지
  • 3.1 Preview 선택 시: 비용 2.5배 상승 — 워크로드 성격 먼저 확인
  • Firebase 사용자: SDK 업데이트 별도 확인 필수

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. Google AI for Developers — Gemini API 지원 중단 공식 페이지 (2026.03.11 업데이트)
  2. Google Developers 공식 블로그 — Gemini 2.5 Flash-Lite GA 출시 발표 (2025.07.22)
  3. Gemini API 공식 가격 페이지
  4. Firebase AI Logic SDK 공식 FAQ
  5. Gemini API 공식 릴리스 노트 (Changelog)

본 포스팅은 2026년 3월 22일 기준 Google 공식 문서 및 발표 자료를 바탕으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 정확한 종료 일정 및 가격은 반드시 Google 공식 지원 중단 페이지에서 최신 정보를 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기