Gemini 2.5 Flash-Lite 종료, 내일인데 잘못 알고 있는 게 있습니다

Published on

in

Gemini 2.5 Flash-Lite 종료, 내일인데 잘못 알고 있는 게 있습니다

2026.03.30 기준 / gemini-2.5-flash-lite-preview-09-2025 기준

내일(3월 31일), gemini-2.5-flash-lite-preview-09-2025가 공식 종료됩니다. 그런데 “Gemini 2.5 Flash-Lite가 없어진다”고 이해하고 계신다면 그건 다릅니다. 종료되는 건 preview 버전 하나이고, 이 두 가지를 구분하지 못하면 멀쩡한 서비스를 불필요하게 마이그레이션하거나, 반대로 진짜 끊길 API를 그냥 두는 상황이 생깁니다.

🔴 종료 D-day: 2026.03.31
✅ GA 버전 종료: 2026.07.22
📋 교체 권장: gemini-3.1-flash-lite-preview

종료되는 건 ‘preview’ 딱 하나입니다

지금 종료 공지를 보고 당황하신 분들이 많은데, 먼저 모델 ID를 정확히 짚어야 합니다. 내일 종료되는 건 gemini-2.5-flash-lite-preview-09-2025이고, gemini-2.5-flash-lite(GA 버전)는 2026년 7월 22일까지 유효합니다.

💡 공식 지원 중단 페이지에서 두 모델의 종료일을 같이 놓고 보니 이런 차이가 있었습니다.

모델 ID 구분 종료일
gemini-2.5-flash-lite-preview-09-2025 Preview 2026.03.31 🔴
gemini-2.5-flash-lite GA (정식) 2026.07.22 ✅

(출처: Google AI for Developers 공식 지원 중단 페이지, 2026.03.26 최종 업데이트)

코드에서 모델 ID를 어떻게 설정해뒀느냐에 따라 내일 실제로 영향 받는지 여부가 갈립니다. “Flash-Lite 쓰고 있다”는 이유만으로 무조건 마이그레이션하는 건 오히려 불필요한 작업입니다.

▲ 목차로 돌아가기

실제로 영향 받는 경우 vs 받지 않는 경우

내 코드나 서비스가 어떤 모델 ID를 호출하고 있는지 먼저 확인해야 합니다. 아래 세 가지 상황 중 어디에 해당하는지 짚어 보면 됩니다.

🔴 내일 API 호출이 막히는 경우

코드에 gemini-2.5-flash-lite-preview-09-2025 를 하드코딩해서 사용 중인 경우. 이 ID를 직접 입력한 적 있다면 오늘 안에 변경해야 합니다.

✅ 영향 없는 경우 ①

gemini-2.5-flash-lite (날짜 없는 GA 버전) 또는 gemini-flash-lite-latest 형태의 alias를 쓰고 있는 경우. 7월 22일까지 그대로 사용 가능합니다.

✅ 영향 없는 경우 ②

Google AI Studio 앱이나 Gemini 앱 화면에서 직접 사용하는 경우. API 모델 ID 종료는 API 키 기반 호출에만 해당됩니다. 앱 사용자는 별도 조치 불필요합니다.

실제 프로젝트 코드 기준으로 grep 또는 IDE 전체 검색에서 preview-09-2025 문자열을 찾아보는 게 가장 빠릅니다.

▲ 목차로 돌아가기

교체 모델 가격이 2.5배 올랐습니다 — 그래도 바꿔야 할까요

구글 공식 지원 중단 페이지가 권장하는 교체 모델은 gemini-3.1-flash-lite-preview입니다. 그런데 가격표를 보면 잠깐 멈추게 됩니다.

💡 공식 가격 문서에 나온 수치를 같이 보니 단순 업그레이드가 아닙니다.

모델 입력 $/1M 출력 $/1M 출력 속도(tok/s)
2.5 Flash-Lite Dynamic $0.10 $0.40 366
3.1 Flash-Lite High $0.25 $1.50 363

(출처: Gemini 3.1 Flash-Lite Model Card, Google DeepMind, 2026.03)

입력 토큰 가격이 $0.10 → $0.25로 2.5배, 출력은 $0.40 → $1.50으로 3.75배 오릅니다. 대량 호출 환경에서는 무시할 수 없는 차이입니다. 월 1억 토큰 입력 기준으로 계산하면, 비용이 $10에서 $25로 $15 증가합니다.

단, 출력 속도는 363 tok/s vs 366 tok/s로 사실상 동일합니다. “더 비싼 모델이니까 느리겠지”라는 예상과 달리, 레이턴시 측면에서는 거의 손해가 없습니다. 비용 증가분을 감수할 수 있는 서비스라면 성능 이득이 꽤 큽니다.

▲ 목차로 돌아가기

3.1 Flash-Lite의 실제 성능 — 공식 벤치마크 직접 확인했습니다

비용이 오른 만큼 성능이 따라오는지가 핵심입니다. Google DeepMind가 공개한 3월 기준 벤치마크를 보면, 단순한 버전업이 아님을 알 수 있습니다.

💡 공식 Model Card와 가격 문서를 교차해서 보니 같은 ‘Lite’ 등급이지만 성능 격차가 생각보다 큽니다.

벤치마크 2.5 Flash-Lite 3.1 Flash-Lite
GPQA Diamond (과학 지식) 66.7% 86.9% 🔺
MMMU-Pro (멀티모달 추론) 51.0% 76.8% 🔺
MMMLU (다국어 Q&A) 84.5% 88.9% 🔺
SimpleQA (지식 정확도) 11.5% 43.3% 🔺

(출처: Gemini 3.1 Flash-Lite Model Card, Google DeepMind, 2026.03)

GPQA Diamond에서 66.7% → 86.9%, 즉 절대값으로 20%p 이상 상승했습니다. 특히 SimpleQA 정확도가 11.5% → 43.3%로 4배 가까이 오른 건, 할루시네이션이 많이 줄었다는 신호입니다.

그런데 한 가지 주목할 부분이 있습니다. 3.1 Flash-Lite는 Gemini 3 Pro를 기반으로 distill된 모델입니다. “Flash-Lite는 작고 단순한 모델”이라는 통념과 달리, 아키텍처의 뿌리는 구글의 현재 최고 플래그십 모델입니다. 비용 대비 성능이 이전보다 좋아진 이유가 여기서 나옵니다. (출처: Gemini 3.1 Flash-Lite Model Card, Google DeepMind, 2026.03)

▲ 목차로 돌아가기

현재 Gemini API 사용자라면 두 개의 종료 일정이 동시에 앞에 있습니다. 내일 3월 31일과 6월 1일, 각각 영향받는 대상이 다릅니다.

⏰ 2026.03.31 (내일) — 오늘 바로 확인 필요

종료 대상: gemini-2.5-flash-lite-preview-09-2025
이 ID를 직접 호출하고 있는 경우만 해당. 교체 권장 모델: gemini-3.1-flash-lite-preview

⏰ 2026.06.01 — 이쪽이 더 광범위

종료 대상: gemini-2.0-flash, gemini-2.0-flash-001, gemini-2.0-flash-lite, gemini-2.0-flash-lite-001

솔직히 말하면, 내일 3월 31일 종료보다 6월 1일 Gemini 2.0 Flash 종료가 훨씬 더 많은 사람에게 영향을 줍니다. Gemini 2.0 Flash는 2025년 초부터 가장 많이 쓰인 API 모델이기 때문입니다. 지금 당장 내일 것만 처리하고 6월 일정을 달력에 미리 표시해 두는 것을 권합니다. (출처: Gemini API 공식 지원 중단 페이지, 2026.01.22 공지)

▲ 목차로 돌아가기

마이그레이션 전에 반드시 확인할 것 2가지

모델 ID를 바꾸기 전에 두 가지를 먼저 확인하지 않으면, 마이그레이션 후 서비스가 다르게 동작할 수 있습니다.

01

thinking 모드 설정이 달라졌습니다

3.1 Flash-Lite는 thinking 예산 설정을 지원합니다. 기존 2.5 Flash-Lite preview는 thinking이 기본적으로 Dynamic(자동) 모드였는데, 3.1 쪽은 High/Medium/Low/Off를 명시할 수 있습니다. 비용 제어를 위해 thinking_budget 파라미터를 함께 설정하는 게 좋습니다.

02

응답 형식이 더 상세해질 수 있습니다

성능이 올라간 만큼 응답 길이와 디테일 수준이 달라지는 경우가 있습니다. 특히 출력 형식을 JSON이나 특정 구조로 파싱하는 파이프라인이라면, 마이그레이션 후 스테이징 환경에서 최소 100건 이상 샘플 테스트를 먼저 돌려보는 게 안전합니다.

⚠️ 참고 — 3.1 Flash-Lite preview는 아직 프리뷰 단계입니다. 프리뷰 모델은 정식(GA) 대비 SLA 보장이 다를 수 있으며, 종료 일정이 별도로 발표될 수 있습니다. 현재 공식 문서에서는 종료 날짜가 발표되지 않은 상태입니다.

▲ 목차로 돌아가기

Q&A

Q1. 지금 AI Studio에서 gemini-2.5-flash-lite-preview-09-2025를 쓰고 있는데 내일 자동으로 전환되나요?
자동 전환은 되지 않습니다. API 호출이 그냥 막히는 방식입니다. 내일 이후 해당 모델 ID로 호출하면 에러가 반환됩니다. 미리 코드에서 모델 ID를 바꿔놓아야 합니다.
Q2. gemini-2.5-flash-lite (날짜 없는 버전)를 쓰면 7월 22일까지 문제없이 쓸 수 있나요?
그렇습니다. 공식 지원 중단 페이지 기준 gemini-2.5-flash-lite(GA)의 종료일은 2026년 7월 22일입니다. 3월 31일 종료와는 무관합니다.
Q3. 교체 모델인 gemini-3.1-flash-lite-preview도 언제 종료될지 모르는 거 아닌가요?
맞습니다. 현재 공식 문서에서 gemini-3.1-flash-lite-preview의 종료 날짜는 발표되지 않은 상태입니다. 프리뷰 모델 특성상 추후 GA 모델이 출시되면 교체 공지가 올 가능성이 있습니다. 중요한 프로덕션 환경이라면 GA 버전이 나올 때 한 번 더 검토하는 게 안전합니다.
Q4. 무료 티어(Free Tier)에서도 3.1 Flash-Lite를 쓸 수 있나요?
네, 가능합니다. 공식 가격 문서 기준으로 gemini-3.1-flash-lite-preview는 무료 티어(Free Tier) 조건 하에 사용 가능합니다. 다만 무료 티어에서는 분당 요청 수(RPM) 제한이 유료 플랜보다 낮으므로, 대량 호출 서비스는 유료 전환 후 사용하는 게 안정적입니다.
Q5. 마이그레이션할 여유가 없는데, 6월까지 그냥 gemini-2.5-flash-lite로 버텨도 되나요?
코드에서 gemini-2.5-flash-lite (날짜 없는 GA 버전)를 쓰고 있다면, 7월 22일까지는 문제없습니다. 단, 7월 22일 이전에 한 번 더 마이그레이션이 필요합니다. 일정을 미리 잡아두는 게 좋습니다.

▲ 목차로 돌아가기

마치며

정리하면, 내일 종료되는 건 preview 버전 하나고 GA 버전은 7월까지 살아있습니다. 교체 모델(3.1 Flash-Lite)은 가격이 2.5~3.75배 올랐지만, GPQA Diamond 기준 20%p 이상 성능이 올라간 모델입니다. 비용 증가가 부담스럽다면 GA 버전으로 잠시 버티는 것도 선택지입니다.

더 중요한 건 6월 1일 Gemini 2.0 Flash 종료입니다. 영향받는 사람 수로 따지면 내일 종료보다 훨씬 크고, 아직 대비 글이 거의 없는 상황입니다. 오늘 내일 것만 처리하고 6월 일정도 달력에 같이 표시해 두시길 권합니다.

막상 확인해 보면 대부분 간단히 모델 ID 하나 바꾸는 작업이라 5분이면 끝납니다. 서비스가 갑자기 에러를 토해낸 다음에 급하게 처리하는 것보다, 지금 5분 투자하는 게 훨씬 낫습니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. Google AI for Developers — Gemini 지원 중단 공식 페이지
    https://ai.google.dev/gemini-api/docs/deprecations?hl=ko
  2. Google DeepMind — Gemini 3.1 Flash-Lite Model Card (2026.03)
    https://deepmind.google/models/model-cards/gemini-3-1-flash-lite/
  3. Google AI for Developers — Gemini API 가격 책정 공식 문서
    https://ai.google.dev/gemini-api/docs/pricing?hl=ko
  4. Google AI for Developers — Gemini API 출시 노트
    https://ai.google.dev/gemini-api/docs/changelog?hl=ko

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다.

댓글 남기기


최신 글

  • 청약통장 납입회차 확인 2026, 인정금액 체크
    청약통장 납입회차 확인 2026 기준으로 가입일과 회차, 인정 회차, 납입 인정금액 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 토지이용계획확인원 열람 2026, 매수 전 제한 확인
    토지이용계획확인원 열람 2026 기준으로 정확한 필지, 건축 가능성, 개발제한·보전 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 조상땅찾기 온라인 조회 2026, 상속 토지 확인
    조상땅찾기 온라인 조회 2026 기준으로 가족관계 증빙, 성명·주민번호 등, 지번과 면적 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 안심상속 원스톱 서비스 2026, 재산조회 신청 순서
    안심상속 원스톱 서비스 2026 기준으로 신청 가능 가족, 금융·토지·차량, 상속포기 기한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 전입세대확인서 열람 2026, 계약 전 주소 확인
    전입세대확인서 열람 2026 기준으로 주소와 동·호수, 기존 전입 여부, 등기부·확정일자 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 휴대폰 명의도용 신고 2026, 개통 내역 확인
    휴대폰 명의도용 신고 2026 기준으로 모르는 회선, 최근 인증·개통 문자, 통신사와 번호 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 카드 분실신고 재발급 2026, 자동이체 누락 체크
    카드 분실신고 재발급 2026 기준으로 카드 정지, 분실 전후 사용처, 새 카드 수령 전 결제 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 휴면보험금 조회 청구 2026, 내보험찾아줌 전 확인
    휴면보험금 조회 청구 2026 기준으로 보험금 종류, 계약자와 피보험자, 현재 담당 보험사 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 자동차 압류조회 해제 2026, 이전등록 전 체크
    자동차 압류조회 해제 2026 기준으로 압류·저당 표시, 기관과 금액, 반영 시점 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 자동차 의무보험 미가입 과태료 2026, 조회 전 확인
    자동차 의무보험 미가입 과태료 2026 기준으로 공백 발생일, 명의 이전일과 보험 시작일, 과태료 금액과 납부 기한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기