Gemini API 공식 문서 직접 확인
⚠ 종료일 혼선 주의
Gemini 2.0 Flash 종료, 6월 1일로 늘어난 이유
“3월 31일까지 마이그레이션하라”는 말이 온라인에 퍼져 있습니다. 그런데 오늘(2026년 3월 26일) 구글 공식 문서를 직접 열어보니 종료일이 2026년 6월 1일로 바뀌어 있습니다. 이 차이가 무엇을 의미하는지, 그리고 지금 당장 마이그레이션을 서둘러야 할지 아닌지, 수치를 놓고 판단해 봤습니다.
3월 31일이 아니라 6월 1일 — 공식 문서에서 확인
Gemini 2.0 Flash API 종료일을 두고 인터넷에서 혼선이 벌어지고 있습니다. 외부 블로그나 가이드 글 대부분이 “3월 31일이 마감”이라고 썼는데, 구글 공식 개발자 포럼에도 같은 질문이 올라올 만큼 혼란스러운 상황입니다.
💡 공식 발표문과 실제 종료 일정을 같이 놓고 보니 이런 차이가 보였습니다.
구글은 2026년 1월 23일 공식 X 계정(@patloeber)을 통해 “3월 31일”을 언급했습니다. 그런데 같은 달 공식 Gemini API 문서에서는 2월 18일자 로그로 종료일이 6월 1일로 수정됐습니다. 3월 31일 종료 예정이었던 건 일부 프리뷰 모델이고, GA 모델인 gemini-2.0-flash와 gemini-2.0-flash-lite의 종료일은 처음부터 6월 1일이었을 가능성이 높습니다. 구글이 두 개의 다른 일정을 동시에 공지한 셈입니다.
오늘(2026년 3월 26일) 기준으로 구글 공식 Deprecations 페이지(ai.google.dev/gemini-api/docs/deprecations)를 직접 확인하면, GA 모델인 gemini-2.0-flash와 gemini-2.0-flash-lite의 종료일은 2026년 6월 1일로 나와 있습니다. 이 페이지의 최종 업데이트 날짜는 2026년 3월 25일(UTC)로, 어제 기준 정보입니다.
반면 3월 31일에 실제로 종료되는 건 gemini-2.5-flash-lite-preview-09-2025라는 프리뷰 모델 하나입니다. (출처: Gemini API Release Notes, 2026.03.10)
종료 대상 4개 모델 정확히 짚기
구글이 공식 문서에서 밝힌 내용을 기준으로, 실제로 6월 1일에 종료되는 모델은 정확히 4개입니다. 구분이 중요한 이유는, gemini-2.0-flash라고 다 같은 게 아니기 때문입니다.
| 모델 ID | 출시일 | 종료일 | 권장 대체 모델 |
|---|---|---|---|
gemini-2.0-flash |
2025.02.05 | 2026.06.01 | gemini-2.5-flash |
gemini-2.0-flash-001 |
2025.02.05 | 2026.06.01 | gemini-2.5-flash |
gemini-2.0-flash-lite |
2025.02.25 | 2026.06.01 | gemini-2.5-flash-lite |
gemini-2.0-flash-lite-001 |
2025.02.25 | 2026.06.01 | gemini-2.5-flash-lite |
(출처: Gemini API Deprecations 공식 문서 — ai.google.dev/gemini-api/docs/deprecations, 2026.03.25 기준)
자동 별칭(auto-updated alias)인 gemini-2.0-flash와 gemini-2.0-flash-lite는 현재 Vertex AI에서 여전히 -001 버전을 가리키고 있습니다. 모델 이름을 하드코딩하지 않고 별칭을 쓰고 있다면, 6월 이후 자동 리다이렉션이 어떻게 처리되는지 구글 공식 문서를 별도로 확인하는 게 안전합니다.
가격 비교 — 최신 모델이 항상 저렴하지 않습니다
“최신 모델로 갈아타면 더 싸다”는 말을 당연하게 받아들이기 쉽습니다. 막상 숫자를 놓고 보면 상황이 다릅니다. 구글 공식 가격 페이지(ai.google.dev/gemini-api/docs/pricing) 기준으로 Gemini 2.0 Flash와 후속 모델들의 유료 티어 토큰 단가를 직접 비교해 봤습니다.
| 모델 | 입력 (텍스트/이미지/영상) |
출력 | 무료 티어 |
|---|---|---|---|
| Gemini 2.0 Flash (종료예정) | $0.10 / 1M | $0.40 / 1M | ✅ 무료 |
| Gemini 2.0 Flash-Lite (종료예정) | $0.075 / 1M | $0.30 / 1M | ✅ 무료 |
| Gemini 2.5 Flash (권장) | $0.30 / 1M | $2.50 / 1M | ✅ 무료 |
| Gemini 2.5 Flash-Lite | $0.10 / 1M | $0.40 / 1M | ✅ 무료 |
| Gemini 3.1 Flash-Lite Preview | $0.25 / 1M | $1.50 / 1M | ✅ 무료 |
(출처: Gemini API Pricing — ai.google.dev/gemini-api/docs/pricing, 2026.03.26 기준)
💡 가격 비교 수치를 나란히 놓고 보니, 놓치기 쉬운 지점이 보였습니다.
구글이 2.0 Flash의 후속으로 권장하는 Gemini 2.5 Flash의 유료 입력 단가는 $0.30/1M으로, 종료 예정인 Gemini 2.0 Flash($0.10/1M)보다 3배 비쌉니다. 사용량이 많은 프로덕션 서비스라면 비용 영향을 꼭 따져봐야 합니다. 가격만 놓고 보면 Gemini 2.5 Flash-Lite($0.10/1M)가 2.0 Flash와 동일한 단가를 유지하고 있어 저렴하게 이동하려면 2.5 Flash-Lite가 현실적인 선택입니다.
예를 들어 월 100억 토큰(입력 기준)을 사용하는 서비스라면, 2.0 Flash에서 2.5 Flash로 넘어갈 경우 월 비용이 약 $1,000에서 $3,000으로 뜁니다. 반면 2.5 Flash-Lite로 이동하면 비용 변화 없이 모델만 바뀝니다. 단, 2.5 Flash-Lite는 Context caching, Grounding with Google Search 지원이 2.0 Flash 대비 제한적이므로 기능 의존성을 먼저 확인해야 합니다.
마이그레이션 전략 — 상황별로 다릅니다
마이그레이션이라고 해서 전부 단순히 모델 이름 문자열 하나 교체로 끝나지 않습니다. 현재 사용 패턴에 따라 주의해야 할 지점이 달라집니다.
① 컨텍스트 캐싱을 쓰고 있다면
Gemini 2.0 Flash는 Context caching을 유료 티어에서 지원합니다. 2.5 Flash-Lite에서는 Context caching이 현재 지원되지 않습니다. (출처: Gemini API Pricing 페이지, 2026.03.26) 캐싱을 의존하는 긴 문서 처리 파이프라인이라면 2.5 Flash-Lite가 아닌 2.5 Flash로 이동해야 합니다. 비용이 더 올라가지만, 기능 연속성이 필요한 경우라면 선택지가 없습니다.
② Google 검색 그라운딩을 사용 중이라면
2.0 Flash는 Grounding with Google Search가 무료 티어에서도 하루 500 요청까지 지원됩니다. 2.5 Flash-Lite 역시 동일한 무료 한도를 제공합니다. 다만 2.5 Flash-Lite에서 검색 그라운딩의 구체적인 응답 품질 변화는 별도로 A/B 테스트가 필요합니다. 검색 결과를 핵심 로직으로 쓰는 서비스라면, 마이그레이션 후 최소 1주일간 품질 모니터링을 권장합니다.
③ 무료 티어 개인 프로젝트라면
무료 티어는 2.0 Flash, 2.5 Flash-Lite, 2.5 Flash 모두 무료입니다. 비용 걱정 없이 최신 모델로 테스트해보고 만족스러우면 전환하는 방식이 가장 위험이 적습니다. 6월 1일 전에 한 번 이상 2.5 Flash-Lite로 같은 프롬프트를 돌려보고 결과를 비교해두는 게 안전합니다.
서두르면 오히려 손해인 경우가 있습니다
3월 31일 공포 마케팅에 떠밀려 지금 당장 마이그레이션을 강행하는 게 반드시 좋은 선택은 아닙니다. 실제로 6월 1일까지는 약 67일의 유예 기간이 남아 있습니다.
💡 Gemini 3.1 Flash-Lite Preview는 아직 프리뷰 단계라, 종료일이 정해져 있지 않습니다.
구글 Deprecations 페이지를 보면 Gemini 3.1 Flash-Lite Preview(gemini-3.1-flash-lite-preview)의 종료일은 “종료일 미정(No retirement date announced)”으로 나와 있습니다. 프리뷰 모델은 성능이 GA 버전보다 불안정할 수 있고, 가격이나 기능이 정식 출시 전에 바뀔 수 있습니다. 프로덕션 환경에서는 GA 모델인 Gemini 2.5 Flash-Lite나 2.5 Flash가 더 안정적인 선택입니다.
또 한 가지 주의할 점이 있습니다. Gemini 2.5 Flash의 출력 토큰 가격은 $2.50/1M으로, thinking tokens(사고 토큰)을 포함한 수치입니다. 단순 텍스트 생성 작업에서 thinking mode를 켠 채 사용하면 예상보다 비용이 훨씬 올라갈 수 있습니다. 마이그레이션 후 초기에는 thinkingBudget: 0으로 사고 토큰을 비활성화해두고 비용부터 확인하는 게 실수를 줄이는 방법입니다.
⚠ 지금 당장 확인해야 할 한 가지:
코드베이스 내에 gemini-2.0-flash-exp를 사용하고 있다면 다릅니다. Experimental 버전들은 이미 종료됐거나 단계적으로 정리된 상태입니다. -001 버전(GA)인지, 실험적(-exp) 버전인지 먼저 확인이 필요합니다.
Q&A — 자주 묻는 5가지
마치며
Gemini 2.0 Flash 종료를 둘러싼 혼란의 핵심은 구글이 두 가지 다른 일정을 동시에 커뮤니케이션한 데 있습니다. 3월 31일은 프리뷰 모델 하나의 날짜였고, GA 모델들의 실제 종료일은 6월 1일입니다. 지금 당장 서비스를 바꿔야 할 만큼 긴박하지는 않습니다.
다만 비용 계획은 지금 세워두는 게 낫습니다. 2.5 Flash로 가면 입력 비용이 3배 오릅니다. 2.5 Flash-Lite는 동일 단가지만 Context caching이 없습니다. 본인 프로젝트에 어느 기능이 진짜 중요한지 먼저 정리하고, 그 다음에 모델 이름을 바꾸는 순서가 맞습니다.
개인 소견: 이번 사태를 보며 느낀 건, AI 서비스 사용자 입장에서 공식 문서를 직접 확인하는 습관이 점점 더 중요해지고 있다는 것입니다. 외부 블로그 가이드보다 구글 Deprecations 페이지 하나를 즐겨찾기 해두는 게 실질적으로 더 도움이 됩니다.
📋 본 포스팅 참고 자료
- Gemini API Deprecations (Google) — https://ai.google.dev/gemini-api/docs/deprecations
- Gemini API Release Notes / Changelog (Google) — https://ai.google.dev/gemini-api/docs/changelog
- Gemini API Pricing (Google) — https://ai.google.dev/gemini-api/docs/pricing
- Vertex AI Model Versions and Lifecycle (Google Cloud) — https://docs.cloud.google.com/vertex-ai/generative-ai/docs/learn/model-versions
- Gemini 2.0 Flash Discontinuation Date 커뮤니티 쓰레드 — https://discuss.ai.google.dev/t/gemini-2-0-flash-discontinuation-date/131389
본 포스팅은 2026년 3월 26일 기준 구글 Gemini API 공식 문서를 참고하여 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 공식 문서(ai.google.dev/gemini-api/docs/deprecations)를 최종 기준으로 삼아 주세요.

댓글 남기기