📅 2026.03.26 업데이트 기준 / Gemini 3.1 Flash Live (Preview)
결론부터 말씀드리면, Gemini Live 화면공유와 카메라 기능은 이제 무료 사용자도 쓸 수 있습니다.
그런데 막상 써보면 “무료라서 다 된다”와 “무료이지만 이 조건이 있다”는 완전히 다른 이야기입니다.
2026년 3월 26일 공개된 Gemini 3.1 Flash Live 이후 달라진 구체적인 수치와 조건을 직접 공식 문서에서 뽑아서 정리했습니다.
3.1 Flash Live 기준
공식 수치 검증
무료 전환이 정확히 언제, 어떻게 이뤄졌나
(출처: The Verge, 2025.04.16 / Engadget, 2025.05.20)
그리고 2026년 3월 26일, Google은 Gemini 3.1 Flash Live를 공식 발표하며 Gemini Live와 Search Live 전체를 이 모델로 업그레이드했습니다. 무료 사용자도 3.1 Flash Live 기반의 음성 대화, 화면공유, 카메라 기능을 그대로 쓸 수 있습니다.
(출처: Google Blog, 2026.03.26)
쉽게 말해 “무료인데 최신 모델 기반”인 상태입니다. 하지만 그렇다고 유료 요금제와 동일한 건 아닙니다.
3.1 Flash Live — Flash인데 왜 Pro 기반인가
💡 공식 발표문과 Model Card를 같이 놓고 보니 이름과 실제 구조 사이에 차이가 보였습니다.
“Flash”라는 이름 때문에 저사양 모델로 오해하기 쉬운데, 내부 구조는 다릅니다.
Google DeepMind가 2026년 3월 26일 공개한 공식 Model Card에는 이렇게 명시돼 있습니다. “Gemini 3.1 Flash Live is based on Gemini 3 Pro.” Flash라는 이름이 붙어 있지만, 기반 아키텍처는 Gemini 3 시리즈 중 최상위 모델인 Gemini 3 Pro입니다.
(출처: Google DeepMind Model Card, 2026.03.26)
일반적으로 “Flash” 계열은 경량·저비용 모델을 의미합니다. 그런데 3.1 Flash Live는 Gemini 3 Pro의 음성·멀티모달 처리를 실시간 스트리밍에 특화한 파생 모델입니다. 기반이 Pro급이라는 건 곧 추론 품질이 단순 Flash 모델보다 높다는 뜻이기도 합니다.
입력 토큰 컨텍스트 윈도우는 128K, 출력은 64K 토큰을 지원합니다. 텍스트·오디오·이미지·비디오 멀티모달 입력을 동시에 처리합니다.
(출처: Google DeepMind Model Card, 2026.03.26)
성능 수치, 직접 확인했습니다
Google이 공개한 벤치마크 수치는 세 가지입니다. 직접 검증 가능하도록 각 항목의 출처와 의미를 같이 표기했습니다.
| 벤치마크 | 3.1 Flash Live 점수 | 측정 주체 | 무슨 의미인가 |
|---|---|---|---|
| ComplexFuncBench Audio | 90.8% | ZAI / GitHub | 음성으로 복잡한 순서 있는 도구 호출을 90% 이상 성공 |
| BigBench Audio | – | Artificial Analysis | 음성 이해 5가지 영역(억양·소음·언어 등) 종합 평가 |
| Audio MultiChallenge | 36.1% | Scale AI | 실제 대화 잡음·끊김 속 복잡한 지시 따르기 — Thinking 모드 기준 |
ComplexFuncBench 90.8%라는 수치는 단순히 높다는 게 아니라, 이전 모델 대비 “가장 앞서는” 점수입니다. 공식 블로그에서 “leads with a score of 90.8%”라고 직접 표현했습니다.
(출처: Google Blog, 2026.03.26)
오디오 음성 품질에서 특이한 점은 배경 소음 필터링 성능이 이전 모델(2.5 Flash Native Audio)보다 명확히 개선됐다는 겁니다. 교통 소음이나 TV 소리가 있는 환경에서도 관련 음성만 걸러냅니다. 카페나 사무실에서 화면공유 중 대화하는 상황에 직접 관련이 있습니다.
무료 사용자가 실제로 마주하는 한계
화면공유·카메라 기능 자체는 무료로 열려 있습니다. 그런데 Gemini Live 음성 대화의 한도가 따로 존재한다는 건 많은 분들이 놓칩니다. Google 공식 지원 문서에 요금제별 한도가 이렇게 나옵니다.
(출처: Google 공식 지원 문서 — Gemini Apps limits & upgrades, 2026.04.02 확인)
| 기능 항목 | 무료(Basic) | AI Plus | AI Pro | AI Ultra |
|---|---|---|---|---|
| Gemini 3.1 Pro 모델 (하루) | 기본 접근 | 30회 | 100회 | 500회 |
| Thinking 모드 (하루) | 수시 변동 | 90회 | 300회 | 1,500회 |
| Screen Automation (하루) | 5회 | 12회 | 20회 | 120회 |
| 컨텍스트 윈도우 | 32K | 128K | 1M | 1M |
| Deep Research (월) | 5회 | 12회/일 | 20회/일 | 120회/일 |
무료 사용자의 컨텍스트 윈도우는 32K입니다. AI Pro 이상은 1M(100만 토큰)입니다. 단순 비교만 해도 31배 차이입니다. 긴 화면공유 세션에서 이전 대화 내용을 얼마나 기억하느냐가 바로 여기에 달려 있습니다.
또 하나, 공식 문서에 이런 문장이 있습니다. “Limits may change without notice, including due to capacity constraints. When there’s a large increase in activity, free users may be limited before users with a plan.” 트래픽이 몰리면 무료 사용자 한도가 먼저 줄어든다는 뜻입니다. 이유는 공식 문서에서 별도로 밝히지 않았습니다.
(출처: Google 공식 지원 문서, 2026.04.02 확인)
ChatGPT와 비용 구조가 어떻게 다른가
💡 API 원가 흐름을 같이 놓고 보니, “무료”가 실제로 어느 수준의 가치인지 가늠할 수 있었습니다.
개발자 커뮤니티에서 나온 실제 비용 분석 수치를 보면 맥락이 잡힙니다. 기존 음성 AI 에이전트 구축에 쓰이는 STT(Deepgram) + LLM(GPT-4o) + TTS(ElevenLabs) 스택의 분당 비용은 약 $0.06~$0.20 수준이었습니다. 3.1 Flash Live를 전례 모델(2.5 Flash Native Audio) 요금 기준으로 역산하면 분당 약 $0.025~$0.035 수준으로 추정됩니다. 기존 대비 약 85~90% 절감입니다. (단, 3.1 Flash Live의 공식 API 가격은 Preview 기간 중이라 아직 미공개 상태입니다. 이유는 공개되지 않았습니다.)
(출처: Reddit r/B2BSaaS, 2026.03.28 / 2.5 Flash Native Audio 공개 요금 기반 추정)
ChatGPT 음성 기능은 $200/월 Pro 요금제에서 실시간 화면 공유 기능을 제공합니다. Gemini Live는 무료 사용자도 동일한 기능을 쓸 수 있습니다. 기능 자체의 접근 비용 차이만 봐도 큽니다. 다만 ChatGPT Pro는 o3 추론 모델과 통합된다는 점에서 품질 비교는 단순하지 않습니다.
한 가지 더. 3.1 Flash Live는 Search Live와 동시에 출시됐고, 200개 이상 국가·지역에서 실시간 멀티모달 음성 검색을 무료로 지원합니다. 한국도 포함됩니다.
(출처: Google Blog, 2026.03.26)
공식 문서에서 발견한 숨겨진 조건들
공식 발표와 실제 사용 조건 사이에서 눈에 잘 안 띄는 부분이 세 가지 있습니다.
①
대화 맥락 2배 연장 — 단, 무료 컨텍스트 윈도우 안에서만
Google은 “대화를 2배 더 길게 따라갈 수 있다”고 발표했습니다. 그런데 무료 사용자의 컨텍스트 윈도우는 32K 토큰입니다. 32K 내에서 2배 길어진 것이지, 유료 요금제의 1M 토큰 윈도우와 같아진 게 아닙니다. 숫자만 보면 다르게 느껴질 수 있습니다.
(출처: Google Blog 2026.03.26 + 공식 한도 문서 교차 확인)
②
SynthID 워터마크 — 모든 음성에 삽입
3.1 Flash Live가 생성하는 모든 오디오에는 SynthID 워터마크가 자동 삽입됩니다. 사람 귀로는 들리지 않는 방식이지만, 이 오디오를 외부 서비스에서 AI 생성 여부 검출에 활용할 수 있습니다. 콘텐츠 제작에 Gemini Live 음성을 쓸 경우 이 점을 알고 있어야 합니다.
(출처: Google Blog 2026.03.26)
③
Preview 상태 — 지금 요금·기능이 그대로 유지될 보장 없음
현재 Gemini 3.1 Flash Live는 Preview입니다. Google AI Studio에서 개발자 접근이 가능하고, API 공식 가격은 미공개 상태입니다. 일반 앱 사용자에게 적용된 무료 접근 조건도 GA(정식 출시) 이후 바뀔 수 있습니다. Rate limit도 현재 Preview 기준이라 정식 출시 후 더 좁아질 수 있습니다.
(출처: Google Blog 2026.03.26 / Reddit r/B2BSaaS 2026.03.28)
Q&A 5가지
마치며
이 부분이 좀 아쉬웠습니다. “무료 전환”이라는 말이 너무 크게 퍼지다 보니, 컨텍스트 윈도우 차이나 트래픽 몰릴 때 무료 사용자 한도가 먼저 줄어드는 조건, SynthID 워터마크 같은 부분이 잘 안 보입니다. 공식 문서에 딱 이렇게 나와 있는 내용들입니다.
지금 당장 일상적인 화면공유 AI 대화용으로 쓴다면 무료로 충분히 쓸 만합니다. 다만 긴 세션, 복잡한 맥락이 쌓이는 업무용이라면 컨텍스트 윈도우 32K가 실제로 어디서 끊기는지 먼저 체감해 보는 게 좋습니다. Preview 기간인 지금이 그걸 직접 확인할 수 있는 때입니다.
본 포스팅 참고 자료
-
Google Blog — Gemini 3.1 Flash Live: Making audio AI more natural and reliable (2026.03.26)
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-live/ -
Google DeepMind — Gemini 3.1 Flash Live Model Card (2026.03.26)
https://deepmind.google/models/model-cards/gemini-3-1-flash-live/ -
Google 공식 지원 문서 — Gemini Apps limits & upgrades for Google AI subscribers
https://support.google.com/gemini/answer/16275805 -
9to5Google — Gemini Live gets its biggest upgrade yet with Gemini 3.1 Flash Live (2026.03.26)
https://9to5google.com/2026/03/26/gemini-3-1-flash-live/ - https://gemini.google/release-notes/
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 모든 수치와 조건은 2026년 4월 2일 기준 공식 문서를 바탕으로 작성됐습니다. Gemini 3.1 Flash Live는 현재 Preview 상태이며 GA 이후 요금·기능이 달라질 수 있습니다.











댓글 남기기