구글 미트 음성 번역 2026: 자막 없이 실시간 통역되는 AI 회의
2026년 1월 27일 정식 출시(GA) · 워크스페이스 비즈니스 스탠다드 이상 포함
5개 언어 지원
목소리 톤 그대로 번역
한국어 미지원(출시 미정)
구글 미트 음성 번역(Speech Translation)은 단순히 자막을 보여 주는 것과 차원이 다릅니다. AI가 내 음성을 입력받아 2~3초 안에 상대 언어의 음성으로 변환해 내보냅니다. 발표자의 목소리 톤과 말의 속도까지 흉내 낸 채로요. 2026년 1월 27일, 한정 알파 테스트를 졸업하고 구글 워크스페이스 비즈니스 스탠다드 이상 요금제에서 정식 사용 가능해졌습니다. 지금 당장 쓸 수 있는 설정법부터 한국어 지원 현황까지 한 번에 정리해 드립니다.
구글 미트 음성 번역이란? — 자막과 결정적으로 다른 점
구글 미트에는 이미 번역 자막(Translated Captions) 기능이 있었습니다. 상대방 말을 화면 하단에 텍스트로 번역해 주는 거죠. 그런데 음성 번역(Speech Translation)은 여기서 한 단계 더 나아갑니다. 텍스트가 아닌 실제 음성으로 번역해서 들려줍니다. 내가 영어로 말하면 참석자에게는 스페인어 음성이 들리고, 반대도 마찬가지입니다. 화면에서 눈을 떼지 않아도 회의가 진행됩니다.
더 놀라운 건 목소리 톤과 말하기 속도를 원본 화자와 비슷하게 재현한다는 점입니다. 구글 딥마인드와 구글 미트 오디오 팀이 함께 개발한 ‘원샷(one-shot) 번역 모델’ 덕분입니다. 이전 기술은 음성→텍스트→번역→다시 음성의 3단계를 거쳐 10~20초의 지연이 생겼지만, 이 모델은 오디오를 직접 입력받아 2~3초 안에 오디오를 출력합니다. 이 2~3초라는 간격이 자연스러운 대화를 가능하게 만드는 ‘스위트 스팟’이라고 개발 팀은 설명합니다.
개인적으로 이 기능이 단순한 편의 기능이 아니라 업무의 구조를 바꿀 수 있는 기능이라고 생각합니다. 영어 회의를 위해 통역사를 고용하거나, 비영어권 참석자를 배제하거나, 내내 자막을 읽느라 상대방의 표정을 못 보는 상황 자체가 없어집니다.
💡 핵심 요약: 음성 번역 = 자막이 아닌 ‘내 목소리를 닮은 번역 음성’을 상대에게 직접 들려주는 실시간 AI 통역. 지연 2~3초, 현재 5개 언어 지원.
정식 출시 타임라인 — 알파→베타→GA 3단계 정리
이 기능의 공개 여정을 시계열로 정리하면 아래와 같습니다.
| 시점 | 단계 | 주요 내용 |
|---|---|---|
| 2025년 5월 21일 | 공개 발표 | Google I/O 2025에서 데모 공개, Google AI Pro/Ultra 개인 구독자 베타 시작 |
| 2026년 1월 7일 | 관리자 제어 추가 | 워크스페이스 관리자가 조직 단위(OU)별로 음성 번역 ON/OFF 제어 가능 |
| 2026년 1월 27일 | 🎉 정식 출시(GA) | 워크스페이스 기업·비즈니스 요금제로 확대. Rapid Release 도메인 롤아웃 시작. |
| 2026년 2월 4일 | 공식 공지 | 구글 워크스페이스 업데이트 블로그에 GA 공식 발표. Scheduled Release 도메인은 2월 18일 롤아웃. |
| 2026년 수개월 내 예정 | 모바일 지원 | 안드로이드·iOS 미트 앱에서도 음성 번역 기능 롤아웃 예정 |
정식 출시 직후 최소 60일간 사용량 상한 없는 프로모션 혜택이 적용됩니다. 즉, 지금이 사실상 무제한 테스트 기간입니다. 이 기간이 끝나면 사용자별 사용량 제한이 적용될 예정이며, 구글은 변경 전에 별도 공지할 것이라고 밝혔습니다. 얼리어답터라면 지금 바로 켜서 충분히 써 봐야 할 이유입니다.
지원 언어·요금제·기기 — 지금 당장 쓸 수 있나요?
지원 언어 (2026년 3월 기준)
현재 음성 번역은 영어(English)를 중심으로 한 5개 언어 간 양방향 번역을 지원합니다. 영어 ↔ 스페인어, 영어 ↔ 프랑스어, 영어 ↔ 독일어, 영어 ↔ 포르투갈어, 영어 ↔ 이탈리아어가 그 조합입니다. 한 회의에서는 단 한 가지 언어 조합만 활성화할 수 있으므로, 예를 들어 영어↔스페인어 회의 도중 영어↔독일어로 전환하려면 기능을 껐다가 다시 켜야 합니다.
이용 가능한 요금제
| 구분 | 요금제 | 사용 가능 |
|---|---|---|
| 개인 | Google AI Pro / AI Ultra | ✅ |
| 워크스페이스 | Business Standard / Plus | ✅ |
| Enterprise Standard / Plus | ✅ | |
| Frontline Plus | ✅ | |
| Business Starter / 무료 계정 | ❌ | |
| 교육 | AI Pro for Education / AI Ultra Access | ✅ |
기기별 제한 사항
현재 음성 번역은 웹 브라우저(PC)에서만 사용 가능합니다. 모바일 앱(안드로이드·iOS)은 수개월 내 지원 예정이며, 회의실 하드웨어 기기는 번역 음성을 듣는 것만 가능하고 본인 발화를 번역하는 것은 지원되지 않습니다. 또한 만 18세 미만 사용자, 라이브 스트리밍·녹화 중인 회의에서는 기능이 비활성화됩니다.
5분 안에 켜는 설정법 — 관리자·사용자 모두 포함
① 관리자 설정 (워크스페이스 어드민)
음성 번역은 기본적으로 자동으로 켜져(ON) 있습니다. 별도 조치 없이도 요금제 조건만 맞으면 바로 쓸 수 있다는 의미입니다. 특정 조직 단위(OU)에서 기능을 끄고 싶다면, 구글 관리 콘솔 → 앱 → 추가 서비스 → Google Meet에서 ‘음성 번역’ 항목을 찾아 OFF로 전환하면 됩니다. 관리자가 기능을 꺼 두면 일반 사용자는 회의 중에 기능을 켤 수 없습니다.
② 사용자 설정 (회의 주최자)
회의 화면 오른쪽 하단의 ‘회의 도구’ 아이콘을 클릭 → ‘통역’을 선택 → 언어 조합(예: 영어↔스페인어)을 지정 → ‘모든 사용자에 대해 통역 사용 설정’을 누릅니다. 이후 모든 참석자 화면 우측 상단에 번역 배지가 나타납니다. 언어 조합을 바꾸려면 반드시 기능을 완전히 끈 뒤 다시 설정해야 합니다.
③ 일반 참석자 설정
주최자가 기능을 켠 뒤 나타나는 번역 배지를 클릭하면 ‘사용하는 언어’와 ‘듣고 싶은 언어’를 각자 선택할 수 있습니다. 번역을 허용하겠다는 동의 버튼을 누르면 참석자 본인 발화도 번역됩니다. 동의하지 않으면 자신의 음성은 번역되지 않고 상대 음성은 들을 수만 있습니다. 음성 데이터는 구글 서버에 저장되지 않으며 어떤 모델 학습에도 사용되지 않는다고 구글은 공식 문서에 명시하고 있습니다.
⚠️ 주의: 오디오 병합(Audio Merging) 기능을 활성화한 참석자는 음성 번역이 작동하지 않습니다. 반드시 오디오 병합을 끄고 참여해야 합니다.
한국어 지원은 언제? — 솔직한 전망과 우회 방법
결론부터 말씀드리면, 현재 한국어는 음성 번역에서 지원되지 않습니다. 구글은 공식 로드맵에서 추가 언어 지원을 ‘예정’이라고만 밝혔을 뿐, 한국어 출시 일정을 구체적으로 제시하지 않고 있습니다. Google I/O 2025 당시에도 한국어는 ‘미정(TBD)’으로 분류됐습니다.
개발 팀이 밝힌 기술적 배경을 보면, 스페인어·이탈리아어·포르투갈어·프랑스어처럼 언어 계통이 비슷한 언어는 상대적으로 통합이 쉬웠다고 합니다. 반면 독일어처럼 문법 구조가 다른 언어도 상당한 도전이 있었는데, 한국어는 독일어보다 훨씬 더 큰 어순·문법 차이를 가지고 있습니다. 동시에 이미 구글이 AI Pro 개인 사용자 대상으로 제미나이 라이브(Gemini Live) 앱에서 한국어 실시간 대화를 지원하고 있다는 점은 긍정적인 신호입니다.
지금 당장 한국어 음성 번역이 필요한 분께는 두 가지 우회 방법을 제안합니다. 첫째, 구글 미트의 기존 번역 자막(Translated Captions) 기능을 병행 사용하는 것입니다. 이 기능은 한국어를 포함한 훨씬 많은 언어를 지원합니다. 둘째, Akkadu, Interprefy 같은 서드파티 AI 통역 플러그인을 구글 미트와 연동하는 방법이 있습니다. 음성 번역처럼 자연스럽진 않지만 한국어를 포함한 60개 이상 언어를 지원합니다.
📌 필자 의견: 구글이 한국어를 지원하지 않는 건 의지가 없어서가 아닙니다. 실시간으로 목소리 톤까지 재현하면서 한국어의 복잡한 존댓말 구조와 어순을 동시에 처리하는 건 현재 모델로는 상당한 추가 연구가 필요합니다. 2026년 하반기~2027년 초 정도를 현실적인 목표로 보고 있습니다.
AI 기술 원리 — 왜 이제야 가능해졌나
구글 미트 음성 번역의 핵심은 구글 딥마인드가 개발한 대규모 오디오-투-오디오(Audio-to-Audio) 모델입니다. 기존 번역 기술은 ① 음성 인식(STT) → ② 텍스트 번역(MT) → ③ 음성 합성(TTS)의 3단계 파이프라인을 거쳐 10~20초의 지연이 발생했습니다. 그러나 이 모델은 오디오 입력을 받는 순간 즉시 오디오 출력을 생성하기 시작하는 ‘원샷’ 방식으로 작동합니다. 전통적 LLM이 아닌 ‘대규모 멀티모달 오디오 모델’이라는 점이 핵심입니다.
화자의 목소리를 모방하는 기술은 픽셀(Pixel) 팀, 크롬 팀, 클라우드 팀이 함께 기여했습니다. 개발팀의 오디오 엔지니어링 리드 프레드릭 린드스트롬은 “처음에 5년은 걸릴 것 같다고 생각했지만 AI의 발전 속도 덕분에 2년 만에 해냈다”고 밝혔습니다. 언어 간 차이를 처리하기 위해 언어학자와 억양 전문가까지 협업했으며, 스페인어·이탈리아어처럼 친연성이 가까운 언어 쌍이 먼저 안정화됐습니다.
아직 한계도 있습니다. 문법 오류나 오역이 발생할 수 있고, 네트워크 불안정 시 품질이 저하되며, 여러 명이 동시에 말하는 상황에서는 목소리 스타일이 섞일 수 있습니다. 그러나 구글은 앞으로 고급 LLM을 결합해 관용구와 아이러니 같은 언어적 뉘앙스까지 번역에 반영할 계획이라고 밝혔습니다.
실전 활용 팁 — 품질을 높이는 5가지 방법
발화 후 잠깐 기다리기
상대방 타일 상단의 번역 아이콘이 사라질 때까지 기다린 후 답변을 시작하세요. 번역 처리가 완료되기 전에 발화하면 음성이 겹칩니다.
자막과 병행 사용
음성 번역과 함께 번역 자막을 동시에 켜면 음성이 뭉개졌을 때 텍스트로 보조 확인이 가능합니다. 중요한 수치나 용어가 나올 때 특히 유용합니다.
유선 네트워크 권장
Wi-Fi보다 유선 LAN 연결 시 번역 품질이 눈에 띄게 안정됩니다. 특히 실시간 통역이 끊기는 상황을 방지하려면 안정적인 네트워크가 필수입니다.
표현을 바꿔서 재시도
번역이 어색하게 들리거나 잘못 전달된 것 같다면 같은 내용을 다른 표현으로 다시 말하세요. 구글도 공식 도움말에서 동일한 방법을 권장합니다.
60일 프로모션 기간 적극 활용
정식 출시 이후 최소 60일은 사용량 무제한 혜택이 적용됩니다. 이 기간 동안 다양한 글로벌 회의에 적용해 사용 패턴을 파악해 두는 것이 좋습니다.
모든 AI 기능이 그렇듯, 음성 번역도 처음엔 어색하게 느껴질 수 있습니다. 그러나 2~3번 회의를 경험한 뒤 자연스럽게 리듬이 생깁니다. 최고의 사용법은 기능을 믿고 자연스럽게 말하는 것, 그게 전부입니다.
자주 묻는 질문 (FAQ)
▶ Q1. 구글 미트 음성 번역은 무료인가요?
무료 구글 계정이나 워크스페이스 Business Starter 요금제에서는 사용할 수 없습니다. 개인 Google AI Pro(월 $19.99) 이상 구독자이거나, 회사에서 워크스페이스 Business Standard 이상을 사용하고 있어야 합니다. 단, 정식 출시 후 60일간은 사용량 상한 없이 이용할 수 있는 프로모션 혜택이 적용됩니다.
▶ Q2. 내 목소리가 구글 서버에 저장되거나 학습에 쓰이나요?
구글 공식 도움말에 따르면, 음성 번역에 사용된 오디오 데이터는 저장되지 않으며 어떤 AI 모델 학습에도 활용되지 않습니다. 단, 참석자가 번역 동의(통역 허용) 버튼을 누른 경우에만 해당 참석자의 발화가 번역 처리됩니다. 동의하지 않으면 본인 음성은 번역되지 않습니다.
▶ Q3. 한 회의에서 여러 언어 조합을 동시에 쓸 수 있나요?
아직은 불가능합니다. 현재 한 회의당 단 하나의 언어 조합(예: 영어↔스페인어)만 활성화됩니다. 다른 조합으로 전환하려면 번역 기능 전체를 끄고 다시 설정해야 하며, 이 경우 모든 참석자의 언어 조합이 동시에 변경됩니다. 다중 언어 지원은 향후 업데이트를 통해 추가될 가능성이 있습니다.
▶ Q4. 스마트폰으로도 쓸 수 있나요?
2026년 3월 현재 모바일(안드로이드·iOS)에서는 아직 지원되지 않습니다. 구글은 ‘수개월 내’ 미트 앱에도 음성 번역을 출시할 예정이라고 밝혔습니다. 현재는 PC 웹 브라우저에서만 사용 가능하며, 회의실 하드웨어 기기는 수신만 가능합니다.
▶ Q5. 음성 번역과 번역 자막을 동시에 켤 수 있나요?
네, 동시에 사용 가능합니다. 구글도 공식 도움말에서 두 기능을 함께 사용할 것을 권장합니다. 음성 번역은 자연스러운 대화 흐름을 유지하고, 번역 자막은 중요한 단어나 수치가 잘못 번역됐을 때 보조 확인 수단으로 활용하는 조합이 가장 효과적입니다.
마치며 — 총평
구글 미트 음성 번역은 화상 회의 도구가 단순한 영상 통화 수단에서 언어 장벽 없는 글로벌 협업 공간으로 진화하는 전환점입니다. 아직 5개 언어, PC 전용이라는 한계가 있지만, 출시 속도와 구글 딥마인드의 기술력을 감안하면 이 한계는 빠르게 해소될 가능성이 높습니다.
한국어 사용자 입장에서는 솔직히 아직 당장 쓸 수 있는 기능이 아닙니다. 하지만 지금부터 기능의 작동 방식과 생태계를 파악해 두는 것이 중요합니다. 한국어 지원이 추가되는 시점에 바로 실무에 투입할 수 있도록 지금 워크스페이스 계정에서 타 언어로 테스트해 보시길 권합니다. 영어 실력도 기르면서 AI 통역의 한계도 직접 체감해 보는 일석이조의 기회가 될 것입니다.
글로벌 팀과 협업하는 직장인, 해외 고객과 미팅이 잦은 프리랜서, 외국 파트너사와 정기 회의를 하는 기업 담당자라면 지금 당장 요금제를 확인하고 60일 프로모션 기간을 최대한 활용해 보시기 바랍니다.
※ 본 포스팅의 정보는 2026년 3월 7일 기준 구글 공식 워크스페이스 업데이트 블로그 및 도움말 센터를 근거로 작성됐습니다. 요금제·지원 언어·기기 지원 현황은 구글 정책에 따라 변경될 수 있으므로 최신 정보는 공식 채널에서 확인하시기 바랍니다.











댓글 남기기