谷歌发布Gemini 3.5 Live Translate 实时翻译支持超70种语言

龙剑秀南

2026-06-10 06:20 ·上海

【产品发布】美国科技公司谷歌于2026年6月9日正式推出全新音频AI模型Gemini 3.5 Live Translate，旨在为跨语言交流提供更接近真实对话节奏的实时翻译体验。据CNET报道，该工具目前已向开发者和合作伙伴开放，可被集成至会议系统、通讯平台及移动应用中。

【核心功能】与传统翻译系统需等待一方讲完后再翻译不同，Gemini 3.5 Live Translate采用持续流式翻译技术，能够同时进行听取、翻译和发声，仅有数秒延迟。该模型可自动识别口语语言，支持超过70种语言，并可在同一对话中实现数千种语言配对的切换。

【场景适配】谷歌方面表示，新模型针对日常交流的真实环境进行了优化，可在嘈杂背景下工作，能够处理背景噪音、声音重叠以及非正式口语表达，适用于客服通话、导览讲解、课堂教学、网约车服务以及现场直播等多种场景。

【语音质量】在语音合成方面，Gemini 3.5 Live Translate不再使用千篇一律的合成音，而是尝试保留原说话者的语速、语调和情感色彩，使翻译后的语音更贴近自然表达，便于听者跟进对话内容。

【应用前景】谷歌表示，此次发布的目标是让实时翻译走出演示场景，融入日常沟通。通过实现近乎实时的多语言交流，且无需说话者改变表达习惯，该技术有望让跨语言交流在企业、组织和个人层面变得更加便捷实用。

参考链接:
https://www.cnet.com/tech/services-and-software/gemini-3-5-live-translation-real-time-multilingual-conversation/

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴