打开网易新闻 查看精彩图片

【产品发布】美国科技公司谷歌于2026年6月9日正式推出全新音频AI模型Gemini 3.5 Live Translate,旨在为跨语言交流提供更接近真实对话节奏的实时翻译体验。据CNET报道,该工具目前已向开发者和合作伙伴开放,可被集成至会议系统、通讯平台及移动应用中。

【核心功能】与传统翻译系统需等待一方讲完后再翻译不同,Gemini 3.5 Live Translate采用持续流式翻译技术,能够同时进行听取、翻译和发声,仅有数秒延迟。该模型可自动识别口语语言,支持超过70种语言,并可在同一对话中实现数千种语言配对的切换。

【场景适配】谷歌方面表示,新模型针对日常交流的真实环境进行了优化,可在嘈杂背景下工作,能够处理背景噪音、声音重叠以及非正式口语表达,适用于客服通话、导览讲解、课堂教学、网约车服务以及现场直播等多种场景。

【语音质量】在语音合成方面,Gemini 3.5 Live Translate不再使用千篇一律的合成音,而是尝试保留原说话者的语速、语调和情感色彩,使翻译后的语音更贴近自然表达,便于听者跟进对话内容。

【应用前景】谷歌表示,此次发布的目标是让实时翻译走出演示场景,融入日常沟通。通过实现近乎实时的多语言交流,且无需说话者改变表达习惯,该技术有望让跨语言交流在企业、组织和个人层面变得更加便捷实用。

参考链接:
https://www.cnet.com/tech/services-and-software/gemini-3-5-live-translation-real-time-multilingual-conversation/