原标题:英媒:新程序能“读懂”对话 唇读准确率超人类

新华社北京11月10日新媒体专电;英媒称,“老大哥”可能很快就会监视你,不过靠的是一款能够以超过人类的准确率读懂唇语的计算机程序

据英国《每日电讯报》网站11月8日报道,英国牛津大学的科学家研制出一款唇读准确率高达93.4%的软件——这一准确率远超最优秀的专业人士。

研究人员说,这款名为LipNet的程序可能拥有“巨大的实用潜力”,可用于改进助听设备,使人们能够在嘈杂环境里进行对话,还可以给默片配上语音。

报道称,不过,它也可能有些较为邪恶的用途,可以通过摄像头大规模监控公民在公共场合所说的话,也可以使任何人都能够窥探他人的私人对话。

牛津大学研究人员与谷歌旗下人工智能部门“深层思维”公司一起,用测试对象录制的超过3万段朗读句子的视频对这款软件进行了训练。随着时间的推移,它能够将特定的单词与特定的唇部运动联系在一起,从而识别出所说的单词是什么。

接下来,研究人员向它播放了更多人类说话的视频。LipNet读对唇语的准确率高达93.4%。相比之下,听力受损的唇读学生的准确率为52.3%。这一表现也超越了其他唇读程序。

与以往的软件不同,LipNet将词组当作完整的句子来消化理解。这使它能将单词放在语境下而不是单独进行解读,从而大大提高了准确率。这也意味着它不必将一段视频以每个单词为单位进行分割。

不过,这款软件还远没有做好进入现实生活的准备。此次研究和测试仅仅涵盖了一批特定视频,这些视频由34名参与者录制完成,其中的单词全都以固定结构出现。

要能够理解更加复杂多变的句子并听懂更多带有不同口音的人所说的话,这款软件需要一个由更多人录制的大得多的视频库。

(原标题:英媒:新程序能“读懂”对话 唇读准确率超人类)