在过去的2017,科技界经历了许多大事件。阿尔法狗大战世界顶尖围棋选手,无人驾驶汽车上路,光量子计算机诞生,发现新引力波……每一件都给世界带来新的变化。《MIT Technology Review》(下称MIT)发布2017“全球十大突破性技术”,其中多项“突破性”技术已经被印证在改变世界。2018年MIT又预测了哪十大突破性技术?

在2018MIT“全球十大突破性技术”官方榜单上,一款名为“巴别鱼耳塞”入选其中。“巴别鱼”(babel fish),说起来很拗口,其实是音译词。它源于美国作家的科幻喜剧《银河系搭便车指南》中虚构的一种生物,以声音中的语言概念为食,消化后排出跟寄主同调的脑波。所以只要把鱼塞进耳朵里,就可以听懂各种语言。

当前“巴别鱼”的主要研究者不仅有谷歌这样的国际科技公司,也有中国国家人工智能四大创新型平台之一的科大讯飞名列其中。

谷歌智能耳机Pixel Buds展示了实时翻译的前景,而科大讯飞的晓译翻译机则进一步贴近生活,面向出境旅游和商务场景,实现中英、中日、中法、中韩等中文和多语种之间的互译,在日常交流、购物、点餐、旅行、生活、辅助工作、学习等场景下实现极速翻译,为全球六个大洲、137个国家的用户提供翻译服务,累计服务次数超过2000万次,创造了翻译机新品类的市场奇迹!

在全球化日益发展的今天,语言仍是人类交流的一大障碍。想要听懂各种语言,除了依靠人工翻译,现在还能够靠人工智能技术。譬如,在语言服务领域,说中文翻译成英文或其他语种,反之亦然。这技术称之为机器翻译。这一翻译过程是机器模拟人脑的套路,首先通过语音识别理解人说话的意思,然后经过自然语音理解形成对说话人的语义表示,接下来把语义转换成另一种语言来表达,如果需要机器说出来,那就应用到语音合成技术。这一机器翻译过程恰好就是晓译翻译机的原型。

上市一年多时间来,晓译翻译机不仅开拓了翻译市场,还贡献了智能翻译三大标准,跟人工翻译的“信达雅”标准一样,需要“听得清”、“听得懂”、“表达专业”。

众所周知,人工翻译服务其实并不会因为少听或误听一两个词而出现重大翻译失误。可是,机器就不行了,每一个词都很关键。因此“听得清”的智能翻译标准尤为关键。据悉,讯飞翻译机基于深度全序列卷积神经网络(DFCNN)语音识别框架提升语音识别率高达98%,使语音识别的词错率低于人类,同时远场识别技术保证在复杂环境下如嘈杂的交流环境和信号不佳的情况保持专业翻译状态。

随着语音识别准确率不断提升,如何让机器“听懂”人话并准确翻译,成为使用体验至关重要的一环。通过日常使用的监测,日常主要是口语化的表达,区别于书本上的标准表达。这个难点在于自然语言理解,而机器阅读理解是自然语言处理中最关键的部分。日前,科大讯飞与哈工大联合实验室(HFL)在由斯坦福大学发起的机器阅读理解领域权威评测SQuAD中两次登顶。他们提交的融合式层叠注意力系统(Hybrid Attention-over-Attention Reader)融合了近期学术界提出的诸多前沿技术,如基于上下文的文本表示、自适应转随机梯度下降的优化方法等,同时又研发出一些全新技术,不仅在EM指标(精准匹配率)超过人类平均水平,并成为首个F1指标(模糊匹配率)上超过89%的系统。

为了让体验更出众,尊重表达,将翻译结果展现出来,智能翻译产品不局限于发送文字和图片,最好是有媲美真人声音读出来,不用语言的自由转换成为现实,让用户拥有便捷而愉悦的服务。

利用神经网络技术打造出普适性的翻译技术,通过一个模型翻译多种语言。像晓译翻译机,做到了至少五国语言的互译;通过技术升级,还实现了离线翻译,遇到网路不佳或无网络也可以实时翻译。这也是一个翻译人员很难匹及的。

那么翻译,以后不需要人来做了吗?从目前效果看,机器翻译还达不到专业人工翻译的水准,只能适用于日常沟通和网络交流,尚不能形神俱全地翻译艺术作品。许多优秀的工作都在做翻译产品,我们现在看到的无论翻译机还是智能耳机,都是为了提高工作效率,形成人机耦合模式而不是取代。从讯飞侧了解到,他们的优势是把业界最好的算法跟行业专家、用户大数据结合起来,通过不断更新迭代升级产品功能,进一步增强用户粘性。