原标题:这还是AI?谷歌DeepMind说话堪比真人

谈到谷歌的人工智能技术,在今年可谓名声大噪。AlphaGo击败李世石后让人见识了其计算能力的强悍。而由同一部门DeepMind所研发的新型被称作WaveNet的AI更是可以将人类语言模仿到让人真假难辨。

在过去,计算机生成语言采用的方法大多数为TTS即文本到语音的方式。这种方式多为机器记录个人声音片段,借此构建大型数据库并且再次拼合后达成完整的表达概念。但是在这种技术中,由于声音和语境并不完善,因此语气和情感表达很可能是错乱的,与真人语音相似度较低。

而WaveNet基于深层神经网络,通过对人类语音进行实时采样,用原始声音信号建模,更为细致。不仅能够模拟人类的身份、语气、语调说话,甚至连音乐都可以模仿。

而且,WaveNet为了模拟的更为逼真,连人类说话时口腔气流产生的杂音都可以模仿到惟妙惟肖,语调、情感、口音无一不擅长。但是,目前谷歌尚无将此技术商用化的计划,而且,他们认为WaveNet还有很多地方需要更多的改进。