打开网易新闻 查看精彩图片

*本文只能在《好奇心日报(www.qdaily.com)》发布,即使我们允许了也不许转载*

加利福尼亚州山景城电 - 1990 年代中期,道格拉斯·埃克(Douglas Eck)在阿尔伯克基担任数据库程序员,同时还是兼职歌手。白天,他在美国能源部(Department of Energy)的实验室里编写计算机代码, 到了晚上,他就会去当地酒吧表演,演奏他所说的“受朋克影响的蓝草音乐(美国传统乡村音乐,用吉他和班卓琴演奏,译注)”,即“约翰尼·罗坦(Johnny Rotten)和约翰尼·卡什(Johnny Cash)的结合”(约翰尼·罗坦是著名朋克乐团性手枪乐队(Sex Pistols)成员,而约翰尼·卡什则是美国乡村音乐传奇歌手)。但埃克真正想要做的是结合他的全职工作和兼职工作,研发可以创作音乐的机器,他说:“我生命中唯一的目标,就是将人工智能与音乐结合起来。”

这曾经是一个异想天开的想法。他的研究生学位是在布卢明顿的印第安纳大学(Indiana University)读的,离家乡很近。他曾经试图把这个想法推销给著名认知科学家侯世达(Douglas Hofstadter)。侯世达曾撰写过关于人脑和机器的书《哥德尔、艾舍尔、巴赫:集异璧之大成》(Gdel, Escher, Bach: An Eternal Golden Braid),这本书后来获得了普利策奖。但是当时侯世达没有接纳埃克的想法, 因为他觉得,即使是当时最先进的人工智能技术也不可能做到这一点。但在接下来的二十年里, 埃克一直徘徊在学术界边缘,未曾放弃这个想法,最终,人工智能的发展赶上了他的愿望。

去年春天,在 Google 参与了几年研究工作后,埃克再次提出这个他在几年前就对侯世达说过的想法。这一次,他促成了 Magenta 项目的成立。参与该项目的 Google 公司研究员不仅要让机器自动创造出音乐,而且还能创作其它形式的艺术,譬如素描、视频和笑话。Google 旗下的智能手机、应用软件和互联网服务组成了一个庞大网络,于是准备进军通信行业,而在埃克看来,Magenta 项目也是一种自然延伸的沟通方式。

最近,在 Google 人工智能研究总部的双层楼里,埃克接受了采访,他说:“这个项目是为人们创造新的沟通方式。”

人们正加倍努力,试图利用人工智能技术创造艺术,该项目也是这种努力的一部分,而直到最近,这种人工智能技术才算真正成形。这些复杂的数学系统被称为深度神经网络(deep neural network),可以让机器通过分析大量的数据来学习特定的行为。例如,人工神经网络可以通过在数百万张自行车照片中寻找共性,从而学会识别自行车。所以,Facebook 识别网络照片人脸,Android 手机识别语音,以及微软网络电话工具 Skype 自动翻译不同语言,都是遵循同样的原理。但是,这些复杂的系统还可以创作艺术,例如,通过分析一组歌曲,它们可以学习创建类似的声音。

打开网易新闻 查看精彩图片

一幅使用 DeepDream 制作的艺术画。DeepDream 是 Google 研究人员在 2015 年开发的一款软件。在此之上,Google 推出了最新的 Magenta 项目,加入音乐的创作功能,并由此开发出一款名为 NSynth 的工具。

正如埃克所说,真正实现这个目标可能还需要多年努力,但这些系统至少已经越来越接近这个目标,因为现在机器已经可以马上创作出一首(甚至是数万亿首)全新的披头士乐队(Beatles)歌曲,并且每一首歌听起来都很像披头士乐队自己录制的音乐,却也不尽相同。但是,最终的结果既在创造艺术,也在破坏艺术,而这并不是他所追求的目标。除了模仿之外,还有很多途径值得探索。最终目标不是取代艺术家,而是为他们提供工具,让他们以全新的方式创造艺术。

打开网易新闻 查看精彩图片

在 1990 年代,在当初新墨西哥州的那间小酒吧里,埃克在自己的表演中将朋克音乐与乡村音乐相结合,而现在,他正在研发一款软件,让它来做自己当初做的事情。他和团队利用人工神经网络,将截然不同的乐器进行混合创作,比如说,将巴松管和古钢琴的声音结合在一起,这样一来,就能制作出前所未有的新声音。

正如一个人工神经网络可以通过分析数百张猫的照片来识别猫一样,它可以通过分析数百个音符来学习巴松管的音乐特性,它可以创建数学模型或向量来标识巴松管。因此,埃克和他的团队已经将数百种乐器的音符输入到人工神经网络中,并为每一种乐器建立一个向量。现在,只需在屏幕上移动一个按钮,他们就可以结合这些向量来创建新的乐器声音,譬如由 47% 巴松管乐音和 53% 钢琴乐音组成的新乐声等。

几个世纪以来,管弦乐指挥家的工作,就是将不同乐器的声音层层叠加,但这个软件又有所不同。通过这个软件,埃克和他的团队不是单纯地将声音叠加,而是创造出前所未有的新声音,为艺术家提供新的创作方式,埃克说:“我们正在制作新一代的电影摄影机和新一代的电吉他。”

这个被命名为 NSynth 的项目还在起步阶段。但是,在艺术和科技行业,已经有许多人开始渴望通过人工神经网络和其它人工智能技术来创作新的艺术。洛杉矶摄影师和艺术家亚当·菲利斯(Adam Ferris)说:“这项工作在过去几年中飞速发展,它代表的是一种全新的美学。”

2015 年,Google 内部的一个独立研究小组研发出了 DeepDream。这款工具可以利用人工神经网络,从现有摄影作品中制造出迷幻风格的概念性图像,在 Google 内外催生了许多全新的艺术。如果它在分析一张狗的照片的时候,发现了一部分皮毛有点类似眼球,就会不断突出那一部分的皮毛,然后重复这个过程,最终创造出一幅布满眼球的小狗照片,看上去令人眼花缭乱。

打开网易新闻 查看精彩图片

另一幅使用 DeepDream 创建的作品,这个软件能利用人工神经网络从现有的摄影作品中创作出概念性的图像。

与此同时,一些艺术家,譬如著名的多媒体表演艺术家崔佛·帕格恩(Trevor Paglen)或知名度较低的亚当·菲利斯,他们正在以不同的方式来探索人工神经网络。今年 1 月,帕格恩在旧金山一个陈旧的海运仓库进行表演,探讨以人工神经网络为基础跟踪人类外表和行业的计算机视觉伦理学问题。例如,当风格前卫的克罗诺斯弦乐四重奏团(Kronos Quartet)在台上演奏时,人工神经网络会实时分析他们的表情,推测他们的情绪。

这些工具是新的,但其背后的理念却不是。纽约大学(New York University)教授艾莉森·帕里什(Allison Parrish)设计了一款能自动生成诗歌的软件,她认为,艺术家自 1950 年代以来就一直在使用计算机创作艺术。她说:“譬如杰克逊·波洛克(Jackson Pollock),他想出了一种新的绘画方法,那就是把颜料罐打开后,直接泼洒到身下的画布上。这些新的计算机科技只是给艺术家们提供了更多的‘调色板’。”

一年前,戴维·哈(David Ha)是跨国银行控股公司东京高盛(Goldman Sachs)的一名交易员。在平日工作的午休时间,他开始研究起人工神经网络,并将结果通过化名发表在博客上。除此之外,他还创建了一个可以写日本汉字的人工神经网络,日本汉字是一种源自中文的象形文字,其书写方式更像是在绘画。

很快,埃克和 Google 公司的其他员工发现了这个博客,而现在,戴维·哈已经成为了 Google Magenta 项目的研究人员。通过一个名为 SketchRNN 的项目,他正在构建可以绘画的人工神经网络。这些人工神经可以通过分析数千幅由普通人创作的电脑绘图,学习创作猪、卡车、小船或瑜伽姿势等主题的图像。它们不会抄袭别人画过的东西,而是学习独立绘画,通过数学运算来学会如何画一只猪。

然后,你就可以要求它们画一只有猫头的猪,画一匹少了一条腿的马,素描一辆看起来像狗一样的卡车,或用几条随机的曲线画一条船。相比于 NSynth 或 DeepDream,这些软件可能不太像是艺术家用来创作的工具。但一旦你使用过这些软件,你就会发现它们本身就是一件件艺术品,一件件由戴维·哈创建的、充满生命力的作品。人工智能不只是在创造新的艺术类型,更是在创造新的艺术家。

翻译 熊猫译社 李秋群

题图来自 Vimeo

2017 THE NEW YORK TIMES

打开网易新闻 查看精彩图片

喜欢这篇文章?去 App 商店搜 好奇心日报 ,每天看点不一样的。