本文节选自《为什么伟大不能被计划:对创意、创新和创造的自由探索》,上一篇链接:
《为什么伟大不能被计划:对创意、创新和创造的自由探索》,作者是肯尼斯·斯坦利(Kenneth Stanley)和乔尔·雷曼(Joel Lehman),他们是目前享誉全球的创业公司OpenAI科学家。两位作者持续多年扎根人工智能前沿领域,这本书是他们在科学研究的过程中蹦出的意外火花。他们在学校、TED、科研论坛等场合公开演讲,让这一新思维方式影响并激励了许多人。他们自身也凭借写入本书的“寻宝者思维”“踏脚石模型”“新奇性探索”等具体思维方法,在人工智能研发领域取得了飞跃式的突破和进展,产生了一系列惠及人类的伟大创造。
近期我将会在网易号平台将这本书的各个章节分享给大家,感兴趣的网友可以去买一本实体书。
第五章 有趣的和新奇的探索
抓住每一个时刻的独特新奇性,享受意料之外的快乐。
——安德烈·纪德(Andre Gide)
我们身边或许都有这样一个人,他/她在新年当天许下愿望:新的一年,我要学会说一门流利的外语,每天慢跑七公里,三个月内只吃胡萝卜和苹果来减肥。但过了一周,所有这些豪情壮志就被彻底抛在脑后,但没有人对此表示惊讶。或许不需要什么科学调查的结果,你就已经知道,大多数新年愿望最终都会不了了之。老实说,尽管这些许下了新年愿望的人中,超过半数认为自己能够坚持,但最终成功实现的人只占12%。
这个超低的成功率也提醒我们,设定目标尽管在当下很吸引人,却是整个过程中最容易完成的事情。说出你想成为什么样的人、想要去哪里,或你想要完成什么,并不需要太多的努力,真正难的是如何实现这些愿望。更确切地说,真正的问题是,我们很难确定从这里到最终目标之间的踏脚石。这也暗含了一个不寻常的想法:我们不妨将花在制定明确目标上的精力,转投到那些有希望引导我们实现某些伟大事业的踏脚石上,但这些踏脚石不一定准确地通往我们设定的目标。毕竟,目标本身并没有对通往它的踏脚石应该是什么样子这件事提供任何有用的线索。因此,我们或许可以换一种角度来看待探索未知这件事。与其担心我们想要去什么地方,不如将我们现在所处的位置,与我们曾经到过的位置进行比较。假如比较之后,我们发现自己身处一个新奇的位置,那么这个新奇的发现,未来或许会被证明是通往全新领域的踏脚石。尽管我们可能无法确定这些新领域是什么,但当前的踏脚石,成了探寻新发现的大门。
对目标的过度关注,实际上反映了我们对未来的过分关注。每时每刻的进展,都要根据我们在未来想要达成的目标来衡量。我们是否正在逐步靠近目标?衡量的结果,是否证明我们正在向前迈进?未来好似成了一座远方的灯塔,指引着我们所有努力的过程。但这座灯塔往往具有欺骗性,在灯光上玩弄花招,将我们引入歧途。指引人类发明飞机的“灯塔”,没有提示我们需要感应线圈;指引人类发明计算机的“灯塔”,也没有提示我们需要先发明真空管。即便我们在很久之前就发现了这些踏脚石,但并没有意识到,它们可能通往如此遥远的目标。既然如此,我们将现在与理想中的未来进行比较有什么好处呢?既然没有好处,我们不妨尝试一些不同的、更符合情理的做法。我们可以转而将现在与过去进行比较,这总比与未来进行比较容易得多,毕竟我们可以确定地知道过去已经发生了什么。
诚然,过去不会告诉我们目标是什么,但它确实提供了一条同样重要,甚至更加重要的线索——过去是创新的指南。但与未来不同的是,过去不存在模糊性或欺骗性,因为我们实际上已经知道自己在过去的位置,于是我们能够清晰地知道,如何将其与当前位置进行对比。这种比较不会让我们判断自己朝向目标的进展如何,但可以让我们判断我们在多大程度上摆脱了过时事物的束缚。有趣的是,这种比较将问题从“我们正在接近什么”,变成“我们正在逃离什么”,而逃离过去的有趣之处在于,它能够开启全新的可能性。
新奇事物的重要性在于,它们往往可以成为踏脚石探测器,因为任何新奇的东西,都是催生更新奇事物的潜在踏脚石。换句话说,新奇性是识别趣味性的一条“简单粗暴”的捷径,而有趣的想法往往能够开辟全新的可能性。尽管去寻找“有趣的”事物,听起来相当儿戏,但有趣性的概念,实际上蕴含着惊人的深刻意义。用著名哲学家阿尔弗雷德·诺思·怀特黑德(Alfred North Whitehead)的话说:“一个命题的趣味性比真实性更重要。”另一位哲学家斯塔斯(W.T.Stace)补充说:“把‘趣味性’批判成‘一个微不足道的目标’,源自一种被扭曲和颠倒了的价值尺度。”新奇有趣的想法不仅远非微不足道,而且往往还会带来新的思维方式,进而触发更伟大的创新和发现。
更重要的一点是,通过不断地使新事物成为可能,新奇性(以及趣味性)能随着时间的推移产生聚合效应。因此,我们与其寻求某个最终的目标,不如转而寻求新奇的事物,因为后者的回报,将是一连串的、无穷无尽的踏脚石,即一项新奇事物的产生,将带来更多的新奇事物。这样一来,未来就不再是某个特定的终点,而是一条没有尽头、未被定义、潜力无限的道路。这种不强调目标的观点,更好地体现了类似图片孵化器网站、自然界的进化和人类创新背后的逻辑——继一块踏脚石之后,再找到下一块,不设定特殊方向地向外不断地分化和延展,朝着所有可能的方向发展,最终形成一个不断更新迭代的循环。
在图片孵化器网站上,“外星人脸”被选中并不是因为它可能会繁育出汽车图片,而是因为“外星人脸”本身就是一种有趣且新奇的东西。“外星人脸”所开辟的道路是值得探索的,因为它具备了潜力——不是那种通过智力测试或成绩评估来衡量的、实现既定目标的潜力,而是类似一望无垠的海洋地平线上低垂的斜阳所具备的那种潜力,那种开放的未来所具备的超越一切的可能性。我们不妨尝试抓住这种潜力,而抓住它们的关键,将是追逐新奇性。
但似乎仍有一个问题。追逐新奇性意味着一种漫无目的的不确定性,我们怎么知道要去哪里?这其实就是关键所在,最伟大的创新过程之所以会成功,正是因为它们并不试图去往任何特定的地方。按照这个逻辑,我们需要放弃目标带来的虚假安全感,转而去拥抱未知的、疯狂的可能性。当然,我们仍然有理由担心,这种对新奇性的探索令人不踏实,甚至可能有点听天由命。它难道不就是纯粹地从一个新奇事物,跳转到另一个新奇事物吗?我们为什么要相信,这样一个随机的过程存在任何意义?
担心这种猎奇的心态可能不会带来任何有意义的结果也符合人之常情。导致这种怀疑的一个主要原因与信息量有关。人们担心,指导未知探索的唯一有用信息是通过思考探索的目标而获得的。但事实上,新奇性蕴含的信息量并不逊色于目标概念,区别只在于二者提供的信息类型不同而已。事实上,驱动新奇性概念的信息比目标概念能提供的信息更丰富、更可靠,尤其是目标往往充当了一个错误的指南针。新奇性的概念不要求我们依赖于一个具有欺骗性的指南针,只要求我们将当前的位置与过去进行比较。
简而言之,设定目标意味着遵循一条未知的路径,朝着遥远的目的地前行,而新奇性只要求我们远离已经到过的地方。离开一个已经到过的地方,不仅更简单轻松,还蕴含了更丰富的信息。因为我们可以回顾过去的整个历史发现,将其作为判断当前新奇性的参考。因此,相信新奇性是推动进步的一台有意义的引擎。
证明新奇性在创新中具备重要作用的另一个证据是,人类往往对新奇性非常敏感。有时候,哪怕我们不确定某条道路或某个想法会通向何方,但依然会有探索它的冲动。虽然人类的直觉和预感往往促使我们朝着没有任何目标的方向前行,但我们最终依然能发现一些与众不同或有趣的东西。因此,在讨论新奇性时,趣味性的概念会自然而然地出现,这并不是巧合。当一个想法真正让人感到新奇时,它就足以让我们产生好奇心。这个想法的确激发了我们的兴趣,即使它的最终目的并不明确。
这个见解,与另一个耳熟能详的谬论有关,即“伟大的发现都来自偶然”。其谬误之处在于将偶然性看成一种意外。关于偶然发现的刻板印象,通常是一个疯狂的科学家,因为意外而稀里糊涂地发现了一些足以改变历史的重大突破。这不禁让人联想到某个动画片的故事:主人公不小心将一瓶花生酱放到微波炉中,导致了爆炸,却意外发现了反重力的秘密。然而,这种漫画故事却不当地抹黑了偶然性,因为伟大的发现从来都不是什么稀里糊涂的意外。
现实情况是,人类天生对有趣事物有着敏锐的嗅觉。大家都知道,如果我们选择了一条有趣的道路,它可能会通往重要的目的地,尽管我们可能并不知道这个目的地确切在哪里。纵观“偶然性发现”的历史,有无数个成功案例支持了这一观点。但如果偶然性发现纯属意外事件,那就意味着没有任何特殊的教育背景或智力水平的人,也能够得出同样的发现。因此,我们或许会假设,凌乱无序或疯狂甚至是开启伟大发现之旅的最佳方式。但在现实世界中,情况似乎并非如此。因为大多数重大的偶然性发现,都不是外行人的疯狂想法推动的。事实上,这些伟大的发现,大多数都出自智力超群、受过良好教育且在各自行业内颇有建树的人之手。
例如,牛顿偶然观察到一颗苹果从树上掉下来,进而发现了万有引力定律,但牛顿的职业生涯,并不仅仅局限于观察从树上掉下来的苹果,他在数学、天文学和物理学方面还有许多其他的伟大发现。另一个例子是法国科学家路易斯·巴斯德(Louis Pasteur),他在化学领域做出了重大贡献,也是微生物学的创始人之一。他的许多重要发现似乎都充满了偶然性的色彩,包括“手性”分子(chiral molecules)(注:具有不同性质的镜像形式的分子)和拯救了无数生命的细菌疫苗。像牛顿一样,巴斯德始终能够跨越多个学科进行创新。充满偶然性色彩的伟大发现,事实上不胜枚举。例如,古希腊数学家阿基米德某天在洗澡时,突然意识到浴缸中所排出的水等于他身体的体积,于是就有了举世闻名的“尤里卡时刻”:他赤身裸体冲过大街,大声狂喊着“尤里卡”。但我们对阿基米德的印象,更多的是一连串的根本性的创新,如杠杆原理、“阿基米德式螺旋抽水机”和流体力学定律。所以,这些伟大的发现者并不是狂热的、没有受过教育的人,也并非全凭纯粹的好运才得以邂逅伟大的发现。
在任何偶然性发现的背后,几乎总有一位心态开放的思想家,他们对什么计划会产生最有趣的结果往往有着强烈的直觉。虽然几千年来,万有引力定律一直静默地存在于世间,但牛顿才是第一个发现它的人。正如胡威立(William Whewell)写道:“世界上成千上万的人,甚至是最善于探究和推测的人,都曾看到过物体的自然坠落;但除了牛顿,谁又曾关注过这一现象背后的因果关系。”这些伟大的发现者,注意到了一些现象背后深刻的规律,这不仅仅是一种偶然或机缘巧合。正如巴斯德的一句名言:“在观察的领域里,机会只青睐有准备的头脑。”
如果偶然性的发现的确不是纯粹的好运,那我们是否可以通过寻找新奇而有趣的东西,最终获得偶然性的发现——哪怕我们的心中没有设定一个具体的目标?如果这个想法行得通,我们应该从科学上证明这种获取偶然性的方法是有效的,至少存在那么一个可以开展的实验,以便为这个想法提供一些科学证据。事实证明,我们的确可以开展这样的实验,但请诸位做好心理准备,接受一种不同寻常的实验程序。为了研究非目标性探索的前景,我们将设计一种没有目标的计算机程序或算法。
乍看之下,一个没有设定目标的计算机算法,似乎是一个自相矛盾的存在。“算法”这个词会直接让人联想到一些有既定方向的、机械化的东西,并且算法通常被视为解决某些特定问题的良方。人们已经设计出各种不同的目标驱动型算法,机械性地完成诸如求解微分方程、对大型列表进行排序和数据加密等任务。但本质上,算法是一种宽泛的概念。作为一种明确地描述一个过程的方式,算法是一个不存在任何模糊性的、解决问题的方法,从而确保计算机可以精确地遵循其指令。因此,虽然大多数算法都有目标,但它们也可以被用于描述没有目标的过程,比如寻找新奇的东西。由于算法能被具体地编写成可被分析和研究的计算机程序,它就可以帮助我们检测科学假设是否成立。
编写未设定具体目标的算法有一大优点,即我们可以说到做到,将资金花在刀刃上。如果仅靠寻找新奇的事物就能有效地帮助人们发现有用的东西,那么我们就应该可以真正地将这个过程,以算法的形式正式呈现出来。在算法设计出来之后,它就可以被投入测试。这种通过构建算法来测试理论的理念,在人工智能领域(与心理学领域不同)已被普遍接受。事实上,在人工智能研究中,关于任何事物的解释,只有在被构建成一个计算机程序并在计算机上运行和测试之后,才会得到普遍认可。这样一来,人工智能领域成功的门槛就变得相当苛刻,因为人工智能的研究人员不能只是简单地提供文字解释,而是必须真正建立起一项理论的原型,并通过测试证明它是有效的。因此,在这种情况下,我们可以借用人工智能领域的这一准则,并将其应用于非目标发现的论证。让我们看看,当我们给计算机编程,让它只搜索新奇的东西而没有设计特定的目标时会发生什么。
我们编写的新算法被称为新奇性搜索,其灵感来源是用户们在图片孵化器网站上的操作。我们发现,这个网站的用户获取的最佳发现成果,往往并不是他们预先设定的目标。这些“成功玩出新花样”的用户,在选择图片时采用的标准,并非某个特定目标,而是凭借本能去寻找有趣而新奇的东西。这个发现就激发了我们尝试通过编程,让电脑来干同样的事情的灵感。而将一个想法编写成算法的一个好处是,它能迫使我们去搞清楚其真正的含义。换句话说,当机器在运行测试时,我们的意图就不可能隐藏在某些含糊不清的文字表述背后。因此,要编制一个算法,我们需要首先决定计算机究竟应该如何搜索新奇的东西。
测试这样一个程序的第一步是确定什么叫领域。换句话说,计算机只会在一个特定的类别中搜索新奇的东西,如新奇的艺术、新奇的音乐或新奇的机器人行为,等等。之所以要明确领域,是因为每个领域可能需要以不同的方式进行编程,但更重要的是,领域决定了算法即将探索的空间和范围。
为了让大家更容易理解这个概念,我们以行为空间为例,因为大多数关于新奇事物搜索的计算机实验都集中在这个空间。通常在新奇性搜索中,“行为”一词指的是真实或模拟的机器人做出的一系列举动。更简单地说,机器人的行为,是指它在特定情况下做出的举动。回顾一下我们在本书第一章中用来使所有可能的图像具象化的、看不到边的“大房间”。我们可以想象一个类似的、包含了无数机器人行为的大厅,其中一个角落里的机器人可能除了不停地转圈什么都不做,而另一个角落里的机器人可能正在地板上临摹《蒙娜丽莎》的轮廓。我们可以轻易地发现,这个大厅里的一些机器人行为,与其他行为有很大不同。例如,一个四处撞墙的机器人,和一个在走廊上根据导航前进然后走进一扇门的机器人有很大不同。一旦我们有办法了解到是什么区分了不同的行为,就有可能会问:什么是新奇的行为?
试图发现新奇事物的行为可以帮助说明,即使没有特定的目标,寻找新奇事物的行为也会产生有趣的结果。想象一下这个场景:一个机器人被放在走廊的一端,另一端的门是开着的。这类实验在机器学习领域很常见,即试图让计算机具备从经验中学习的能力。在实验中,机器人会通过越来越熟练地探索走廊来学习如何接近走廊另一端的门口。例如,在一系列实验中,机器人总是被放回其起始位置,它可能会具备更强的、穿越整个走廊的能力,并越来越接近敞开的门——这就是目标。在这种目标驱动的方法中,无论哪种行为会使机器人最接近敞开的大门,它都会成为尝试新行为的踏脚石。这种将进步视为一系列逐渐接近目标的渐进式改进的观点,也反映了在我们的文化中追求成就的常见方式。
但我们也可以用一种基于新奇性搜索的、截然不同的方式来处理这个任务。例如,机器人可以无需尝试走到走廊的另一端,只是纯粹地尝试做一些与以往不同的事情。机器人可能会先撞上一堵墙,因为它一开始并不具备探索和穿越走廊的经验。(见图5.1)然而,与追求特定目标(即抵达敞开的大门)时不同,在新奇性搜索中,机器人撞墙的行为被认为是好事,因为我们以前从未见过它这样做。换句话说,撞墙的行为是新奇的,而这正是我们在探索新奇性时想要看到的东西。但如果撞墙被视为好事,那么机器人接下来可能会做什么?
注:通过穷尽各种撞墙的方式,新奇性搜索可以增加机器人对探索和穿越走廊的理解,并最终使它发现出门的方法,尽管成功地出门并不是新奇性搜索的目标。
答案是,它可能会撞上另一堵墙,但只要第二次撞墙与第一次不同,也会被认为是好事。即使第二次撞墙比第一次离目标更远,这仍然被认为是新奇性搜索的一个好的迹象,因为这一次与以往不同。如你所见,这种欣赏新奇情况而不加评判的态度,就已经使新奇性搜索有别于目标驱动型搜索了。
测试中的机器人撞上各种墙壁,听起来可能并不那么令人兴奋,但接下来发生的事情堪称神奇,凸显了新奇性搜索的力量。到了某个时刻,在撞了足够多的墙之后,就没有新的墙可以撞了。在那一刻,新奇性搜索已经穷尽了所有的撞墙选择,然后一个值得注意的事实开始发挥作用:现在机器人要做一些新奇的事情,而唯一可行的办法,就是不再撞墙。这个进步很有意思,因为学习避开墙壁,从未被表述为一个目标。但即使它不是目标,只追求新奇行为的机器人,最终也必须学会避开墙壁才有望继续产生新的行为。
事实上,寻求新奇行为的机器人,最终甚至不得不进入另一端的大门,因为它将再次穷尽在同一走廊内的所有新奇行为的可能性。这个新奇行为实验的结果令人费解:一个只被告知要寻求新奇行为的机器人,却学会了如何避开墙壁在走廊里自如地穿梭,最终走向敞开的大门,而且这些动作都没被当成指令、奖励这样的目标。按照这个逻辑,追求新奇性过程中所产生的行为的复杂性,似乎比预期更多。
同时,这种显而易见的成功似乎只是“穷尽一切可能性”(计算机科学家称之为穷举法)后出现的结果。如果你真的有时间去尝试世界上每一种可能的行为,最终也可能办成一些“聪明事”,但你可能要花上几乎一辈子的时间才能得到这个结果。这个方法听起来有点愚蠢,但事实证明,新奇性搜索中的发现比简单地尝试每一个你能想到的行为都要更深入。新奇性搜索比穷尽可能性更有趣的原因是,它倾向于以某种特定顺序来产生行为。
顺序是探索和发现的一个关键因素。事实上,我们对任何一种搜索都充满信心的主要原因是,我们期望它能指导人们以某种合理的顺序发现通往成功的踏脚石。在目标驱动型搜索中,我们通常期望坏的行为出现在好的行为之前。换句话说,我们期望搜索行为的质量,在搜索的过程中不断得到提升。这样一来,目标将带来一连串的发现这一结论似乎就合乎逻辑了。
但问题是,从坏到好的顺序虽然充满吸引力,但却是不切实际的想法。这只是目标驱动的欺骗性——这个“老骗子”安排的另一种套路。回顾一下中国指铐陷阱——在这个案例中,通往成功的唯一正确顺序是“让本就糟糕的情况,变得更糟糕”,然后才是“否极泰来”。所有的欺骗性问题都会在某一点(而且往往是在很多点)上,表现出这种误导性的特性。因此,考虑到目标的欺骗性,只遵循从坏到好的顺序,应该很难让你相信最终有可能发现伟大的事物。这就像坚定地认为通过智力测试可以将单细胞生物培育成爱因斯坦一样天真(事实上,在本书第七章中我们将看到,试图只进行从坏到好的改进,在对学生进行测试方面,也能有惊人的新发现)。这些失败意味着我们可以不再担心自己是否总是要追求从差到好,而是考虑放弃过分在意好与坏的明显顺序,这实际上可能反而更有希望令我们得偿所愿。
如你所料,新奇性搜索会产生与众不同的排序。它不会按照从坏到好的顺序进行搜索,因为没有一个目标作为标杆,它甚至不知道什么是“好”。尽管看起来,显著的“新奇性”总是比微小的“新奇性”“更好”,但这完全取决于个人在当前看到的情况——因为其他有不同经验的人,可能作出完全相反的判断。当新奇性得到回报时,“更好”不会随着时间而保持“更好”的地位。因为一旦机器人发现一个新奇的行为,随着类似行为的持续发现,其新奇性很快就会降低。
并且一种事物或行为是否被认定为新奇,完全取决于具体的时间和环境。事实上,在新奇性搜索开始之前,我们甚至无法判断哪些行为更新奇或更不新奇,因为新奇性是一个相对的衡量标准。这就是为什么孤立地考虑新奇性是没有意义的——某样东西是否具有新奇性,完全取决于它之前是否被发现过。
目标驱动型搜索则截然不同:一辆拥有更高效能发动机的汽车,总是比一辆拥有更低效能发动机的汽车更节能环保,无论两种汽车是什么时候被发明的。关键的区别在于,在搜索目标时,什么是更好的,什么是更坏的,其标准并没有改变。新奇性搜索不能提供这样一个持续不变的坏和好的概念,也不能形成一个从坏到好的排序。但事实上,新奇性搜索确实提供了一种更有趣的排序:从简单到复杂。
虽然大多数人都熟悉这样一个概念,即将进步视为一个从坏到好的过程。从简单到复杂的变化,由于没有设定明确的目标,很容易令人觉得陌生。但在某种程度上,后者更为合理,因为它不会受到目标的欺骗性的影响(因为你并未试图从中获取任何特定的东西)。寻找新奇事物的过程,将导致行为从简单变得复杂,其原因本身就非常直接。当所有简单的行为方式都耗尽后,剩下的唯一可以被发现的新行为,自然就会变得更复杂。例如,我们再回顾一下前文那个试图穿越走廊的机器人。一开始,几乎所有类型的行为都是新奇的,因为它之前从未尝试过任何行为。而在绝大多数情况下,这些最初的行为往往是简单的,就像很多简单的发明往往是通往更复杂发明的踏脚石那样。
这种简单行为的一个例子,就是机器人一开始总是走直线,哪怕直接撞到墙。但什么才是真正“简单”的行为?关于简单的本质,我们可以长篇大论地说上好几章,但在本书范围内,简单行为的关键特征是,它不要求掌握关于这个世界的任何信息或知识。撞墙是一种简单的行为,因为机器人可以在不了解墙壁、走廊的情况下做到这一点,事实上它也不需要有感知任何事物的能力。我们只是简单地打开机器人的前进马达,让对周围环境一无所知的机器人无条件地向前跑。但如果机器人最终想要成功地在有墙面的走廊里穿行,就需要获得一些关于墙的知识。这种新知识,就是新奇性搜索中化腐朽为神奇的一步——将无知无畏的探索,转化为有意义的探索。最终,做一些新奇的事情,总会要求我们学习一些关于世界的知识。就好像如果不先学会走路,就不可能发明出一种新的舞蹈;而如果不了解(哪怕是潜意识的)重力和运动的相关知识,就无法行走那样。
归根结底,我们必须获得某种知识,才能继续创造新奇事物,这就意味着新奇性搜索是一种信息收集器,用于不断积累关于世界的知识。搜索的时间越长,它最终积累的关于世界的信息就越多。当然,信息量和复杂性是相辅相成的,更复杂的行为必然需要更多的信息。
有趣的是,新奇性搜索并不是唯一一种不断积累信息的搜索。信息的积累和复杂性的增加,是任何一种没有设定明确目标的搜索的标志性特征。新奇性搜索是一种特殊的非目标搜索,但其他的搜索,比如自然进化,也明显表现出了这种特征。虽然自然进化与新奇性搜索不同(我们将在本书结尾处第一个案例的研究中更深入地探讨二者之间的关系),但它与新奇性搜索有一个共同的关键属性,即它最终产生的东西,不是它最初设定的目标。由于这个原因,前面讲到的自然进化也成为一个从简单到复杂的信息收集器。
正如斯蒂芬·杰·古尔德 (Stephen Jay Gould)(注:斯蒂芬·杰·古尔德(1941—2002),美国人,世界著名的进化论科学家、古生物学家、科学史学家和科学散文作家)指出的那样,在进化过程中,一旦所有简单的生存方式都被开发殆尽,创造新物种或生态位的唯一途径就会变得更加复杂。换句话说,进化成细菌类生命体的方式,无论有多少,都是有限的。这就是为什么如果自然界要继续进化,复杂性的增加便几乎是不可避免的结果。但是这些复杂性的增加,并不是任意的。相反,它们反映了进化过程所在的世界的属性,例如眼睛的出现,代表宇宙中光的存在,耳朵象征着机械振动的存在,而腿和肺部则分别是重力和氧气存在的证明。
在对进化的常见解释中,类似眼睛或肺部等器官的进化,可能被认为是目标导向性带来的进步,因为它们提高了生物的生存能力。但它们也可以被看作一种不可避免的趋势,由一项没有最终目标的搜索,积累了关于其所处世界的信息所导致。毕竟,最初的单细胞生物并不具备眼睛或肺部这些花哨的器官,但它们依然存活得很好,没出任何问题。唯一的问题是,生物如果想要做一些新奇的事情,就需要将自然界某些方面的信息反馈到其DNA中。严格来说,视觉驱动的行为,并不是生物生存的必要条件,但如果自然界通过突变,不断尝试设计新的物种,即使没有设定任何特定目标或方向,进化过程也最终会意识到光的存在这一事实。然后,它将成为进化论积累的信息库存的一部分。
从某种意义上说,经过漫长岁月的进化后,人类的身体已经成为一种关于人类所处的宇宙的相关事实的百科全书。不仅宇宙的许多物理现实已经反映在人类的身体结构中(例如光、声音、重力、热、空气等),而且考虑到进化已经持续了如此漫长的时间,人类现在实际上已经在身体内部的某个地方,编码了令人难以置信的、关于宇宙的具体细节信息。人类的大脑记得哪些行星是围绕太阳旋转的,甚至记得街角商店里百吉饼的价格。在人类的一生中,学习和适应的能力已经将进化的信息积累性质,推向了一个新的极端。当然,这并不意味着自然进化的这个信息积累过程,会因人类的出现而停止。但我们再次观察到的是,没有明确目标的搜索(在这种情况下指自然进化),从最简单的单细胞生物进化到最复杂的动物的过程,也是不断积累信息的过程。这就是为什么地球上的生物已经成为一面反映世界现实的镜子,不同的物种,以庞大的多样性,反映了我们身处的宇宙所赋予的、物质形态上的无限可能性。
这种非目标搜索的观点,也解释了这样一个事实:图片孵化器网站好比是一面镜子,它向我们反映了一些关于人类世界的信息。毕竟,图片孵化器网站就是在人类世界里诞生并不断发展的。因此,它已经成为一个收集了人们熟悉主题的庞大目录:从蝴蝶到人脸、从城堡到行星、从日落到宇宙飞船。尽管这些都不是它的目标,但它们都是在这个网站上被发现的。
与图片孵化器网站或自然进化一样,新奇性搜索是另一种类型的非目标搜索。它不像自然进化那样神奇,但它的优点是,可以变成一种能在计算机上运行的算法,因此我们可以科学地测试它,看看它能做些什么。它也提供了极大的便捷性,因为它可以应用于容易编程的领域,如走廊内机器人行为的简单模拟。可以想象,单机电脑游戏Pong(注:Pong是美国雅达利公司(ATARI)于1972年发行的一款投币式街机游戏,该游戏模拟乒乓球比赛,玩家需要控制乒乓球拍上下移动来反弹乒乓球。如果一方未能反弹乒乓球,对方就会得到1分。该游戏被认为是世界首款视频游戏)的编程肯定比完全沉浸式的现代三维射击游戏(通常需要花费数百万美元来开发)要简单得多。因此,要判断非目标搜索在新奇性搜索中的优势,我们不必编写最复杂的程序,例如展示地球所有的荣耀历史,重现类似自然进化这样的宏大脉络,等等。如果它能够像预期的那样运作,我们应该能够在新奇性搜索运行时发现信息收集器正在按由简到繁的顺序收集信息,并表现出明显的非目标特性。为了不断寻找新事物,最终机器人不得不发现,周围世界是由墙壁和门组成的,而它虽然会撞到墙壁,但却能穿过门洞。
但是,即便你暂时接受了这个观点,即搜索是从简单到复杂的过程,你仍可能担忧新奇性搜索最终会永远地被困在毫无意义的行为之中,找不到任何有意义的出口。目标的设定之所以让人放心,是因为它将无穷可能性的空间,压缩到仅剩少数几个实用的选项。例如,既然可以选择开车去上班,那便没有人会认真考虑爬行去上班的好处。换句话说,目标可以帮助剔除那些明显“得不偿失”的想法,这可以避免人们在与目标不相关的活动中白白浪费精力。相比之下,新奇性搜索似乎缺乏这种实用性的约束,这可能意味着它会导致我们浪费大量的时间,在毫无意义的可能性的空间里徘徊。
然而,我们有充分的理由相信,我们不需要目标的约束来避免无意义的浪费。物理世界自身就提供了很多约束。新奇性搜索不会考虑许多可以想象但无法实现的行为(例如人类依赖自身的躯体飞行),因为它们是不可能的。例如,机器人不能穿过一堵墙,所以即使我们可以想象瞬间移动(teleportation)(注:超心理学领域中超感官知觉的一种,指的是将物体传送到不同的空间,或者自己在一瞬间移动到他处的现象与能力),这些行为都不会被考虑,因为瞬间移动是一种在物理层面不可行的行为,也就是说,这种搜索的空间不存在。
一般来说,人类可以想象的许多行为,都会因为现实物理世界的限制,而沦为同样的结果。例如,我们可能想象过成千上万种穿墙而过的行为,但是由于物理现实的限制,所有这些可想象的行为,在现实中都被简化为同一个结局,即撞到墙上并停下来,因为穿墙而过根本就不可能实现。重力以类似的方式限制了人类的行为,所以无论你如何想象自己在天空中自由飞翔,当你从前廊跳下时,现实的结果几乎总是同样的不幸——摔得伤痕累累。
因此,在搜索新奇事物时,实际尝试的行为空间变成人类可以想象的所有行为空间。这个空间虽然看似更大,但新奇性搜索的空间,仅是其中的一小部分,这也是新奇性搜索变得实际可行的前提。世界的物理特性限制了新奇性搜索能考虑的所有行为,这一想法也解释了新奇性搜索积累世界信息的趋势:真正成为下一步行为的踏脚石的那些行为,必须尊重现实世界运作的方式和规律。回到上文的例子,开车去上班比爬行去上班更有可能获得新奇感,因为你不需要将一整天的时间都花在上下班的路上。因此,在同时面临这两种选择时,新奇性搜索会倾向于集中在开车去上班这一选项上,因为这是一块更优质的踏脚石。正是由于这个原因,进一步的探索最终会集中在有意义的概念,而非毫无意义的徘徊上。简而言之,创造新奇事物的最佳方式,是利用世界真正运作的方式,并据此积累有关信息。
在这一点上,你可能会质疑新奇性自身,是不是某种特殊类型的目标。事实上,自从2008年首次推出新奇性搜索算法以来,我们已经反复听到了类似的质疑。人们会对“没有目标的发现会更好”这一反直觉的信息持怀疑态度,这是正常且合理的。每当有新的理论挑战主流的世界观时,人们自然会试图恢复旧有的秩序,而一个常见的办法便是通过重新解释新的理论以适应旧的思维方式,避免彻底地推倒重来。本着这种精神,拯救目标驱动范式的最常见尝试,是试图将新奇性强制套入旧的目标驱动观点,将新奇性本身描述为一个目标,但这种策略存在很大的弊端。看到我们在下文回顾其中的一些论点时,你可能会想起本书上一章中关于为什么生存和繁衍不是传统目标的讨论。但这里的区别是,我们关注的是更广泛层面的问题,即新奇性本身是否应该被称为一个目标。
就传统目标而言,成功意味着得偿所愿。例如,你想成为一名银行家并最终成了一名银行家,那么你的目标就实现了。关于目标,我们通常认为,当我们实现了所设定的目标时,目标就得到了满足。但是——这就是把新奇性称为目标的第一个问题——新奇性并不是这样运作的。毕竟,如果你的行为与其他人不同(或与你过去的行为不同),你也可能会成为一名银行家,但在这种情况下,成为一名银行家并不是你的目标。在探索新奇事物的过程中,你成为什么或实现什么,永远不是你的目标。因此,新奇性与目标有着本质的不同。
你可能会继续驳斥说,即使一个人确实通过保持新奇,最终努力成了一名银行家,那么他依然实现了保持新奇这个目标,哪怕成为一名银行家并不是目标。然而,第二个问题随之而来,“保持新奇”本质上是一个难以捉摸的、变化莫测的概念。我们不可能时刻牢牢地秉持这个理念。例如,如果你保持银行家的身份太久,新奇性便丧失了。那么我们是否可以说,你已经不再满足“保持新奇”这个目标了呢?从另一方面来看,如果你的目标是成为一名银行家,而你最终也成了一名银行家,这个目标就得到了绝对满足,其满足性并不会随着时间的推移而变得模糊或难以界定。不仅如此,假设保持新奇是你的目标,那么你在成为银行家的过程中可能更换过多种职业,每一种职业都与上一份职业不同,实现了新奇的目标。这会令你陷入一个自相矛盾的境地,即在成为银行家之前,你实际上已经多次实现了“保持新奇”的目标。那么就这个意义而言,成为银行家对实现新奇性的“目标”是否还有意义?最根本的问题在于,将新奇性视为一个目标,需要我们扭曲自己的逻辑,以尽可能地套用传统的、以目标为导向的思维方式。
然而,这种逻辑层面的扭曲完全没有必要。我们在本书中探讨“目标”一词,是为了帮助诸位做出重要的区分,而不是掩盖差别或混淆定义。如果你能仔细思考“新奇性是如何从简单走向复杂的”这一问题,那么搜索新奇性的整个过程,与追求传统目标的实现,两者之间存在本质性区别。这就是如果我们试图用“目标”概括所有类型的发现和探索过程,就必须要做出前述逻辑扭曲的原因。目标是驱动成功的老式引擎,而新奇性则是不同的东西。为此,让我们时刻牢记目标与新奇性这两个不同术语的差异,而不是将二者混为一谈。
同样的逻辑过程也解释了为何“新奇性搜索”很像自然进化中的“生存和繁衍”(这也是一种非目标型的发现过程)。两者都是对可能发生的事情的约束,并且可能都在一开始得到满足(就像单细胞生物也同样满足了“生存与繁衍”的“目标”)。这两个过程,都催生出了并未被设定为初始目标的伟大发现,且两者均未设定任何具体的目标。这些都是非目标探索的显著标志。
此类非目标进程的另一个重要且强有力的属性,是它们与发散以及发散性搜索概念之间的关联。目标在本质上会促使探索的过程朝着特定目标聚拢,而聚合效应则意味着许多潜在且有趣的方向将得不到探索。然而,剥离了目标的聚合性负担之后,探索就可以自由地朝着多个方向分化,在不断发散的同时,收集不同类型的新踏脚石。尽管发散性探索牺牲了朝着某个预定的方向进行探索带来的舒适感和安全感,但发散性思维这个词通常与创造力和创新联系在一起也并非巧合。正是因为发散性思维者不会被困在“搜索空间”的一个陈旧角落里,所以他们通常以大胆无畏和令人惊讶的发现而闻名,其他目标导向者往往会因专注于目标而错过这些发现。放弃设定明确的最终目标,新奇性搜索就成为一种发散性的搜索形式,从而成为类似自然进化和人类创新的探索和发现过程,并充分契合了这种更奇特和激进的发现形式。
正如前文所述,从科学的角度来看,新奇性搜索概念的一大吸引力是,它实际上可以被编成一种计算机算法,并进行可衡量的测试,这正是我们所做的。事实上,到目前为止,我们已经将新奇性搜索置于大量不同的场景中进行了测试,第一项就是机器人在迷宫中的模拟实验。换句话说,我们对计算机进行编程,模拟机器人在围墙式迷宫中的行为,类似于驾驶模拟器模仿汽车上路的状况。这就好像电脑自己玩的一个简单的视频游戏。机器人模拟实验在人工智能领域很常见,因为模拟的机器人可以非常迅速地反复尝试新的行为,而且不存在器材损毁风险。下图是其中一个迷宫的示意图。
注:大圈代表机器人的起始位置,小圈代表目标位置。地图中看似通往目标位置的死胡同具有欺骗性。
所以想象一下,一个带轮子的机器人在迷宫中尝试新奇性搜索,总是试图做出一些新举动,实验将如何开展?基本的想法是,计算机程序可以先产生新的“想法”,然后机器人尝试做出相应的行为。如果该行为在机器人尝试时被证明是新奇的,那么该行为可能是有趣的,所以程序可以将其认作一个好主意。请注意,这种判断想法质量的方式,与设定了具体目标的情况不同。例如,如果设定的目标是让机器人从起点位置走到迷宫的终点,那么“好”的行为,就应该是那些让机器人最终会比之前更接近迷宫终点的行为。
什么行为是好的或坏的是一个很重要的问题,因为程序将只会继续探索被认定为“好”的想法。换句话说,新奇性搜索的希望在于,好的想法可能是通往有趣事物的踏脚石。因此,在尝试了一系列的行为之后,程序决定专注于测试那些看起来有趣的行为。为了做到这一点,程序将采用这些新奇的想法并进行微调,继而观察是否会出现更有趣、更新奇的东西。如果机器人绕过一堵从未绕过的墙,那么对该行为的微调就有可能让机器人走得更远。另一方面,如果机器人做了以前做过很多次的事情(比如撞墙),那么这个行为就会被忽略,不会被进一步探索。这种专注于如何在迷宫中实践更新奇的想法的方式,与任何其他类型的创造性思维相同,即你可能有一个有趣的想法,然后在思考一段时间后,发现它启发了其他有趣的想法。
这将是实验变得更耐人寻味的地方。想象一下,如果机器人不断尝试新的行为并进一步探索最新奇的行为,它就与我们在本章前文描述的那个机器人有点像:一开始总撞墙,然后知道了如何避免撞墙,最后学会穿过门洞。问题是,如果我们持续这样的新奇性搜索过程,机器人最终会不会发现一个能破除整个迷宫的行为(换句话说,一个能驱动机器人从起点顺利走到终点的行为),哪怕走出迷宫并不是它的目标?
实验结果表明,答案是肯定的——如果我们运行一段时间的新奇性搜索算法,计算机将持续产生驱动机器人通过整个迷宫的行为。这个实验结果很有趣,因为没有人编写让机器人顺利通过迷宫的程序。更重要的是,穿越迷宫从来都不是一个既定目标,该程序甚至不知道目标的存在。因此,有趣的是,新奇性搜索最终发现了一个看起来相当智能的行为,尽管从来没有人告诉计算机它应该做什么。
但是,情况从这里开始变得更加复杂,因为新奇性搜索并不是我们利用这个机器人走迷宫程序进行测试的唯一算法。我们还利用机器人走迷宫来测试了一种传统的、基于目标的探索方法:在这个测试中,一个驱动机器人更接近终点目标的行为被认定为更好的行为。换句话说,计算机将进一步探索那些驱动机器人更靠近目标的行为。这与大多数目标驱动型活动的运作方式相似,即我们不断地将时间和精力投入那些能够使我们更接近目标的行为上。
如果你是目标论的“粉丝”,并且认为目标是实现任何伟大的成就不可或缺的因素,那么你可能会认为:基于目标的方法在发现通往迷宫终点的行为方面,比新奇性搜索更可靠,因为后者甚至没有设定任何目标。但实验的结果恰好相反,新奇性搜索在探索走出迷宫的行为方面要可靠得多。具体来说,我们重复了40次新奇性搜索的迷宫实验,机器人在39次实验中找到了终点;而40次基于目标的迷宫实验中,机器人只成功了3次。
试图找到走出迷宫的行为,在大多数情况下都失败了,而不尝试这个目标的行为却一直成功,这个结果的确出乎意料。是不是因为实验设置存在一些缺陷呢?正如你可能猜到的那样,自从最初的迷宫实验以来,科学界已经针对这个问题进行过多次辩论,现在已经有很多科学文献提供了此类讨论的大部分细节。探讨的结果表明,这个实验有着坚实的基础,并遵循了本书迄今为止一直在强调的逻辑,即只关注目标会导致欺骗性结局。看似离目标更近的机器人,实际上经常会走进死胡同,这些死胡同与通往真正解决方案的正确路径相去甚远。我们可以在图5.2中看到这些死胡同,它们就像其他欺骗性的陷阱一样——实际上与中国指铐这种整蛊玩具没有本质区别。看起来能让机器人更接近终点的方向,最终却成了错误的方向。另一方面,新奇性搜索不存在欺骗性问题,因为它连目标都没有,也就谈不上所谓的目标欺骗性了。它只是尝试不断发现带来新行为的行为。最终,其中一个新行为,恰好帮助机器人解决了迷宫难题。
有些人认为,迷宫中的欺骗行为太明显了,它被故意设置成一个迷惑机器人的问题。但实际上,它并不比任何其他欺骗性问题更具迷惑性——这意味着几乎所有有趣的问题都是如此。不过,为了说服那些仍持有怀疑态度的人,我们确实在一个更自然的场景中尝试了新奇性搜索实验——双足机器人(biped robot)。换句话说,我们试图为一个拥有双腿的模拟机器人寻找新奇的行为。
如果你的第一反应是,“双足机器人想做什么?”那么你就忘了,新奇性搜索并不试图做任何特殊的事情。它只是观察双足机器人正在做什么,正在尝试什么新行为,而这些行为在被发现时,都是新奇的。因此,如果双足机器人摔倒了,只要它此前从未以同样的方式摔倒过,这就是一个好的行为。你认为一个寻找新奇性的双足机器人,最终会做出什么行为?
答案是,双足机器人学会了行走(见下图)。并且新奇性搜索中的双足机器人学会行走的方式,比设定了以行走为目标进行学习的情况更好。换句话说,一个尝试越走越远的双足机器人,行走的距离反而不如一个试图一次又一次地尝试一些新奇动作的双足机器人。不出所料,背后的原因依然是目标的欺骗性。因为通往行走这一发现的踏脚石不一定是走得好,甚至不一定是平衡感。摔倒或踢腿可能反而是比迈步更好的踏脚石(因为踢腿是摆动的基础,而摆动是行走的基本方式)。但如果行走被设定为目标,那么摔倒就会被认定为最糟糕的一件事情。因此,新奇性搜索在这个实验中的表现,再次将目标驱动型搜索的表现远远甩在身后。
注:Frame=画面(1、2、3、4……12)
有趣的是,我们进行的机器人走迷宫和双足机器人的新奇性搜索实验结果,并没有“独领风骚”太长时间,因为来自世界各地的研究人员,也开始关注新奇性搜索。由让·巴蒂斯特·穆莱(Jean Baptiste Mouret)领导的法国科学家团队,复制了迷宫实验的结果 。在加拿大,约翰·杜塞特(John Doucette)将新奇性搜索应用于计算机程序的进化,这些程序用于控制试图追踪食物的人造蚂蚁的行为。在捷克,彼得·克拉荷(Peter Krcah)发现新奇性搜索不仅有助于解决搜索行为的欺骗性问题,还有助于设计模拟机器人的身体 。在美国,希瑟·格斯伯(Heather Goldsby)用新奇性搜索来发现计算机程序中的错误。而在我们位于佛罗里达州的实验室里,我们的同事塞巴斯蒂安·里西(Sebastian Risi)发现,终生学习并适应其环境的机器人也可以从新奇性搜索中获益。从其广泛的应用可以看出,机器人迷宫和双足机器人实验的结果并不是空穴来风,反而证明在一般情况下,新奇性搜索有时可能比寻找一个特定的目标产生更好的结果。因此,通过不试图实现任何目标的做法,我们往往能够获得更多发现——现在我们还拥有一系列实验证据来支持这个结论。
当然,也有人证明了新奇性搜索的局限性,说它不能“一招鲜,吃遍天”。在进一步的迷宫实验中,我们生成了数百个不同难度的随机迷宫,并分别用新奇性搜索和目标驱动型搜索的方法来破解这些迷宫。数据显示的趋势是,随着迷宫变得越来越复杂,新奇性搜索和目标驱动型搜索都无法破解迷宫,但目标驱动型搜索解决问题的能力衰减得更快。换句话说,新奇性搜索的能力维度更大,但也不是无限的。这个结果提出了一个深刻的问题:对于最复杂的问题,还有什么方法可以确保持续性地解决它们呢?
关于这个问题,或许不存在一个真正令人满意的答案。许多人都幻想过这个世界上存在一个万能的公式,能够让我们解决所有问题。这种想法是如此诱人,甚至吸引了很多人投入毕生的激情和时间。但这就好像历史上的探险家对青春不老之泉的虚幻追求。我们可能一直从错误的角度来看待整个问题,也许我们根本不可能总是在想要满足愿望的时候就能够得偿所愿。也许并不存在什么神奇的方法,让我们总是可以达成每一个可以想象的目标。最终,人类所有探索和发现的行为都可能是徒劳的,正如我们将在本书下一章探讨的那样。但是,即使没有万能的方法,也不能阻止我们发现有趣的事物。哪怕我们的探索漫无目的,在前方未知的道路上依然埋藏着无数的宝藏。我们可以将它们都挖掘出来,享受它们带来的意外之喜,即使我们无法预知“能发现什么”或“何时发现”。这就是趣味性和新奇性搜索教给我们的经验。但是,为了最清楚地理解这一点,我们需要理解潜伏在所有发现方法背后的徒劳本质,这样我们才能从目标的“一招鲜,吃遍天”的虚妄幻想中解放出来,继而拥抱现实,让自己成为一名拥有“即便没有目标,也能发现意外之喜”这种强大能力的“寻宝者”。
热门跟贴