计算机虽然只有几十年的历史,但是人类想弄明白智能,已经超过2000年了。如果要找个祖师爷,那么就得上溯到古希腊的苏格拉底。你可能听说过,苏格拉底在雅典的街头,喜欢拉着年轻人辩论。他有一个著名的方法,就是通过不断提问,让对方发现自己观点中的矛盾。乍一听,苏格拉底就是个天天跟人抬杠的杠精。实际上,苏格拉底有一个野心:他相信,人类的思考是有规律的,这些规律可以被发现、被总结、被传授。比如我们的思考当中,什么是有道理的,什么是没道理的呢?苏格拉底总结了一个原则,叫“矛盾律”:一个东西不能既是什么又不是什么。咱们就拿AI举例子,你在互联网上能看到两种很常见的预言AI未来的言论,一种强调“信息茧房”:AI会发现你内心最隐秘的需要,以后就只喂给你那些让你爱看的信息,以后我们就都会困在独属于自己的狭小的资讯世界里。

还有一种言论会提到“回形针理论”,这是一个科学家的想象:一家生产回形针的企业造出了一个足够强大的AI,并且赋予它最高级别的使命,尽可能多地制造回形针。AI通过联网迅速操控了整个地球甚至更多的行星,从地球到外太空,都布满了生产回形针的工厂。随后,它又判断出,人类的存在占用了宝贵的资源,影响了回形针的产量,于是它灭绝了人类,再生产更多的回形针。我也没办法说,这两个预言哪个是错的,毕竟未来的事情谁能那么坚定呢?但是如果你看到一本书谈论AI,一边说的是信息茧房,一边说的是回形针理论,那他肯定是错的。因为AI不可能既能探究人类内心最隐秘的需要,又一根筋到给他下达一个生产回形针的命令,他就连人类生命都不顾了。你看,这就是矛盾律。AI不能既懂人类又不懂人类。你可能会觉得,这也太简单了吧?没错,用今天的眼光来看,苏格拉底的总结比较粗糙。但是,它有重大意义,苏格拉底给了后人信心,思考不是一种神秘的天赋,而是一种可以摸清的规律,一种可以学习的技能。如果没有这样的信心,那么人工智能就不会被发明出来。

这个想法在17世纪被德国哲学家、数学家莱布尼茨推进了一大步。莱布尼茨是个数学天才,他发明了微积分,还发明了二进制。但是他最大胆的想法是:能不能把人类的所有思想,都用符号表示出来?就像数学公式一样,用符号和规则来表达。如果能做到这一点,那么思考就变成了计算,争论就变成了演算。两个人意见不合的时候,不用吵架,坐下来算一算就知道谁对谁错了。莱布尼茨把这个想法叫做“通用符号语言”。他相信,只要找到合适的符号系统和推理规则,人类就能用机械的方式解决所有的思考问题。莱布尼茨的这个想法,在当时听起来就像是科幻小说。两个哲学家吵架,不用争得面红耳赤,坐下来拿出纸笔,算一算就知道谁对谁错。但是你别笑,200年后,真的有人认真地去实现它了。莱布尼茨的梦想在20世纪初被德国数学家希尔伯特重新提起。1900年,希尔伯特在巴黎的国际数学家大会上,提出了23个数学难题。但是他最大的野心不是解决这些,而是要为整个数学建立一个完美的基础。希尔伯特相信,数学可以被完全形式化。什么意思呢?就是把所有的数学知识,都归结为一套符号和推理规则。只要这套系统是自洽的、完备的,那么所有的数学问题都可以通过机械的推理得到答案。希尔伯特在数学家大会上发表了热情洋溢的演讲,结尾是这样两句话:“我们必将知晓,我们终将知晓。”

你看,从苏格拉底到莱布尼茨再到希尔伯特,这2000多年来,人类一直在追求同一个梦想:把思考变成计算,把智慧变成规则。如果这个梦想能实现,那么制造一台会思考的机器,就不再是天方夜谭了。但是,1931年,一个25岁的年轻人给希尔伯特的梦想泼了一盆冷水。这个年轻人叫哥德尔,他证明了一个惊人的定理:任何一个足够强大的形式系统,要么是不完备的,要么是不自洽的。这话听起来很抽象,我们用一个比喻来理解。不完备,就是说这个系统里有些问题它自己回答不了,就像一本百科全书,总有它没收录的词条。不自洽,就是说这个系统会自相矛盾,就像一本书里前面说所有天鹅都是白的,后面又提到一只黑色天鹅。哥德尔证明的是:你不可能做出一本既什么都能回答、又永远不矛盾的百科全书。哥德尔的不完备定理,被认为是20世纪最重要的数学成果之一。它告诉我们,希尔伯特的梦想是不可能实现的。数学不能被完全形式化,思考也不能被完全规则化。这是不是意味着,人工智能的梦想也破灭了呢?就在哥德尔证明不完备定理的几年后,另一个年轻人给出了不同的答案。这个人叫艾伦·图灵。1936年,图灵发表了一篇论文,提出了一个假想的机器,后来被称为“图灵机”。这个机器非常简单,就是一条无限长的纸带,一个读写头,还有一套规则。读写头可以在纸带上读取符号、写入符号、左移或右移。就这么简单的装置,图灵证明,它可以计算任何可计算的东西。

你可能会问,这和AI有什么关系?关系大了。图灵机告诉我们,计算是一种非常基础的能力,任何复杂的计算过程,都可以被分解成简单的步骤。而人类的思考,在某种程度上,也是一种计算过程。1950年,图灵发表了另一篇著名的论文,题目就叫《计算机器与智能》。在这篇论文里,图灵提出了一个问题:机器能思考吗?为了回答这个问题,图灵设计了一个测试,后来被称为“图灵测试”。测试的方法很简单:让一个人通过文字和两个对象交流,一个是人,一个是机器。如果这个人分不清哪个是人哪个是机器,那么我们就可以说,这台机器具有智能。你看,图灵这个测试的高明之处在于,他把一个哲学问题变成了一个可操作的实验。他不问“机器有没有意识”这种形而上的问题,而是问“机器能不能骗过人类”这种可以验证的问题。这就是哲学问题和技术问题的区别。

图灵在论文里还反驳了9个反对机器思考的观点。比如有人说,机器没有意识,所以不能思考。图灵说,你怎么知道别人有意识?你只能通过别人的行为来判断。如果一台机器的行为和人一样,我们为什么不能说它有意识呢?还有人说,机器只能做它被编程做的事情,不能创造新东西。图灵说,人类的大脑也是按照某种规则运行的,为什么我们能创造,机器就不能呢?图灵的这篇论文,为人工智能的研究奠定了哲学基础。他告诉我们,机器能不能思考,不是一个形而上的问题,而是一个可以通过实验验证的问题。你看,从苏格拉底到图灵,两千五百年的时间里,人类一直在思考智能的本质。从这段历史里我们能总结出人工智能的第一个规律:人类两千多年对智慧的探索是有一条一以贯之的发展线的,人工智能也在这条线上。AI不是天外飞仙,它是人类智能的延伸。引用书中的话:“人工智能的出现不是对哲学家的否定。相反,它是一封写给2000年来所有哲学家的情书。”这么看来,虽然希尔伯特的数学野心无法实现,但是他那两句话“我们必将知晓,我们终将知晓”看起来还没有失效。如果观察更近一段时间人工智能的发展,我们还能总结出第二个规律:人工智能最大的突破来自于涌现。什么叫涌现?咱们拿蚂蚁举例子。单独一只蚂蚁,看起来很笨,行为也很简单。但是,当成千上万只蚂蚁聚集在一起,形成一个蚁群的时候。蚁群能做的事情,远远超过单只蚂蚁的能力总和。它们能建造复杂的地下城市,有通风系统、储藏室、育儿室。它们能组织大规模的狩猎和采集活动,能找到最短的路径,能根据环境变化调整策略。这就是涌现。当一个系统的规模和复杂度提升到某个临界点之后,系统会突然出现一些新的、之前完全没有的性质。这些新性质不是单个部分具有的,而是从整体的相互作用中“涌现”出来的。涌现的关键特征是整体大于部分之和。一只蚂蚁只能做20种动作,但是一个蚁群能做的事情,不是20乘以蚂蚁数量,而是远远超过这个数字。

而且,涌现还有不可预测性。你没法通过研究单只蚂蚁预测出蚁群会有什么能力。只有当蚁群真正形成的时候,这些能力才会显现出来。人类的大脑,有大约860亿个神经元。每个神经元本身并不聪明,它只是接收信号、处理信号、发送信号。但是当860亿个神经元连接在一起,形成一个巨大的网络,智能就涌现出来了。我们能思考、能学习、能创造,这些能力不是单个神经元具有的,而是从整个神经网络中涌现出来的。我们再用一个更直接的例子来理解。就像你学英语,一开始只会几个单词,只能说非常简单的话。但是当你的词汇量达到一个临界点时候,突然就能读懂文章、写作文了。这个“突然就会了”的时刻,就是涌现。人工智能也是一样,当它的神经网络参数量从1000万增加到1亿的时候,可能没什么变化。但是当参数量达到10亿、100亿的时候,它突然就聪明了。更进一步说,人类的自我意识、我们对世界的感知、我们的情感和欲望,很可能也是涌现的产物。我们总觉得自己有一个“我”,有一个主宰一切的意识中心。但是这个“我”,可能只是860亿个神经元相互作用涌现出来的一种幻觉。这个观点听起来有些疯狂,但是它指向了一个惊人的结论:如果人类的智能是涌现的,那么人工神经网络的智能,也可以是涌现的。只要网络足够大,数据足够多,训练足够充分,智能就会自然而然地涌现出来。

甚至张笑宇老师还往前推进了一步,他采用了耶鲁大学生物物理学家哈罗德·莫洛维茨的“万物涌现”理论。这套理论认为,从宇宙大爆炸到今天,演化史一共有 28 个涌现的步骤。从基本粒子组成各种物质,到蛋白质的出现,再到生命的诞生,人类文明的每一个关键节点,我们都能看到涌现的影子。张笑宇老师总结了一个公式,道出了涌现的核心:简单规则+巨大规模=系统升维。说得玄一点,如果宇宙中,有个恒定不变的「道」,那么涌现可能就是这个法则。