19世纪中叶,一场科学史上最为浩大的冲击波席卷了物理学。1865年,苏格兰物理学家、数学家詹姆斯·克拉克·麦克斯韦(James Clerk Maxwell)发表了一篇由7个部分组成的论文《电磁场的动力学理论》(A)。这篇论文就好似一场充斥着类比和方程式的马拉松,麦克斯韦通过其洞察力证明了电和磁这两种本身就已经很重要的物理概念之间还存在着一层更为深刻而重要的关系。具体来说,麦克斯韦电磁场理论所打下的数学基础有助于我们将电和磁的方程式看作同一枚硬币的两个面。他又在这个过程中得出结论,还有第三种东西也是该电磁场中的一个重要部分,这便是光波。

当然,早在麦克斯韦之前的几个世纪,科学家就已经对电、磁和光进行了研究。他们已经了解了一些相关的知识,知道它们是如何相互作用的以及人类如何利用它们。但麦克斯韦提出的这种统一理论与先前的观点截然不同,它是一种解释物理世界的全新方式,是一连串里程碑式的基础物理学发现中的第一张多米诺骨牌,它为当今的许多技术铺平了道路。例如,爱因斯坦的工作就建立在电磁场理论之上,据说他将自己的成功归结为“站在了麦克斯韦的肩膀上”。

麦克斯韦的理论不仅对具体的研究产生了直接影响,而且还在日后物理学家的脑海中植入了这样一种想法,即物理上的各种作用力之间可能还存在更多潜在的关系,而挖掘这些关系就成为理论物理学最主要的目标。

到20世纪,人们开始寻找所谓的大统一理论,首先的目标就是进一步将电磁相互作用与其他两种相互作用力相统一:控制放射性衰变的弱相互作用力和维持原子核的强相互作用力。1970年,人们朝着这个方向迈进了一大步,他们发现在很高的温度下,弱相互作用力和电磁相互作用力会合二为一。即便如此,若是将强弱相互作用力都纳入理论,就意味着会遗漏另一个重要的物理量,也就是引力。因此,在追寻一个完整的大统一理论的道路上,物理学仍未停歇其脚步。

大统一理论符合物理学家的审美口味,它简单、优雅且完备,展示了整体是如何超越部分之和的。在找到大统一理论之前,科学家就像是古老寓言中摸象的盲人一般,他们中每个人都只能依赖于从象鼻、象腿或象尾中获取少量信息,通过这些信息,他们只能得出有关各个单独部分的不完整的故事。然而一旦看见了整只大象,我们就能锁定这些部位,并结合周围部分对其进行理解。

大统一理论所带来的深刻智慧,是单独研究部分所无法比拟的。因此,尽管寻找大统一理论的道路荆棘密布,物理学界大体还是认为值得为之付出努力。物理学家迪米特里·纳诺普洛斯(Dimitri Nanopoulos)参与创造了“大统一理论”一词,在1979年他是这样说的:“大统一理论对一大堆各不相同且乍看之下毫不相关的现象给出了非常好的合理解释,它绝对有资格也有权利值得我们认真对待”

但大脑的大统一理论值得我们认真对待吗?诚然,用少数简单原理或方程式就能解释大脑的一切结构和功能,这个想法听起来很诱人,也是大统一理论在物理学中令人垂涎的原因。然而大多数科学家都怀疑它是否真的存在。正如心理学家迈克尔·安德森(Michael Anderson)和托尼·切梅罗(Tony Chemero)所写的那样:“我们完全有理由认为,不存在一个有关大脑功能的大统一理论,因为我们完全有理由认为,像大脑这样复杂的器官,其运作原理五花八门。”尽管大脑大统一理论听起来很棒,但许多人都认为这只不过是一种幻想。

但同时,神经科学从物理学中借鉴的许多东西,如模型、方程式以及思维方式,都已经以其各自的方式助力了神经科学领域的发展,而大统一理论作为现代物理学的核心不容忽视。对于研究大脑的人来说,尽管大统一理论看似不太可能,但它确实诱人,而对于一些科学家来说,大统一理论实在是太诱人了,以至于他们绝无可能轻言放弃。

本文作者· Author

Grace Lindsay

纽约大学心理、数据科学助理教授

她的主要研究领域有三个:建立注意力和学习之间的联系模型、验证系统神经科学的工具、将计算机视觉用于应对气候变化。出版科普图书、主持播客节目UnsupervisedThinking、参与科学写作与学术传播活动,还致力于将数据科学用于应对气候变化等跨学科研究。

在大脑中寻找大统一理论是一项高风险高回报的工作,因此,它通常需要一个大人物来领导。对于大多数候选的大脑大统一理论来说,其核心代表人物都具有某种特征,他通常是第一位提出该理论的科学家,同时也代表了该理论的公众形象。

一个成功的大统一理论还讲求奉献精神,为了完善理论,理论的支持者需要为此付出数年甚至数十年的光阴。他们绞尽脑汁地搜索新方法,以便将其理论运用到能找到的大脑的方方面面。同样重要的还有宣传,如果保持默默无闻,那么哪怕是最伟大的大统一理论也难以为人所知。因此,人们编写了各种论文、文章以及图书,为的就是将大统一理论不仅传达给科学界,也传达给整个世界。

此外,大统一理论爱好者的脸皮最好也要厚,因为推广这类理论可能会遭受大批科学家的白眼,由于这些人一次只研究大脑的某一部分,其研究成果可能更加可靠。

1971年,社会学家穆雷·S.戴维斯(Murray S.Davis)在题为《这很有趣》(That’s Interesting)的文章中对理论进行了反思:“长久以来人们一直认为,一个理论家伟大是因为他的理论是正确的,可这大错特错。一个理论家伟大,不是因为他的理论是正确的,而是因为他的理论很有趣……事实上,理论的影响力和它是否正确关系不大,即使一个理论的正确性有争议,甚至已被证伪,这都不妨碍它继续被看作一个有趣的理论!”而无论大脑大统一理论是否正确,它无疑都是有趣的。

从预测到行为:

自由能理论的广泛应用与争议

英国神经科学家弗里斯顿生性开朗,讲话轻声细语,让人很难联想到他是一项雄心勃勃且富有争议的科学运动的领导者。可他确实不乏忠实的追随者,从学生到教授,甚至是神经科学传统边界之外的科学家,这些人每周一都会雷打不动地聚在一起,听取弗里斯顿的一些见解。他们在弗里斯顿身上寻求的,主要是他针对以下课题的独特智慧:15年来,弗里斯顿将自己对大脑、行为以及其他方面的理解都建立在一个包罗万象的框架上,这便是自由能理论。

“自由能”这个术语在数学中描述的是概率分布之间的差异。但在弗里斯顿的框架中,自由能的含义可以被简单地概括为:大脑对世界的预测与它实际接收到的信息之间的差异。自由能理论主张,大脑的一切所作所为都可以被理解成在尽可能地减少自由能,换句话说,就是尽可能地让大脑的预测与现实保持一致。

在这种理解方式的启发下,许多研究人员一直在寻找大脑中生成预测的部位以及这些预测是如何与现实进行比对的。在其中一个研究领域中,围绕“预测编码”的想法,人们探索了这类情况是如何在感觉处理中发生的*。在大多数预测编码的模型中,信息在正常情况下通过感觉处理系统进行传递。例如,听觉信息从耳朵传入大脑后,首先通过脑干和中脑的区域进行传递,然后再依次通过皮质的各个区域。人们普遍认为,这条前馈通路是感觉信息转化为感知的关键方式,即便是不怎么相信预测编码理论的研究人员也对这一点没有异义。

*实际上,预测编码的想法是在没有受到弗里斯顿或自由能理论影响的情况下独立发展的,它首次亮相是在拉杰什·拉奥(Rajesh Rao)和达娜·巴拉德(DanaBallard)于1999年发表的一篇论文中,而自由能理论的拥趸们随后热切地探索了这个想法。

预测编码的独特之处在于它对反馈通路的见解,这类通路是指从下游脑区到上游脑区的连接,例如从次级听觉皮质到初级听觉皮质。总的来说,关于这些连接的功能,科学家做出了许多不同的假说。根据预测编码假说,这些连接携带了预测信息。例如,当你在听最喜欢的歌曲时,你的听觉系统可能对接下来的音符和歌词都烂熟于心。在预测编码的模型中,这些预测会被反向传递,并与正向传递的现实世界中真实发生的信息相结合,通过比较这两股信息流,大脑就能计算预测和现实之间的误差。

事实上,在大多数预测编码的模型中,某些表征预测误差的神经元的唯一任务就是进行这种计算。因此,这些神经元的活动强度就指明大脑犯了多少错:如果它们大量放电,这就表明预测误差很大,如果它们保持安静,则表明预测误差很小。如此一来,这些神经元的活动就是物理实体化的自由能,并且根据自由能原理,大脑的目标就应该是让这些神经元尽量少放电。

在感觉通路中存在这种神经元吗?大脑是否学会了做出更准确的预测从而让这些神经元保持安静?多年以来,科学家一直在寻找这些问题的答案。

例如,法兰克福大学的研究人员进行的一项研究就发现,当听见预期中的声音时,听觉系统中的一些神经元确实会减少放电量。具体来说,研究人员训练小鼠按下一个会发出噪声的杠杆,当小鼠按下杠杆并听见预期中的声音时,相较于随机播放相同的声音或是杠杆发出意料之外的声音,其神经元反应都较弱。这表明小鼠大脑中存在着一个预测,当预测情况没有发生时,其听觉系统中的神经元会发出更多的信号。然而总的来说,寻找预测编码的证据是一件喜忧参半的事,并非所有寻找误差神经元的研究都能满载而归,而且即便我们找到了这些神经元,其行为也并非总和预测编码假设的完全一致。

为了最小化自由能,最显而易见的方法似乎是让大脑成为一台更准确的预测机器,然而这并非唯一的方法。由于自由能是大脑预测内容和现实之间的差异,所以我们也可以通过调整行为将差异最小化。

设想有这么一只已经习惯于在某片森林周围飞行的鸟,它可以预测哪些树木适合筑巢,哪里的食物最丰富等。然而有一天,它比平时飞得更远,并最终落在了某座城市中。由于这是它第一次体验高楼大厦和车水马龙,它对周围世界中几乎所有事物的预测能力都很低。预测内容和现实之间的这种巨大差异就意味着自由能很高。为了降低自由能,这只鸟可以选择留下来,并寄希望于其感觉系统能逐步适应并预测城市生活的特征,当然它也可以选择干脆飞回之前的森林。这第二个选项,即选择某种行为从而导致感官体验可以被预测,这正是自由能原理能够成为潜在的大脑大统一理论的原因,因为该原理不仅可以解释感觉处理的特征,也可以囊括行为上的决策。

自由能原理的确已经被用来解释感知、动作以及介于两者之间的一切东西*,这包括学习、睡眠和注意力等行为或事物,以及精神分裂症和成瘾等疾病。还有人认为,该原理还可以解释神经元和大脑区域的解剖结构以及它们交流方式上的细节。事实上,弗里斯顿甚至没有将自由能限制在大脑之中,他认为这是生物学和进化学中的指导原则,甚至还是理解物理学基础的一种方式。

*完全展开来说,自由能原理的枝蔓会触及本书中所涵盖的大多数课题。它建立于贝叶斯大脑假说(第9章),与信息论中的想法交相辉映(第6章),应用了统计力学中的方程式(第3章和第4章),并解释了视觉处理中的要素(第5章)。

弗里斯顿终其一生都在试图将复杂的话题总结成简单的三言两语。2018年,他在《连线》杂志的一篇文章中回忆了他十几岁时的一个想法:“一定存在一种方法,它能够从零开始解释万物……如果我一开始只拥有整个宇宙中的一个点,那么我能仅根据这一个点推导出其他所有需要的东西吗?”在弗里斯顿的世界中,自由能原理现在就是那个几乎为零,却又几乎可以解释世间万物的东西。

然而在弗里斯顿的世界之外,自由能原理的能力就没那么显著了。由于他夸下海口,无数的科学家便尝试着去了解弗里斯顿理论的来龙去脉,然而即使在那些自认为支持该原理的人中间,也很少有人会认为他们的尝试是绝对能成功的。其中难点并不在于方程式过于复杂,因为在这群努力尝试的科学家中,有很多人一生都致力于理解大脑中的数学。难点在于,要将自由能原理外推并运用于解释大脑功能的各个犄角旮旯,我们就需要一种直觉,而这种直觉似乎只在弗里斯顿本人身上表现得最为强烈。由于我们缺少一个可以在给定某个情况下明确客观地解释自由能的方法,弗里斯顿只能扮演一个守着自由能喃喃低语的形象,在无数论文、报告以及周一例会中阐释他对自由能含义的看法。

自由能原理之所以令人如此困惑,很可能源于一个连弗里斯顿也不得不接受的特征,即它的不可证伪性。大多数关于大脑功能的假设都是可证伪的,也就是说,通过实验我们可以证明其主张是错误的。然而自由能原理更像是一种观察大脑的方式,而非一个关于其工作原理的强有力的具体主张。

正如弗里斯顿所说:“自由能原理的本质就单纯是一个原理……除了用来测试某个可测量的系统是否遵循该原理,你没办法再利用它做些什么。”换句话说,科学家不该基于自由能原理尝试对大脑做出某种明确的预测,而应该扪心自问该原理是否有助于使他们以一种新的眼光看待事物。你想要试着弄清大脑是如何工作的吗?那就去看看它是否在以某种方式最小化自由能吧。如果这能带来进步,那很好;如果不能,那也没关系。

如此看来,自由能原理最多只能搭一个架子,上面挂满了有关大脑的各种事实。就它可以将很多事实联系起来这一点而言,自由能理论确实“大”而“统一”,然而由于其不可证伪,它是否可以被称为一种理论还有待商榷。

千脑智能理论:

解密大脑的终极挑战

Numenta是一家位于加利福尼亚州红木城的小型科技公司,它的创始人是企业家杰夫·霍金斯,他之前创立的两家公司从事的都是手机的生产工作。这些手机是现代智能手机的前身。Numenta从事的则是软件制造工作,该公司设计的数据处理算法旨在帮助股票经纪人、能源分销商、IT公司等客户识别并追踪输入数据流中的模式,而Numenta的主要目标是对大脑进行逆向工程。

霍金斯在科技领域取得了辉煌的职业成就,他却一直对大脑很感兴趣。虽然从未获得任何该领域的学位,他却在2002年创立了红木神经科学研究所。这个研究所现在是加州大学伯克利分校的一部分。霍金斯在2005年又创立了Numenta。2004年,霍金斯和桑德拉·布拉克斯莉(Sandra Blakeslee)共同撰写了《新机器智能》(On Intelligence)一书,书中所展示的一些想法构成了Numenta工作的基石。在这本书中,霍金斯提出的理论总结了新皮质(覆盖在哺乳动物大脑表面的一层薄薄的脑组织)是如何产生感觉、认知、学习以及运动的,而这一系列想法现在被称为“千脑智能理论”。

千脑智能理论的核心是一块被称为皮质柱的神经结构,这是一小团直径为0.5~1毫米,长度为2~4毫米的细胞。如此命名是因为皮质柱构成了一根根从新皮质顶部一直延伸到底部的圆柱体,其外形就像是一根根平行的意大利面条。它的纵切面则类似一层层地质沉积:神经元被分成明显的6个可识别的层次,各层中的神经元通过向上或向下的连接彼此进行交流。通常来说,同一皮质柱中的神经元执行着相似的功能,例如它们可能都以某种类似的方式对感觉输入做出反应。然而,不同层次看起来确实拥有不同目的,例如有些层次负责从其他脑区接受输入,有些层次则负责发送输出。

20世纪中叶,神经科学家蒙卡斯尔首次发现了这些皮质柱,他认为皮质柱代表了大脑的基本解剖单元。将整个新皮质划分成一个个不断重复的单元,尽管这个想法同当时的主流意见格格不入,但蒙卡斯尔从中看见了它的潜力,因为这个单元可以处理皮质所接收的各式各样的信息。霍金斯对此表示赞同。他在书中将蒙卡斯尔的工作描述为“神经科学中的罗塞塔石碑”,因为它“虽然只是单一的一个想法,却将人类大脑各式各样的奇妙能力相统一”。

想要了解霍金斯对这些微型处理单元的看法,我们必须同时考虑时间和空间。2014年,霍金斯在一次采访中说:“如果你接受智能机器会根据新皮质的原理工作,那么(时间)就意味着一切。”大脑接收的输入并非一成不变,这意味着任何有关大脑功能的静态模型都是极其不完整的。更重要的是,大脑的输出,也就是身体产生的行为在空间和时间上都得到了扩展。根据霍金斯的说法,主动在空间中移动身体并从中获得动态的感觉数据流,这有助于大脑对世界建立更加深刻的理解。

神经科学家对动物是如何在世界中移动的有所了解,这种行为模式和一种被称为“网格细胞”的神经元息息相关(见图11-1)a。网格细胞是当动物处于某些特定位置时放电活跃的神经元。想象有一只小鼠在一片场地中跑来跑去,当小鼠位于场地中央时,某个网格细胞会处于活跃状态。当小鼠向北移动几个身长的距离时,同样的细胞会再次处于活跃状态,即使再向北移动几个身长的距离也是如此。另外,如果小鼠朝着北偏西60°移动,我们也会看到相同的活动模式。

实际上,如果我们绘制一张地图来表示这个细胞所有活跃的位置,就会在整个场地中形成类似于波尔卡圆点的图像。这些圆点会全部均匀地分布在三角形网格的顶点,“网格细胞”也因此而得名。虽然不同网格细胞的网格在大小和方向上都有所差异,但它们都具有这种共同的网格状特征。

霍金斯折服于这些细胞表示空间的能力,在他提出的有关新皮质如何了解世界的理论中,网格细胞也是其中的一个组成部分。但问题是人们在新皮质中并没有找到网格细胞,事实上网格细胞存在于内嗅皮质中,这是一个在进化上相对古老的大脑区域。尽管几乎没有证据表明在这个区域以外还存在网格细胞,但霍金斯猜测它们实际上就隐藏在新皮质各个皮质柱的第六层。这些细胞究竟在做什么呢?为了解释这一点,霍金斯喜欢举的一个例子是用手指沿着咖啡杯画圈儿。

实际上,霍金斯将其理论的起源归结于他盯着咖啡杯时的一次灵光乍现,而他在演讲时甚至会带着一个杯子现场进行演示。新皮质中处理感觉的那部分皮质柱会从指尖获得输入,而根据霍金斯的理论,那些位于皮质柱底部的网格细胞也同时会记录指尖的位置。通过将手指的位置信息与杯子在该位置摸起来的感觉相结合,皮质柱就可以在手指划过咖啡杯时了解物体的形状,下次再遇到相同物体时,皮质柱就可以使用这些储存好的知识来识别物体。

由于这些皮质柱在新皮质中分布广泛,这一过程可能会同时在任何位置发生。例如,代表手上其他部分的皮质柱会在碰到咖啡杯时构建自己的模型,而视觉系统中的区域也会将视觉信息和眼睛的位置相结合从而构建自己对咖啡杯的理解。总而言之,这些零零散散的贡献统一地构成了我们对世界的理解,这就像是成千上万个大脑在协同工作一般。

霍金斯的理论还处于发展阶段,其中的许多细节仍有待推敲,但他对此寄予厚望。在他眼里,皮质柱不仅可以学习具象物体的形状,还可以学习抽象物体的形状。在思维或语言的世界中穿梭,和在真实物理世界中穿梭是异曲同工的,二者都可以通过相同的机制来实现。如果事实真的如此,那么就解释了大脑是如何利用新皮质中重复的模式来完成从视觉到听觉、从运动到算术的各类任务的。

这些皮质柱究竟有多相似,这也是人们争论的话题。乍一看,新皮质看似密密麻麻地铺满了相同的皮质柱,但一些研究表明,在新皮质的不同区域中,皮质柱的大小、所含神经元的数量和类型以及它们之间的相互作用方式都有所不同。既然这些皮质柱的解剖学结构并不相同,那么它们的功能可能也就不同。这意味着和千脑智能理论所假设的不同,每个脑区执行的任务可能更为专一。若真是这样的话,找到某个通用智能算法的希望可能会就此破灭。

正如我们在这本书中一再看到的那样,要建立大脑的数学模型,我们通常需要先从大量的可选数据中筛选出一连串看起来与之相关的事实,然后将这些事实简化并以某种方式拼接在一起,从而展示大脑的某一部分在理论上是如何工作的。此外,在弄清具体如何拼接这个简化版生物学的过程中,我们可能还会做出一些与众不同的意料之外的预测。就这种模式来说,千脑智能理论和其他神经科学中的模型相比没什么两样。实际上,通过实验和计算的工作,千脑智能理论中的许多概念,例如皮质柱、网格细胞、物体识别,这些已经被广泛地研究过了。从这个角度看,千脑智能理论并非独一无二,它和其他理论一样可对可错,也可能半对半错。

或许真正让霍金斯和Numenta的工作脱颖而出的原因,仅仅是他们坚持不懈乐观地认为该理论是举世无双的,认为让大脑皮质完全门户洞开的钥匙会第一次在真正意义上变得触手可及。在2019年的一次采访中,当霍金斯被问及我们距离完全理解新皮质还有多远时,他是这样说的:“我感觉自己已经上了一个台阶,所以如果我能在接下来的5年里正确地完成我的工作,也就是说如果我能宣传这些想法、说服其他人相信这些想法,以及向其他从事机器学习的人证明他们应该关注这些想法,那么我们最多只需要不到20年的时间。”这种自信在科学家中十分罕见,而由于霍金斯的背后是私有资本,他的这种自信自然也就不会受限于正常的科研压力。

霍金斯对其有关大脑的主张深信不疑,这一点尽人皆知。可纵使他把基于大脑的突破性算法吹得天花乱坠,人们仍对他兑现之前承诺的能力表示怀疑。人工智能研究领域的领军人物辛顿曾称,霍金斯对领域的贡献“令人大失所望”。而在2015年,心理学教授加里·马库斯(Gary Marcus)在对比了Numenta的工作和其他人工智能技术后说:“我还没有看到哪个观点能一锤定音地证明,该理论在任何一个主要的挑战中能一骑绝尘。”千脑智能理论有多少可能性能提供一套真正通用的智能机制呢?只有时间,这个在霍金斯思想中占据重要地位的概念,才能证明一切。

整合信息论

命性的理论还是科学的误区

有人说,如果关于大脑的某个理论不能解释大脑中最大最悠久的谜团,也就是意识,那它就是不完整的。对科学家来说,意识可能是一个艰深的话题,因为它承载了几个世纪的哲学思考。然而在某些研究人员心中,其工作中的“圣杯”就是科学化且精准地定义意识,而通过这个定义,我们可以发现并量化存在于任何地方的意识。这也是“整合信息论”所许下的承诺。

整合信息论试图通过一个方程式来定义意识,它最初是在2004年由意大利神经科学家朱利奥·托诺尼(Giulio Tononi)提出的,自此该理论又在他和其他人手中不断更新换代。整合信息论的目标是把在任意物体中测量意识这件事都变得像是在大脑中测量意识一样容易,这些物体包括计算机、石头甚至未知的外星人等。通过更普遍地解释意识的本质,该理论不同于那些由神经科学家设计的尤以生物学为核心的理论。

整合信息论能摆脱具体的大脑物理特征,是因为其产生的灵感完全来自另一个源头,即内省。通过对第一人称意识体验的反思,托诺尼提出了意识的5个重要特征,它们构成了整合信息论的“公理”。第一个公理承认了意识客观存在的基本事实,其他公理则包括:有意识的体验是由多种不同的感觉组成的;体验是具体的;体验在我们看来是一个完整的整体;体验是独一无二的,多一分少一毫都不行。

托诺尼思考了什么样的信息处理系统才能给出体验的这些公理,如此一来他就能将公理映射到数学术语上。这么做的最终结果是对所谓的“整合信息”的一种统一度量,托诺尼用希腊字母φ对其进行表示。总的来说,φ表示了一个系统中信息的混合程度,恰到好处的混合应该可以产生丰富且完整的体验。在整合信息论中,一个系统的φ越高,它所拥有的意识就越多。

事实证明,想要计算任何一个具有现实复杂度的系统的φ都几乎是痴人说梦。对人类大脑来说,我们首先要进行几乎无穷无尽的实验来探索大脑的不同子结构是如何相互作用的。即便能做到这一点,接下来等待我们的将是一系列漫长而艰苦的计算。

为了解决这个问题,人们发明了多种近似φ的方法,如此一来我们就能有理有据地猜测系统的φ。利用φ,人们已经解释了为什么某些大脑状态会比在其他状态产生更多意识体验。例如在睡眠期间,由于中断了神经元之间有效的交流,大脑整合信息的能力下降,从而导致φ变小。根据托诺尼的理论,类似的原因还可以解释人为什么会在癫痫发作时失去意识。

该理论还做出了一些可能有些出人意料的预测。例如,一个普通恒温器的φ虽然很小但并不为0,这意味着一台调节室温的设备也具有一定量有意识的体验。不仅如此,如果我们精心设计,一些非常简单的设备所拥有的φ可能还远远高于人类大脑的φ的估计值。这些违背直觉的结论使一些科学家和哲学家对整合信息论持怀疑态度。

另一条对整合信息论的批评则直指其公理基础。该批评指出,托诺尼选择的公理并非唯一可以用来建立意识理论的公理,而他将公理映射到数学上的方法明显既不是唯一也不是最好的方法。那么问题来了,如果整合信息论的基础如此单薄,我们又怎么能相信从中得出的结论,尤其是那些出人意料的结论呢?

2018年,意识科学家开展了一项非正式的调查,调查结果显示整合信息论并非专家们最喜欢的理论,它名列第四,排名前三的选项分别是另外两种理论以及包括了各式理论的“其他”选项。但同样是在这项调查中,人们发现整合信息论更受非专业人士的青睐,实际上,在非专业人士中有一部分人自认为拥有足够的知识来回答该问题,而关于这帮人的调查结果中整合信息论排名第一。

一些开展该调查的人猜测这可能是整合信息论公关的结果。在外界看来,仅仅是因为理论背靠着硬核的数学,它看起来就很权威很合理。而相较于大多数关于意识的科学理论,整合信息论在大众媒体上受到了更多关注。其中就包括著名神经科学家科赫的著作,他同托诺尼合作,公开宣扬整合信息论。在这本题为《意识与脑:一个还原论者的浪漫自白》(Consciousness: Confessions of a Romantic Reductionist)的书中,科赫描述了他探索意识的科研之路,包括他和诺贝尔奖获得者弗朗西斯·克里克(Francis Crick)的合作,以及他对整合信息论的看法。这种通俗的读物或许能行之有效地将理论传播给更广的受众,却不一定能使懂行的科学家心服口服。

*实际上,预测编码的想法是在没有受到弗里斯顿或自由能理论影响的情况下独立发展的,它首次亮相是在拉杰什·拉奥(Rajesh Rao)和达娜·巴拉德(DanaBallard)于1999年发表的一篇论文中,而自由能理论的拥趸们随后热切地探索了这个想法。

但即使是那些对整合信息论缺乏信心的科学家,也情不自禁地为这种努力而鼓掌。众所周知,意识这个概念很难把握,所以整合信息论能试着将意识诉诸严谨的科学探究,这算得上是朝着正确的方向迈进了一步。物理学家斯科特·阿伦森(Scott Aaronson)是整合信息论的公开批评者,他在博客上写道:“纵使整合信息理论因其核心的缘故明显是错的,在所有关于意识的数学理论中,其仍然能够跻身前2%了。在我看来,几乎所有与之竞争的意识理论都过于模糊、松散以及易变,以至于错误对它们而言都是一种奢求。

大统一理论:

在复杂中寻求简单之美

大统一理论可能是个不太好掌握的东西。为了“大”和“统一”,理论必须对一个极其复杂的物体做出简单的表述,而几乎所有关于大脑的表述肯定都在某些地方有着潜藏的例外。因此,让大统一理论过“大”就意味着它实际上无法解释很多具体的数据,而将它与某个具体数据联系得过于紧密,它又不再那么“大”了。无论大脑的大统一理论是不可测的、未经测试的,还是测试后失败的,它在尝试解释太多东西时,就冒着什么都解释不了的风险。

虽然这对寻求大统一理论的神经科学家来说是一场艰苦卓绝的战斗,但这个挑战在物理学中就似乎没那么大。造成这种差异的原因可能很简单:进化。经过数亿万年的进化,神经系统适应了一系列需求,从而使特定物种能在特定环境中完成特定挑战。在研究这种自然选择的产物时,科学家就不能希望它是简单的。为了创造出有功能的生物,生物学可以根据所需选择任何一条途径,它才不管其中哪个部分是否容易理解呢。因此,如果我们发现大脑只是一盘不同成分和机制的大杂烩也就不足为奇了,因为这只不过是大脑运作所需的一切罢了。总的来说,我们不能保证,甚至可能也没有任何令人信服的理由去相信,大脑可以用简单的规律来描述。

一些科学家选择接受这种混乱。与其将大脑简化为其最简单的元素,他们更愿意选择构建一种更包容且宏大的大统一理论来将所有部分拼接在一起。如果说传统的大统一理论就像是一块只用盐调味的煎牛排这般简单,那么这类模型则更像是一大锅乱炖,虽然它不像大统一理论那样时尚优雅,却更有可能胜任其工作。

这种更具包容性的方法的一个例子,就是我们在第1章讨论过的蓝脑计划所构建的极尽详细的模拟。通过一系列细致的实验,这些研究人员找到了关于神经元和突触的无数细节,然后将所有这些数据重新拼凑成一个仅仅包含大脑一小部分的精细计算模型。这种方法假设每个细节都是宝贵的,缺少其中任何一个都会导致我们无法理解大脑。它全心全意地接受了生物学中的细枝末节,并希望通过将所有东西合成一堆,我们就能更全面地了解大脑的工作原理。然而其中的问题在于规模。自下而上重建大脑的方法只能是一个神经元一个神经元地往上加,这就意味着我们距离搭建一个完整的模型还有很长的路要走。

语义指针架构统一网络(Semantic Pointer Architecture Unifi ed Network,SPAUN)则来自一个完全不同的方向。SPAUN是由加拿大安大略省滑铁卢大学的克里斯·伊利亚斯米特(Chris Eliasmith)所领导的团队开发的,它的目标并非要捕捉神经生物学的全部细节,而是大脑模型。这意味着和大脑一样,模型获得了相同的感觉输入同时也具有相同的动作输出。具体而言,语义指针架构统一网络可以用图像作为输入,并控制模拟手臂写下输出。在输入和输出之间是一个由250万个简单模型神经元所组成的复杂网络,其排列方式大致模仿了全脑结构。通过这些神经连接,语义指针架构统一网络可以执行7种不同的认知和运动任务,例如绘制数字、回忆物体列表以及补全简单图像等。

通过这种方式,语义指针架构统一网络牺牲了优雅从而获得了功能。当然,人类大脑所含神经元的数量是其数万倍,可完成的任务也远不止这7项。语义指针架构统一网络发展至今靠的是实用主义的原理,但它的这种原理和规模是可以带领我们直抵大脑的完整模型,还是尚需要加入更多的神经元细节?这一点仍未可知。

一个真正的大统一理论,其目标在于浓缩。它将各式各样的信息融合成一个紧凑且易于消化的形式。这使大统一理论看起来令人满意,因为它给人一种仿佛能轻松完全掌握大脑原理的感觉。然而像语义指针架构统一网络和蓝脑计划模拟这类模型则非常宽泛,它们引入了多个数据源并用其构建一个复杂的结构。通过这种方式,这类模型牺牲了可解释性以获得其准确性,其目标是通过整合所有需要解释的东西去解释一切。

就像所有模型一样,即使是这些更宽泛的模型也仍旧不是完美的复制品。构建这些模型的人仍旧需要选择想要涵盖的内容、想要解释的东西以及可以忽略的东西。当以大统一理论这类东西为目标时,我们总希望可以找到一组最简单的规则来解释最多的事实。对于像大脑这样紧密且混乱的东西,这组最简单的规则可能还是很复杂。并且我们也绝无可能提前知晓,捕捉大脑功能相关特征所需要的细节程度和规模是什么,只有通过建模对其进行测试,我们才能在这个问题上取得进展。

总而言之,神经科学和“更难”、更定量化的学科之间存在着相当密切的关系。它接受了许多来自物理学、数学以及工程学的馈赠。这些类比、方法以及工具俨然已经改变了我们对关于大脑的一切内容的思考,包括从神经元到行为。而大脑研究也知恩图报,它不仅为人工智能提供了灵感,同时也为数学方法提供了测试的舞台。

但神经科学终究不是物理学,它必须避免扮演弟弟妹妹的角色,避免跟在这个更古老的学科身后亦步亦趋。物理学中的指导原则以及成功策略并不总能有效地运用于生物学,因此我们必须小心谨慎地对待灵感。在建立大脑模型时,数学上的美并非唯一的指路明灯,相反,我们始终需要在这种影响和大脑独有的特征之间进行权衡。当权衡得恰到好处时,生物学的复杂性就可以被简化为数学方程式,从而产生真知灼见,而这也不会过度地受到其他领域的影响。如此一来,大脑研究才能在用数学理解自然世界这件事上开辟出自己的道路。

《心智的10大模型》作者:[美]格蕾丝·林赛 点击上图购买。

赠书介绍:在《心智的10大模型》中,计算神经科学家格蕾丝·林赛深入探讨了数学模型在理解大脑中的关键作用。书中通过10个数学模型,从单个神经元到复杂的神经环路,再到整个大脑的行为控制,逐步展示了数学工具如何帮助科学家理解和描述大脑的决策、感觉处理、记忆等过程。本书不仅是一部科学史,也是一本前沿的神经科学指南,为读者呈现了神经科学与数学计算机科学的跨学科融合,启发读者思考大脑建模与心智建模之间的关系及其未来的发展方向。

本次赠书活动规则如下:请在本推文评论区留言,说说你对大脑的大统一理论的看法,我们将按照留言点赞数最高、留言区编辑精选、追问读者社群随机抽取,从中选取三位读者,各送上一本《心智的10大模型》!本次赠书活动截止时间为5月22日晚10点,欢迎感兴趣的朋友前来参与。(追问读者社群加入方式,请添加微信“NextQuestion_bot”)

关于追问nextquestion

天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。

关于天桥脑科学研究院

天桥脑科学研究院(Tianqiao and Chrissy Chen Institute, TCCl)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。TCCI与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了TCCI加州理工神经科学研究院。TCCI建成了支持脑科学研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括学术会议和交流、、、科研型临床医生奖励计划、、中文媒体追问等。