对谈嘉宾
Alex Maier
范德堡大学心理学副教授
他在神经科学领域的工作涵盖视觉、视觉感知和认知,主要研究皮层柱的神经生理学及相关课题。当选过斯隆基金会会士和美国国家科学院卡弗里会士。实验室网站见http://www.maierlab.com/
主持人
Paul Middlebrooks
卡内基梅隆大学的特聘助理研究员
卡内基梅隆大学的特聘助理研究员,同时是播客“Brain Inspired”的主持人。他主要研究运动皮层和基底神经节神经群体活动如何在自由行为的小鼠中支持自然行为,致力于揭示神经活动与复杂行为之间的关系。
目录:
01 一位神经科学家的意识研究起点
02 整合信息论为何脱颖而出?
03 形式化如何让科学真正前进?
04 感受质能被数学描述吗?
05 数学是发现,还是发明?
一位神经科学家的意识研究起点
保罗:今天的嘉宾是亚历克斯(Alex Maier)。亚历克斯是范德堡大学的心理学副教授,并领导着迈尔实验室。他在神经科学领域的工作涵盖视觉、视觉感知和认知,主要研究皮层柱的神经生理学及相关课题。今天,他将与我们探讨近年来其研究焦点的转向——意识神经科学。他要和我们聊聊近年来研究焦点的一次大转弯——转向了意识神经科学。其实说回归更贴切,因为大家待会儿就会听到,这可是他最初的“白月光”领域。
我和亚历克斯算是老相识了。当时我在范德堡大学的杰弗里·肖(Jeffrey Shaw)实验室做博后,他刚好作为新晋教员入职。我至今都记得他给我留下的深刻印象。当时我听了他的一场报告——记不清是面试演讲还是入职后的首秀了——但你立刻就能感受到他对研究的那种澎湃热情,而且表达极其清晰。我甚至记得他还展示了一些自己用望远镜拍的摄影作品,特别是一张美得让人惊叹的月球照片。
我们的互动总是特别有意思,即使有时只是匆匆一面,比如他一阵风似的从我身边跑过、飞奔上楼或者赶去什么地方,我们互相抛句“你好”,他永远都是一副风风火火的样子。
今天,我们将探讨为何亚历克斯认为整合信息理论(integration information theory, IIT)是当前解释意识问题最有前景的方向。这主要是因为,IIT已经发展出了一套形式化的数学框架,它的野心很大,就是想在意识研究领域,复刻数学在物理学里做出的贡献:即为我们提供所谓的“自然法则”。
我们的讨论将基本围绕与此相关的一切展开,包括科学哲学、数学与“数学性”的区分,以及一些他所重视的研究工具(如范畴论),还有他在测量意识水平方面的部分工作——顺便提一句,IIT认为,这就好比一支足球队,它的整体意识绝不是每个球员意识的简单相加。
好的,亚历克斯,这场对话可谓酝酿已久。非常高兴你能来做客。我们先从这个问题开始吧——因为我也很好奇,虽然咱们之前私下简单聊过,但我还没真正深挖过你是怎么看待自己的研究轨迹的……你现在全心投入于意识科学,但同时你在视觉感知、研究皮层柱方面也做了大量工作。你是一位视觉神经科学家……如果现在有人提到你的名字,他们会将你定位为视觉神经科学家,还是意识科学家呢?
亚历克斯:谢谢,保罗。首先感谢你的介绍,那些旧日时光的回忆听得我心里暖暖的,我也一直在默默关注你的节目。回想我如何走到今天,起点要追溯到必须决定大学专业的时期。那时我十分迷茫,想过去法学院,也动过读医学院的念头。我甚至还在医院里干了差不多一年,结果干完我就彻底顿悟了:“医学院根本不适合我。”
保罗:你当时在医院里做什么?
亚历克斯:我年轻时,德国还有义务兵役制,而你可以选择“依良心拒服兵役”。这种情况下,就必须完成一年的社会服务。我当时选的就是在医院工作。准确地说,主要是在一个心脏病学的研究实验室里打杂。我当时还挺幸运的,有机会观摩了一些手术,比如给心脏病患者放支架、做植入物之类的。之后我们还尝试了一种基因疗法,想看看能不能防止那些变窄的心脏血管再次堵塞。虽然那个疗法最后失败了,但我真的学到了很多。最重要的一点就是,我无比确信:医学这条路,绝对不是我的菜。
那时我确实挺抓狂的。时间越来越紧,“你这辈子到底想干嘛?”这个问题天天在我脑子里转悠。我知道这绝对是个决定命运的十字路口。结果有一天,我在书店里瞎逛,偶然翻到了一本书(轻笑),德文版的书名叫《灵魂究竟是什么》。这个标题瞬间抓住了我的注意力。结果发现那是弗朗西斯·克里克(Francis Crick)的著作《惊人的假说》。在这本书中,他系统阐述了如何从神经科学角度解释意识的问题。
拿现在的眼光看,这本书可能有点老掉牙了,但当时读起来简直让人欲罢不能。他主要围绕视觉科学展开,深入探讨视觉的神经机制。他巧妙运用了我们都熟悉的“脑中小人”概念:当我们思考视觉如何产生时,常认为所有信息会在大脑某处汇聚,那里就是神经元以某种方式产生意识的场所。克里克带着读者逐层剖析视觉系统,你会逐渐意识到:“意识不可能位于视网膜,因为即使我闭上眼睛,仍能在一定程度上想象出消防车的模样。”
接着他谈到外侧膝状体,证明意识不在那里,也不在初级视觉皮层V1。你随着他的指引遍历整个视觉系统,直到抵达已知对面部产生反应的大脑区域。这时你会想:“嗯,或许就在这里,就在我们看见事物的地方。”结果他话锋一转,指出:如果这个区域受损了,你其实还是能看见一张脸的,你只是认不出它是谁了如此一来,我们又将感知或意识问题推向了认知领域。
这让我深受震撼,我脑子里嗡地一下:“哇,这背后藏着一个极其根本的谜题啊。”书中他提到了尼克劳斯·洛戈塞蒂斯(Nikos Logothetis),当时他正在德国进行双眼竞争研究。这是一种视觉错觉现象:如果向双眼分别呈现不同图像,你每次只能感知到其中一只眼睛看到的画面。这使得神经科学家能够借此寻找对其中一种图案产生反应的神经元,并观察其活动是否与主观所见同步变化。
正是这一点深深吸引了我。这甚至发生在我开始大学学业之前。于是我决定攻读神经生物学,这也正是我最终选择的专业。快毕业那会儿,我主动联系了尼克劳斯,告诉他我非常钦佩他的研究工作,并询问是否能在他的实验室实习。
保罗:等等,什么时候?
亚历克斯:那时我连学士学位都还没拿到。当时他在德国的另一个城市。我凑齐了所有积蓄,尝试去那里待一段时间。我们开展了一些实验,结果非常顺利。最终我们的发现发表在《自然-神经科学》上。我想这引起了尼克劳斯的兴趣,他可能因此考虑让我留下攻读博士学位。然后我也确实这么做了。
保罗:哇,这真酷。你这简直是霸王硬上弓强行闯进去的啊。我太喜欢这股莽劲儿了。
整合信息论为何脱颖而出?
亚历克斯:算是硬闯吧。有趣的是,当时正值21世纪初,意识研究领域的热度达到了顶峰。我那时没意识到,克里克通过他的著作,以及与克里斯托夫·科赫(Christof Koch)合作发表的诸多论文,确实让人们对意识产生了浓厚兴趣。不过他们实际探讨的主要是感知,尤其是视觉感知。你也知道的,科学界的风向总是像潮水一样,起起落落。
某些课题会突然炙手可热,但过了一阵子,等那些容易摘的“低垂果实”都被抢光了,大家的热情也就慢慢淡了。而我进入这个领域时,恰逢它开始退潮。至少给我的感觉是这样。相关学术会议的规模越来越小,我心里一紧:“坏了,我得赶紧重新找定位,必须得转型了。绝对不能再把意识研究当成我的主业了。”
保罗:哦,明白了。纯粹是为了在学术圈活下去对吧?
亚历克斯:对,就是为了混口饭吃,立住脚跟。当时的计划是暂且深耕其他领域,走一条比较传统、稳妥的老路。待时机成熟时再回归这个方向,并尽可能保持与它的关联性。
保罗:你确实这么做了。当然,传统稳妥那部分除外。
亚历克斯:哦,不,不。事情还真是这样发展的。我努力保持关联,继续研究双眼竞争及相关现象,但略带讽刺的是:弗朗西斯、克里斯托夫和当时许多学者的工作,其实让“意识”这个课题在科学层面获得了正当性。在那之前,心理学界对谈论意识是存有顾虑的。谈论感知还算可以接受,但即便如此,搞感知研究的在当时也是个异类。
当时大多数心理学系基本都是认知心理学家的天下,或许还混着点行为主义心理学家。搞感知研究的可能就那么一两根独苗,显得特别格格不入。他们发论文的时候,同行们往往会皱起眉头,因为要将感知量化并严谨研究似乎格外困难。我们能仰仗的“救命稻草”是心理物理学。我们可以指出:“看,感知是可以被精确测量的。”我觉得要是没有这根稻草,这条研究之路绝对会走得极其艰难。
保罗:我正想问你,科赫和克里克他们是不是也……你刚才提到你特别推崇费希纳(Fechner),正是因为他通过心理物理学给咱们开了一扇窗,让我们能用数学公式去描述感知规律。本质上就是费希纳所描述的数学化感知定律。那克里克他们当年是不是也借鉴了费希纳的思路?因为“意识的神经相关物”这个研究方向本身,其实并没有什么数学味儿。我想问的是,他们当时意识到这一点了吗?他们有没有从费希纳那里偷点师?
亚历克斯:这是个非常有趣的问题,我最近才思考过,部分原因是我收到的一些反馈,特别是反对意见让我开始反思。对我来说,费希纳最牛的地方,恰恰就是你刚才说的:他把原本虚无缥缈的研究变得极其严谨,甚至直接推向了数学化。因为他发现,如果我把一个音调调得非常非常微弱,我是可以极其精确地测量出那个从“听不见”到“刚好能听见”的临界点的。其实咱们做过听力测试的人,都算是在做心理物理学实验:戴上耳机,听各种频率的纯音,然后一听到声音就按下按钮。
这让我很着迷。它显得科学而严谨,但我以前从来没往深了想过:把数学和科学死死绑在一起,到底意味着什么?我以前觉得理所当然。我想我们很多人都是如此,如果上一门物理课、听一场物理讲座或读物理教科书,你满脑子期待的肯定是一堆方程式。但这其实很有趣。为什么会这样?我们很少去深究这个问题。我们心里其实有一种本能的反应:只要带了方程式,它看起来就特别严谨、特别精确、特别数学。
我内心深处认为,像牛顿的F=ma或爱因斯坦的E=mc²这样的公式极具严谨性和科学性。我们脑子里似乎一直残存着一种模糊的执念:自然定律就应该是数学的,或者至少应该用数学来表达。但即使在物理书中,这也被视为理所当然。你拿起一本粒子物理书,里面全是方程式和图表,但书里从来不会花半个字去讨论“我们为什么要用数学”。
随着时间的推移,我慢慢意识到,这其实正是许多意识或感知研究在苦苦挣扎、或者说试图聚焦的核心痛点。而费希纳——你说得对,他绝对是我心目中的英雄——他迈出了极其关键的一步。他证明了:没错,我们完全可以通过测量“需要把刺激改变多少,才能引起感知的变化”,来给感知精确地打分赋值。这么一来,我们就拿到了实打实的数字,拿到了那些离散的层级:“好,现在你听出差别了,我们管这叫‘等级一’。把声音再调大点,你什么时候注意到它又变响了?好,那叫‘响度等级二’。看来你的感知就是这么顺着一、二、三、四的离散台阶,一步步往上爬的。”
我认为这其中蕴含着深刻的洞见,但它并未得到充分的重视,或者说,到了上世纪60年代,有些人开始用不同的技术搞研究,试图证明在不同情境下结果会不一样,这反而把费希纳的深度给冲淡了。这给那项伟大的发现蒙上了一层模糊的、甚至有点相对主义的阴影。也许正因为这样,我们在某种程度上忽略了最重要的一点:“嘿,大家醒醒,我们真正要找的,其实就是这些数学定律啊!”
费希纳的伟大,绝不仅仅在于他发现我们能精确测量感知阈值,更在于他证明了:只要我们这么做,我们真的能挖出数学定律。他发现我们的感知倾向于遵循对数关系。这绝对是个石破天惊的洞见。
实际上,这甚至影响我们的消费决策。例如,当我们购买一辆非常昂贵的汽车时,如果额外增加100美元的费用,我们往往会接受,因为已经支付了1万到2万美元,100美元就显得微不足道。人们正是利用了我们的感。当基数大到一定程度时,所有的差异在我们眼里都被无限拉近了。
把这说成是自然定律可能有点夸张,但在我看来,这恰恰就是科学的终极目标。科学似乎总是在无休止的争吵和辩论中艰难爬行,直到最终抵达那个数学化的彼岸。你拿达尔文的进化论来说,直到今天大家还在为它吵个不停。我觉得其中一个很重要的原因就是:它还没有像 那样被高度形式化。我敢打赌,一旦你能把进化论写成一个极其优美的数学公式,并且证明它有效,那所有的争议瞬间就会烟消云散。这就让我开始深思:就像你刚才说的,意识科学的终极目标,也必须是走向数学化。
它的目标,就应该是去寻找那些最底层的数学方程,或者是去寻找那些能像物理学一样,赋予我们严谨性、精确性和绝对无歧义性的数学结构。
保罗:那你是在接触“整合信息理论(IIT)”之前,就已经悟出这个道理了吗?真正把你迷住的,到底是IIT这个理论本身,还是“它居然用了一套形式化数学”这个事实?你是对哪一点更上头,还是两者都有?我最初的问题其实是:你是不是某天突然对数学有了什么顿悟,一拍大腿说“对,这就是唯一的出路”?
亚历克斯:对,就是这种感觉!不过有意思的是,我最初接触IIT,恰恰是通过实实在在的实验研究。现在学术界吵得很凶,很多人都在骂 IIT,说它根本没法被证伪,也没法被检验。但就我个人的学术经历来说,当我一头扎进意识研究的时候,刚好赶上IIT还在穿开裆裤的萌芽期——也就是IIT 0、IIT 1或者IIT 1.5那个阶段。说实话,当时对我这种天天泡在实验室里搞实验的人来说,这理论看着挺玄乎,但根本不实用。我完全不知道该怎么用我的fMRI(功能性磁共振成像)设备或者电极去跑它那套东西。
后来发生了一件事,我记得非常清楚:《科学》杂志上发了一篇论文,他们居然基于IIT推导出了一个极其具体的预测。该预测指出,如果一个人处于无意识状态,这时候你用经颅磁刺激(TMS)的电磁脉冲去电一下他的大脑,然后测量脑电图(EEG)的反应,结果会跟清醒时完全不一样。预测说得非常死:因为被试没有意识,所以你绝对观测不到大脑里的整合现象;大脑的反应模式只会是局部的抽搐兴奋,根本不会像水波纹一样荡漾出那种极其复杂的全脑活动模式。
关键在于,这个预测以前从来没有人验证过,甚至根本没人往这方面想过!而该理论给出了这个预测。因为我自己也是从那个年代过来的,我太清楚这有多难得了。这是一个真正的、由理论驱动的预测,这在当时的神经科学界简直是稀有动物。
那时候大家都在疯狂地跑数据,为了发论文,大家的基本套路都是:先闭着眼睛收一堆数据,然后对着数据抓耳挠腮地解读,最后再事后诸葛亮地硬凑一个理论上去,大言不惭地说“看,这就是我的模型”。
保罗:哈哈,咱们现在不也还是这么干嘛。当然啦,这叫探索性科学,也有它的价值,不过确实……
亚历克斯:是的。但这绝对不是物理学的玩法。我们都明白,做出预测并检验它,比用数据拟合模型更有说服力。我记得好像是冯·诺依曼(Von Neumann)说过:“给我三个变量,我能拟合出任何曲线。”特别有趣的是,当这种“先预测、后验证”的戏码在意识理论领域似乎真的发生了,而且实验结果居然还真的印证了那个理论的预测时,这事儿就变得极其有意思了。
事实上,他们后续几年继续研究,测试了不同的麻醉剂,并发现了例外情况,比如氯胺酮,我们知道使用氯胺酮的人并非完全无意识,他们看似昏迷,实际上会处于类似梦境的幻觉状态。结果你猜怎么着?在用氯胺酮的情况下,用那套技术测出来的大脑模式,居然真的呈现出了类似清醒时的意识模式!
这种技术非常强大,如果你关注马塞洛·马西米尼(Marcello Massimini,意大利神经学家,他主导了这方面很多研究)的相关报道,你甚至能看到一些极其震撼的视频片段:有些病人原本被医生误诊为植物人或深度昏迷,结果用这套技术一扫,居然检测出他们的大脑里依然存在意识!随后他们得到了针对性的救治。结果证明,他们其实一直清醒地被困在身体里,只是没法做出任何反应,结果就被活生生地误判了。
保罗:这些是闭锁综合征患者吗?
亚历克斯:希望我没记错,但有个案例,如果我理解正确的话,很有意思。那是一个多巴胺缺乏症的病人。不知道你看没看过根据奥利弗·萨克斯(Oliver Sacks)的书改编的那部电影,就是讲西班牙大流感之后的。
保罗:《无语问苍天》(Awakenings)。
亚历克斯:《无语问苍天》,对。西班牙流感之后,许多这类患者变得紧张僵直,我记得电影里医生给他们用了左旋多巴,于是他们产生了更多多巴胺,就苏醒过来,能够活动了。他们说:“是的,我一直有意识,只是不想回应。”这个案例是类似的。我想那个病人当时似乎没有反应,医生不确定是否是昏迷状态,然后据我所知,他们给了左旋多巴,病人就开始有反应了。
我知道现在有一整家公司想把这个做成一个神经科学项目。我举这些例子只是想说:这套方法看起来是真的管用。有成吨的证据表明它有效。而对我来说,最让我心服口服的是:这一切,确确实实是源于IIT那个理论最初做出的预测。这让我对IIT产生了极其浓厚的兴趣。
后来的故事就是IIT自己也在不断进化,现在都已经迭代到IIT 4.0了。最让人兴奋的是,它在数学上变得越来越无懈可击。其实它每次迭代并不是推翻重来。如果你去翻朱利奥·托诺尼(Giulio Tononi)最早写的那些IIT论文,去看看它的婴儿期,你会发现它最核心的灵魂思想,从一开始就原封不动地在那儿了。去追溯这个演化过程,真的特别有意思——
保罗:所以它的公理体系其实一直没变。那到底变了什么?每次版本更新,它到底在更新什么?新东西在哪儿?
亚历克斯:公理体系是有所变化的。最开始它并没有那么“公理化”,在形式上也没那么严谨,但你依然能一眼看出核心理念的影子。随着时间推移,它的形式化体系被打磨得越来越锋利。真正再次一把抓住我眼球的,是梁景辉(Angus Leung)和土谷尚嗣(Nao Tsuchiya)发的一篇论文。他们当时用的是IIT 3.0,那是第一个真正完整、能让你直接在 MATLAB或者Python里敲代码跑起来的数学框架。
他们将其应用于局部场电位——就是单纯的电压信号,比如来自果蝇(黑腹果蝇)的信号。他们有两种记录方式。他们使用我们现在用于果蝇和蘑菇体(类似大脑的结构)的多触点电极。他们将电极置于通入全身麻醉气体或不通的情况下。结果发现,昆虫具有类似睡眠的状态,并且像我们一样,对某些我们使用的麻醉剂有反应。吸了麻药后,它们就不动了,看起来就像是失去了意识。
当然,这有些引申,但这确实模拟了人类在这些条件下的行为。他们的研究表明,IIT在某种程度上再次奏效。IIT的预测是,你会发现Φ值(我们现在可以计算这个值)降低,而这正是他们在麻醉期间所观察到的结果——当然,前提是你在处理实际数据时做了许多假设和简化,但结果是成立的。
保罗:抱歉,我打断一下,你刚才提到了Φ,我想确保听众都明白。Φ是IIT最终计算出的一个标量值,代表一个系统的意识“量”、“程度”或“水平”。也许我们稍后会讨论围绕Φ计算及其含义的一些问题。其实咱们肯定得聊,因为我攒了一肚子问题想问你。但当亚历克斯说Φ时,那指的是IIT所有数学运算的最终结果。抱歉打断。
亚历克斯:谢谢你解释。朱利奥·托诺尼的实验室编写了任何人都可以使用的Python代码,它是公开的、开源的,可以用来从神经数据中计算Φ值。这事儿现在已经变得非常具有可操作性了。当然,关于到底意味着什么,以及“用一个孤零零的数字去衡量意识”这事儿到底靠不靠谱,学术界现在吵得不可开交。这就要回到你最初的问题了:在我意识到所有这些之后,“看,那里似乎有点东西,那里有证据”之后,我到底是怎么想的?
我的科学观其实不是什么证伪主义,我更认同像拉卡托斯(Lakatos)和奎因(Quine)等人的观点,他们指出了证伪主义存在的问题。我可能更持一种贝叶斯式的观点:你就是不断地收集证据,然后在大脑里疯狂权衡,看看哪种可能性更大。而当时的情况是,IIT成立的可能性正在我眼前疯狂飙升。就在那个节骨眼上,我终于忍不住了,开始自己上手去跑那些算法,去死磕它背后的数学。
正如你所说,这直接促使我进一步思考:我们究竟在做什么?它为什么有效?数学究竟是什么?它与科学和自然有何关联?这让我在某种程度上陷入了一个哲学“兔子洞”:IIT之所以有趣,是不是恰恰因为它手里握着这套极其硬核的数学框架?而这,恰恰是绝大多数意识理论根本拿不出来的,或者至少,它们在数学形式化的程度上,远远达不到IIT的水平。
形式化如何让科学真正前进?
保罗:顺便问一句,我知道你不会对其他关于意识本质的研究路径发表负面看法,但我真正想问的是:纵观历史及当下,你觉得那些“非数学化”的意识研究路子到底怎么样?它们是在浪费时间吗?是误入歧途的分类错误吗?它们是否永远无法产生我们科学上满意的解释或定律?你能不能在不给自己惹麻烦的前提下,跟我们交个底?
亚历克斯:不会,谢谢你的提问。实际上我最近思考了很多,因为我和一些语言学家交流过,他们让我相信,在具身认知领域,如果愿意,有一个有趣的子领域叫具身语言学。他们的话真的让我深思:说到底,当我们使用任何概念时,尤其是在搞科学的时候,我们其实都是在进行“视觉化思考”。所有人都不例外。一切都基于隐喻。这对我是很难接受的观点,但我努力去想——想想物理学,想想任何事物,我在脑中总会有一些电影片段或图像。
当我思考时空时,我看到的其实是所有这些画面:一个二维表面在折叠,一个球在上面滚动。我无法完全用其他方式想象它。这显然只是个比喻,对吧?但你很容易就会陷进去,觉得:“嗯,我直觉上已经懂时空是个什么玩意儿了。”我也会拿这个比喻去跟别人聊,如果你遇到一个刚好也看过那个科普动画的人,你们俩的脑回路简直能完美对上。我觉得特别有意思的是,这种隐喻当然是有缺陷的、不严谨的,但这似乎恰恰是科学探索永远绕不开的第一步。
想通了这一点之后,我现在再去听任何科学讲座,或者看YouTube上的学术演讲,我就会忍不住感叹:“哇,大家全都在这么干!”特别是当科学家们在聊那些最前沿的发现时,他们总会下意识地说:“哦,这个过程就像是……”比如最近有人在讲睡眠,解释人睡着时大脑里发生了什么,他们就会说:“哦,这就好比派对狂欢结束后,保洁人员进场打扫卫生一样。”
我突然意识到,对,我们只能这么干。在彻底搞懂底层的分子机制之前,我们一开始必须得靠这些隐喻,才能听懂彼此到底在说啥。
保罗:它们是必要的,也有用,但它们本质上也有局限——就像所有模型一样。
亚历克斯:完全正确。我后来对物理学史产生了极其浓厚的兴趣,我就想搞明白:物理学当年到底是怎么走上数学化这条路的?大卫·凯泽(David Kaiser)在疫情期间做过一个超级棒的YouTube系列,专门讲上个世纪的物理学史,强烈推荐大家去看看,那简直帮我打通了任督二脉。
有趣的是,例如爱因斯坦,他最初也大量使用隐喻。他会非常刻意地运用思想实验。你可能会想:“嗯,也许当时学术界不太吃这一套吧?”但我后来发现,海森堡(Heisenberg)和玻尔(Bohr)那帮人其实也一样,尤其是玻尔。
他们经常进行著名的哥本哈根论战,经常是拿着隐喻在互相开炮,而不是甩数学公式。关于爱因斯坦,很多人都知道,在狭义相对论中,需要有人介入,用形式化的方式阐明洛伦兹变换到底是什么;而在广义相对论中,推演出张量及其背后的力学也至关重要。
再说海森堡,量子物理学史上有段特别逗的八卦:他当时为了能用形式化的语言去描述量子现象,居然硬生生地把线性代数给“重新发明”了一遍!所以你看,形式化永远是紧跟在隐喻后面的下一步。隐喻在前面开路,形式化在后面打地基,但一旦形式化完成,它就会为你推开一扇通往新世界的大门。正是因为有了形式化,我们才能真正吃透量子物理或者相对论,才能去拓展探测边界、去做极其精密的测量,最后拿到分毫不差的数值预测。
在我看来,现在的意识研究领域,也必须得走一遍这条老路。一开始,我们只能靠那些充满隐喻的、概念性的理论,它们全都是靠直觉驱动的。但一旦我们进化到能够建立起一套形式化体系,并且能把它跑通的时候,我们就能彻底超越那个打比方的阶段了。到那时,我们就能拿到隐喻永远给不了的东西——也就是绝对的无歧义性、可靠性、精确性和严谨性。如果咱们只停留在用嘴皮子去描述意识是什么,那我们永远也到不了那个彼岸。
保罗:我们必须使用语言,因为我们是有限的存在。但问题是——它始于直觉,你将直觉转化为隐喻来传达思想,就像你在雕刻某物,如果做得足够好,最终可能得到一个可以检验预测的形式化数学体系。但要是你的直觉错了呢?要是最初的隐喻错了呢?有没有这样的例子——我不想岔开话题,我本想问:有没有那种一开始靠某个隐喻起家,最后也确实搞出了一套能做预测的漂亮数学,但最后大家发现,那根本就是一条死胡同?
亚历克斯:我脑子里第一个蹦出来的,其实就是你在播客里反复聊过的一个话题:认知科学里那个绝对统治级的隐喻——计算主义(computationalism)。大家顺着这个隐喻,确实推导出了不少形式化的理论。但你也请过好几位嘉宾来吐槽过,说这玩意儿归根结底只是个比喻,是有天花板的。如果我们把“隐喻的地图”当成了“真实的地形”,这可能恰恰是我们现在很多人集体踩坑、导致整个领域停滞不前的原因。
保罗:这很有意思。抱歉打断一下。你说的这个,哲学家怀特海有个专门的词,叫“错置具体性的谬误(fallacy of misplaced concreteness)”。说白了就是把地图当成了疆域本身。这在现在的计算神经科学界,简直泛滥成灾,比以往任何时候都要严重。没错,现在确实有很多人开始醒悟了。
但随着计算模型在圈子里彻底称王称霸,大家还是越来越频繁地把地图当成真实的世界。尤其是在人工智能圈子里,一堆人天天在那儿喊着计算机马上要有意识了之类的。总之,这事儿挺逗的。我也不确定我们是不是非得先在“计算主义”的坑里滚一圈,然后再爬出来超越它,但这种现象确实比我想象的要普遍得多。现实就是这么魔幻。
亚历克斯:我的看法有点不同——
保罗:我想这是因为你如今所处的领域比较专深。我也处在自己的信息茧房里,不过确实——
亚历克斯:可能是吧,但我感觉这些学科之间的壁垒已经开始出现裂缝了。让我特别着迷的一点是,现在很多骂IIT的声音,恰恰就是站在“计算主义”的立场上开火的。我突然意识到,如果我们要真正达成共识,就必须一路退回到最底层的地基上去。因为我们这帮人,甚至连最基本的科学哲学观都是撕裂的。比如“计算到底在自然界里扮演什么角色?”这种最根本的问题,大家的看法都完全尿不到一个壶里。
我后来去扒了扒计算主义的发家史。我发现了一个特别有意思的现象。当然这只是我个人的解读啊:我觉得心理学作为一门科学,其实一直活得挺纠结的。大家表面上承认它是一门严谨的科学,但在大学里,心理学系往往被尴尬地夹在人文学科和STEM(理工科)之间。院长们经常抓破脑袋,不知道该把它往哪边塞。
你可能会反驳:“咱们心理学的祖师爷可是亥姆霍兹(Helmholtz)啊!那还不算硬核科学吗?他可是顶级的实验物理学家和全才啊!”但你再看看美国心理学的奠基人威廉·詹姆斯(William James),你就会发现他身上有着极其浓厚的哲学底色。没错,早期的心理学几乎带着更重的人文气息。
我认为问题出在弗洛伊德(Freud)身上。很多人都知道,他早年其实是想当个硬核神经科学家的。我没记错的话,他读研那会儿,本来是想发明一种类似高尔基染色法或者尼氏染色法的神经元染色技术,结果搞砸了。他试过给神经元做银染,但没成功。这事儿好像让他对搞实验彻底倒了胃口,于是他干脆掀了桌子,直接把整个研究方向拐到了文学和精神分析那边。而这,恰恰就是后来“证伪主义”被逼出来的源头!波普尔就是为了狙击弗洛伊德,才跳出来大喊:“你搞的那套根本不是科学!”
于是,当人们问“为什么精神分析不是科学?”时,他就会说:“嗯,它无法被证伪。”这一切都源于此。这就是为什么物理学家从未听说过证伪主义,而在心理学、数据科学、认知神经科学领域,它却如此盛行。全都是当年那场大辩论留下的后遗症。
它也引发了行为主义。到了20世纪30年代,心理学界为了自救,抓住了一根看似能保命的稻草:“行,为了显得我们够科学,我们干脆把所有不能直接观察到的东西(比如意识、情绪)全给砍了!”
这股思潮甚至能一路追溯到物理学家恩斯特·马赫(Ernst Mach)那里。在量子物理学里,马赫的哲学确实帮了大忙,确立了“只谈可观测物理量”的铁律。但这种极端的倾向,却把心理学研究逼进了一个死胡同。你现在去翻翻那些大型心理学协会的官方定义,他们居然还在把心理学定义为“研究人类行为的科学”,搞得好像心理学压根儿就不该管“爱”是什么,不该管我们为什么能“看到红色是红色、蓝色是蓝色”这种主观体验一样。这一切,全都是被这段历史脉络给带偏的。
我认为,计算主义在20世纪60年代所谓“认知革命”中所起的作用在于,我认为这是无可置疑的,计算机成了“救星”,因为你可以指着计算机说:“看,它有记忆。我无法真正观察到它。我能看到的只是硅和晶体管的开关,但这就是记忆的行为表现。我也可以研究人类的记忆。你不能指责我是伪科学,不能说我是在抓虚无缥缈、无法测量、抽象、不存在的概念。”
保罗:它是一种功能。它充满了功能。
亚历克斯:完全正确。从那一刻起,心理学就被死死地跟“行为”和“功能”绑定在一起了。我觉得,这甚至能追溯到更久远的过去,你去看看物理学史上“机械论”世界观当年有多么只手遮天就知道了。人们有时候会把机械论和唯物主义搞混,但机械论的逻辑其实是,世界就是由原子构成的;或者原子再往下切,变成中子、电子;再往下切,变成夸克。但不管你怎么切,它们本质上就是一堆越来越小的“乒乓球”,一丁点儿带着质量的小肉团。
当我们谈论力时,实际发生的是它们运动,然后碰撞。这就是詹姆斯·拉迪曼(James Ladyman)所说的“微观碰撞”——整个世界就是由四处碰撞的粒子构成的。这就产生了机械论的观点,即一切都关乎运动。这当然是物理学的起点。在牛顿那里,这一点被证明非常成功,是的,我们可以用运动解释很多现象。在某种意义上,物理学是研究变化的科学,是研究运动的科学。
所有这些观念都渗透进来,导致我们现在一搞研究,眼睛就死死盯着“过程”、“变化”、“功能”和“状态转换”。这些是计算主义与生俱来的东西,而我想,这也就是为什么当计算主义撞上“意识研究”时,会产生如此剧烈摩擦的原因。
保罗:我们这个小插曲是由我提出“有没有被直觉带进沟里的例子”开始的。然后我们开始谈论计算主义。在此之前,你说过:“万事万物都可以从隐喻起步,但一旦你拿到了数学形式化的武器,你就可以把隐喻一脚踢开,大步往前走了。”在你看来,这就是数学的力量所在。
亚历克斯:准确地说,我觉得魔力在于形式化。让我举个例子。我们最近在进行一个疯狂的新项目,我们公开了一篇关于预测编码的综述文章,并表示:“任何感兴趣的人都可以参与。我们将撰写一篇文献综述,真正审视已发表的所有相关研究,并进行总结。”我们的目标是把那些还没解决的坑都标出来,然后设计出能填这些坑的实验。
结果最让我哭笑不得的是,在这个浩大的工程中,我和几个同行突然发现:搞了半天,大家在最基本的语言和语义上根本就没对齐过!很多人在用“预期(expectation)”或者“预测(prediction)”这些词的时候,简直随性到了极点。作为一个被克里克的书洗过脑的人,我一听到这些词就本能地害怕那个脑中小人的陷阱,就是你不知不觉地假设大脑里坐着一个小人,是他在做预测。我拼命想搞清楚大家嘴里说的到底是个啥。后来有人提议:干脆咱们搞个术语表吧,把每一个词都定义清楚。
这成了一次非常有趣的经历,因为虽然这篇论文超过100页,有60多位作者,但它最终完成了,而且过程本身就很值得回味。我认为成果非同寻常。但你敢信吗?我们绝大部分的时间,全耗在那个见鬼的术语表上了。我敢打赌,如果你去后台统计一下文档的修改记录和大家投入的精力,光是“预测”这么一个看似烂大街的词,就引发了无数场腥风血雨的争吵。
保罗:全在吵该怎么定义它,对吧?
亚历克斯:是的。现在,我学到的有趣一点是,到最后,我相当满意。我当时想:“太棒了,我们终于有了一部预测编码的新华字典了!我们再也不是在那儿瞎抛内部模型这种大词了,我们清清楚楚地定义了它到底是个啥,以及它是怎么跟预测、预测误差这些概念咬合在一起的。”
保罗:但归根结底,你们还是在用语言,而不是用数学。
亚历克斯:完全正确。后来我对范畴论产生了兴趣,这完全是另一个话题了。整合信息理论目前有点与我朋友土谷尚嗣的另一种方法结合了,他也在扩展心理物理学,采用结构主义的方法,将IIT的结构性本质置于一个更宏大的图景中。我现在不想过多讨论这个,但我确实对这个范畴论的话题产生了兴趣。范畴论在某种程度上……
我这么说可能会被数学家批评,但一个简单的理解方式是,你可以把它看作是高度依赖“图论(graph theory)”的。简单来说,你把各种事物摆在那儿,然后用箭头把它们连起来。这些箭头可以是函数,或者用更专业的词叫态射(morphisms)。它代表了一种关系,事物之间通过箭头相互咬合,最后你就得到了一张密密麻麻的箭头网络图。据我所知,现在数学界对范畴论简直狂热到了极点。原因之一是,大家发现好像可以把整个数学大厦的地基,全盘平移到范畴论上。它是一种极其底层的理论,是直接跟集合论抢饭碗的。要知道,过去这一百多年来,我们可是一直把数学建立在集合论的地基上的。
还有一些其他原因让它很有趣。它在计算机科学中非常有趣。有好几种编程语言是基于它开发的。正在进行大量研究。我听过戴维·斯皮瓦克(David Spivak)的一个演讲,他领导着一个整个研究所,研究范畴论以及如何让它为你我这样的人所用。他们开发了一个软件,叫“olog”(本体日志),这里的“本体”不是哲学术语,而是计算机科学术语。其理念是,如果你想构建一套逻辑或者某个系统,你就必须做到极其精确,而且得是“半形式化”的。
它的工作方式是,你可以把你的理论,比如我们做过的术语表(里面有这些术语),分割成块。有趣的是,我们平时其实都被集合论给死死框住了。一个好的“olog”会把你有的每个术语用方框框起来,使其成为一个集合的元素。然后你做的就是用箭头把它与你所有其他术语连接起来,表示它们之间的关系。
如果你真的想非常严谨,最好的方式是让这些箭头(即关系)只用一个词来表示,比如“是”或描述性词语。这样你得到的是一个图表,一个展示你整个理论的网络,而且你可以解读它。维基百科上有很好的例子,你可以用科学概念来构建这种半形式化、半严谨的图表。它非常图形化。
保罗:是半严谨的。
亚历克斯:它不涉及数字。它不会给你实数或自然数作为输出,但因为它是形式化的,它不会产生语言那种歧义。如果我用英语说“I didn't say you stole my car(我没说你偷了我的车)”,重音放在不同的词上,意思完全不一样:可以是“我没说(是别人说的)”,可以是“我没说你(我说的是别人)”,也可以是“我没说你偷了我的车(你偷的是别人的)”。人类语言里这种让人抓狂的漏洞,在范畴论的图表里,绝对不可能发生。
保罗:彻底封死了过度解读的空间。
亚历克斯:正是如此。我开始为这个术语表做这件事。我放入了我们定义的这些词,并把它们之间的关系标出来。在这个过程中,我意识到有一个概念和其他任何概念都没有联系。可它明明就堂而皇之地躺在我们的术语表里,而且还是个极其核心的关键术语!在标箭头的时候,我用的全是我们自己写的定义词,比如“属于”、“描述”、“预测”等等。还有一点我应该说,我忘了提一个步骤。当你定义一个词时,比如说“预测误差”,为了让这个“olog”真正有效,你必须得用上类型论,这是罗素开创的逻辑学的一个延伸,用于解决集合论中的悖论问题。这是一个非常简单的技巧。
每当你定义一个东西(集合的一个元素),你必须说明它属于哪个集合。例如,当我说“预测误差”时,我必须说明它是什么。你打一个冒号,然后说明它是什么。我会说:预测误差,它是一种“信号”。然后我再去定义“信号”是个啥,信号下面肯定还有别的信号,以此类推。万事万物都必须有自己的类型(Type),然后你再去连箭头。结果我发现有一个有类型的东西,但它和任何其他东西都没有关系。那时我意识到我们犯了个错误。这简直就是个毫无意义的“阑尾”概念。你现在哪怕拿剪刀把模型里的这块直接咔嚓掉,整个理论照样转得飞起。但它却——
保罗:那个词到底是什么?具体是哪个词重要吗?
亚历克斯:如果我没记错的话,那个词好像就是“内部模型(internal model)”。这是一个对理论相当关键的概念,但在我们的定义中它没有与其他概念联系起来。我所顿悟的是,正是这种被我称为“数学”或者说“形式化”的工具,像一面照妖镜一样让我们看到:“看,我们其实被自己的语言给骗了。”没人发现这个术语表有缺陷,里面有一个术语和其他所有术语都没有关联,但我们却在这篇综述中愉快地使用着它。这就是为什么我认为,形式化,特别是符号表示,在科学中能发挥巨大的作用。
感受质能被数学描述吗?
保罗:你刚才说不想把话题扯太远。但我得引用一段话了——其实就是你和土谷尚嗣合写的那篇综述,里面聊到了感受质,以及怎么用整合信息理论和结构主义里的数学形式化方法去研究它。结构主义者认为,是结构关系决定了感受质。现在是不是个展开聊聊这个的好时机?我其实有点小担心,因为咱们可能一不小心就会掉进背景知识、哲学思辨的无底洞里聊个没完。
亚历克斯:没关系,来吧。
保罗:我想了解你观点的核心,以及在你看来,在形式化数学的框架下研究意识,什么是重要的。结构主义到底是什么?为什么它很重要?我不确定你是否想解释什么是感受质,因为在你们的论文中,你们用它来涵盖我们认为是主观体验、意识的所有内容。它是这类事物的一个替代术语。“感觉起来像什么”就是感受质,等等。既然“结构主义者认为是结构关系决定了感受质”,那么结构主义是什么?为什么它在形式化的数学描述中很重要?
亚历克斯:谢谢。如你所说,这是一个大话题。最简单的理念其实就是,你的体验,你的意识,绝不是随机瞎凑的。这是我能做的最简单的表述。事物存在一种秩序。理解结构最简单的方式是,在一切背后都存在一种模式、一种秩序或规律性。这一点延伸得很广。
例如,当你坐在这里时,你看不到背后的景象。你视觉上体验到的是你面前的东西,但它显然在左右两侧有界限,就在那里中断了。你看不到你周围360度的景象。当然,还有更多。你看到面前的色彩,但它们不会无缘无故地跳动、移动,除非真的有东西在动。静止的物体,如果你面前有一个红色的物体,它就固定在那里,位置分毫不差。你甚至可以想得更深:“位置到底是什么意思?”这就是结构的由来,你会发现,位置其实就是一种“关系”。就是说,这个东西在那个的左边,在那个的上面,或者下面。然后你又会发现:“嗯,这俩东西之间有一段距离,这也是一种关系。”你可以说:“它离这个有四个拇指宽,离那个也有四个拇指宽。”
这里的基本洞见是,很多人觉得意识这东西太玄乎、难以言表,比如“我根本没法向你描述爱到底是什么感觉”,但这种想法可能太悲观了。关于意识,有些东西我们是绝对可以揪出来的,特别是结构关系。
对很多人来说,理解这一点最简单的方式是思考不同的体验。现在我谈论的是在一个体验之内。我的意思是,第一,如果你睁开眼睛,你面前看到的东西是有结构的。它有秩序。它不是随机噪声。但在不同的意识体验之间,这一点变得更加明显。
如果我把红色和橙色放在一起,它们是什么关系?如果我再加个绿色呢?你肯定会说,橙色和红色长得更像,它们在某种程度上“离得更近”,关系比绿色更密切。你看,我们就是这样建构出“色彩空间”的。我们可以去测量这些距离:长得不像的颜色,就把它俩放远点;长得像的,就拉近点。瞧,我们这就得到了几何学!我们从中提炼出了数学!
现在,这不一定是通常我们使用的代数数值数学,但它向你表明,这里面有一种我们可以去发现的秩序。显然,这对科学家来说是令人兴奋的,正如我们之前谈到的,费希纳试图通过说“每次你跨越一个阈值,我就加一”来为感知赋以数值。于是你就有了疼痛的一级、二级、三级。随着刺激变强,感知似乎是在离散地跳跃。
现在我们触及了一个更丰富的概念:我完全可以说:“嘿,我其实可以在一个三维空间里去描述颜色。”这是一个三维对象,我现在可以用常规几何学来描述。这似乎让我们对像意识这样看似难以言喻、松散的东西,研究得更加严谨、更加形式化了。
保罗:你们在那篇论文中用了“丰富心理物理学”这个词来描述这些丰富的结构。我忘了,你在演讲中讨论过,我不知道论文里有没有,但我想是有的,当年费希纳意识到:“好吧,我现在搞的这套叫外部心理物理学”,但他心里很清楚,最终我们必须得搞出一套“内部心理物理学”,去描述大脑到底是怎么跟意识挂钩的。我猜你们的意思是,我们现在急需一套全新的、升级版的“丰富心理物理学”,把枪口对准内部,去描述这些色彩空间和高维结构,然后证明它们能跟我们的感受质同构地映射起来。
亚历克斯:是的。
保罗:这话说得有点拗口。我理解得对吗?
亚历克斯:是的,你抓住了要点。其实我也是前几年才彻底想通这点的。我觉得这事儿必须得给IIT记上一功。这个底层的逻辑是:如果我们能对你的意识体验给出一个几何学描述——咱们先不管这能不能涵盖意识的全部啊。学术界对这点吵得很凶,有人会说:“就算你把我视觉里所有的几何关系全扒干净了,那种红色的红本身的主观质感,真的是你这套几何方法能捕捉到的吗?”咱们今天先不蹚这个浑水。
我认为IIT的态度是:“行,咱们就先假设,我能用几何学来描述你看到的东西,也能用几何学来描述你听到的音乐。”比如音调越来越高,它在空间里就往上走;但当我跨过一个八度时,我又回到了一个极其相似的音感。所以它画出来就像一个螺旋,相同的八度音阶在垂直方向上彼此对应,虽然它们在不断盘旋上升。类似的例子还有很多,比如人脸识别的基础等等。只要我们按照相似性对事物进行排序,我们就能得到一个几何结构。
我认为IIT所做的是说(我觉得这很出色,而且现在土谷尚嗣正在进一步扩展),如果我们仅仅停留在给感知“打分赋值”的阶段,那就不清楚我们想在大脑中寻找什么。这也许解释了为什么上世纪90年代的那个研究热潮最后烂尾了,或者说为什么神经科学从来没有真正接纳过心理物理学。
我们应该发现的是,大脑机制的结构应该存在某种东西——我刻意使用“结构”这个词,稍后可以解释——应该与这个东西同构,或者存在其他结构关系。因为不然的话,如果任何支撑(有些人会说“表征”)视觉感知的东西是无序的,那我的视觉又怎么可能是“有序的”,我会非常小心地使用这个词。
保罗:我喜欢“支撑”这个说法。
亚历克斯:这种秩序必须映射到我大脑中的某种秩序上。这是基本观点。现在这似乎成了一个完全不同的研究项目。我觉得这其实是两个独立的项目。第一个大项目,也是约翰内斯·克莱因(Johannes Klein)他们特别感兴趣的,包括土谷现在做的很多工作,就是:我们到底能不能搞出一套关于体验现象学、关于感受质的极其严密的结构化描述?
然后第二个项目,是对于像我这样对大脑更感兴趣的人来说,会是:“这如何映射到大脑上?我们能用它来映射大脑吗?”如果我们把这两者拼在一起,最终我们可能会得到一个终极方程。在等号的左边,是一堆描述大脑活动结构的东西。你知道,最近这方面简直卷疯了,什么拓扑数据分析、高阶流形、潜空间,大家管这叫“信息结构”。
而在等号的右边,就是你的感受质,或者说你的现象学描述,比如你此刻眼前的视觉空间。这两者之间的关系,可以是一个绝对的等号,可以是一个同构,也可以是一个伴随(一种稍微弱一点的数学关系)。
但核心思想是:这是两张图,我可以用数学把其中一张图完美地转换成另一张图。对我来说最刺激的是,到那时候,这个方程在意识领域的地位,就相当于物理学里的了。似乎到了那时,我想这就是为什么有些人说这会解决那个所谓的“意识的难问题”,也就是“你永远没法用大脑活动来解释爱是什么”的那个死结。现在看起来确实无解。但在我看来,未来的答案似乎是——当然这还只是个愿景和直觉啊——我可以说:“不,一旦我们走到那一步,手里握着那个方程,我只要把大脑活动代入左边,右边就会自动吐出一个心智状态。那看起来,简直就像是一条铁打的自然法则。”
如果这是一种普遍的、我们发现的类似E = mc²的关系,而你仍然对此争论不休,仍然说“这并不能让我满意”,那么你在物理学中也会遇到同样的问题,顺便说一句,确实有物理学家也这么觉得。你用量子场论去描述整个世界,它极其强大,是我们手里最精确的理论,能把预测做到小数点后13位,瑞士粒子加速器里的结果证明它准得离谱。但归根结底,它也只是一堆数学。
在某种程度上,它只是非常复杂的、能预测你会发现什么的“电子表格”。你同样可以抱怨:“好吧,就算它这么准,我还是不爽。我觉得这个世界不应该只是一堆冷冰冰的数学。”我觉得面对这种抱怨,只有两条路可走。第一条路是认命:“但这就是你在认识论上能触及的极限了。”科学能给你的、你能知道的一切,就只有“结构”。如果你还想要点别的什么灵魂啊、本质啊,没问题,但那已经不归科学管了。
保罗:就在科学之外了。
亚历克斯:没错,科学只能给你数学。而对我来说,更有意思的问题是:“那你凭什么假设在这之外还有别的东西呢?”我其实对世界现在的样子非常满意,我觉得“也许从最根本上说,万事万物都只是关系”。但我能理解为什么有人会觉得不舒服。让我稍微展开聊两句。我觉得当我们谈论“数学”时,我们其实是用这一个词,混淆了两个完全不同的东西。这是我从彼得·弗雷德(Peter Freyd)那里偷师来的,他在 YouTube 上有个极其精彩的讲座,叫《一种反数学哲学》。
他说,大众眼里的数学,其实就是一种“语言”。只不过它比咱们平时说话的语言更高级一点。但其实有大把的证据在打脸这个观点,尤其是神经科学的证据。斯坦尼斯拉斯·迪昂(Stanislas Dehaene)进行了神经影像研究,他让人在核磁共振里做数学题、学数学,或者阅读数学公式和普通文字。结果发现,大脑调用的是完全不同的区域!这乐子可就大了:你的大脑根本没把数学当成语言!它压根儿没把数学当成一门自然语言来处理。
我确实认为,数学似乎有某种人造的成分。我想,这正是很多人困惑的地方,他们会想:“看,如果这是我们坐在扶手椅上想出来的,那它怎么可能是大自然的本质呢?”这种撕裂感,其实在牛顿那个年代就已经出现了。凭什么是?这跟当时的机械论世界观怎么自洽?那条所谓的自然定律到底是个啥?它是从哪儿蹦出来的?我看不见它,也摸不着它。当我们用到数学符号、写下证明过程、在脑子里盘算数学的时候,这些动作看起来极其主观,极其依赖我们的大脑。它看起来根本不像是某种独立于人类心智存在的东西。
我认为持这种观点的人必须承认,这其中存在某种独立于心灵的东西。彼得·弗雷德称之为“数学性的”。这意味着,这些规则是什么?它们从何而来?如果我写下2+3等于3+2,那是我在做人为的操作。这些数字以及我们更晚才约定使用的加号,都是人造的。但这里面有更深层的东西,那就是当我说2+3等于3+2时,我实际上是在说,我可以调换顺序。
这看起来很简单,但如果我拿一本书或一张纸——我随手拿一张——然后试着做同样的事,我说:“先往前推,再往旁边翻”, 书最后是这个朝向。但如果我换个顺序,说:“先往旁边翻,再往前推”,书最后会朝向一个完全不同的方向!在这里,操作的顺序简直是致命的。这看起来像小儿科,但我认为,正是通过像三岁小孩一样去重新审视这些我们习以为常的简单问题——问一句“凭什么是这样?”——我们才能挖出极其硬核的科学洞见。彼得·弗雷德就会把这种底层逻辑称为“数学性”。
有些东西是可交换的,有些则不可。用术语来说,就是“你是否交换顺序”这件事,对结果有着决定性的影响。而这,似乎是完全独立于人类心智而存在的。它更像是我们去“发现”了它,而不是“发明”了它。例如,有证据表明,我们发现了负一的平方根(i)。这看起来只是个荒谬的想法,就像“如果你非要在你的纸上玩这种数学游戏也可以,但在现实世界里,这纯属扯淡。现实里怎么可能有这种东西?”然而,现在有很多争论,包括《自然》杂志的论文,都表明如果量子物理学的形式化体系里敢把“复数”给踢出去,整个理论瞬间就会崩塌!
你必须得用上那个我们曾经以为只是大脑臆想出来的、极其诡异的“负数开平方”,因为大自然按着我们的头说:“对,没有这玩意儿,你连个激光笔都造不出来。”我觉得这极其有力地证明了:虽然做数学题是人类的活动,但它指向的——如果你非要叫它语言也行——它指向或描述的,是某种绝对独立于人类心智存在的客观实体。按照这种观点,那个实体,就是“结构”。很多深挖到这个层面的人最后都会感慨:“是的,归根结底,万事万物皆是结构。”
保罗:当你用数学描述事物时,你得到了这些关于事物如何随时间变化的关系,比如F=ma, E=mc²。这些关系,也许我不说数学,而说“数学性的”,人们就倾向于说:“嗯,也许数学性的才是真实的,因为它似乎是我们所发现的。”是的,它是我们心智的产物。没有我们的心智,我们无法理解“数学性的”,但每当我们观察时,它几乎是一种发现,而不是一种被创造的语言。
这里有个很滑的斜坡:是我们发现了它,还是我们发明了它,等等。这几乎是形而上学中的一种唯心主义观点。“数学性的”,它会导向形而上学中的唯心主义吗?或者你如何看待“数学性的”?
亚历克斯:这就很深奥了。我经常想到一个词是“新毕达哥拉斯主义(Neopythagorean)”。毕达哥拉斯说万物皆数。他觉得这个世界就是由数学本身构成的。现在,马克斯·泰格马克(Max Tegmark)有他著名的书,他的论文甚至更好,《我们的数学宇宙》,他在其中提出了类似的观点。很多人会说这是柏拉图主义的。那些相信数字是真实的数学家是柏拉图主义者,但这实际上并非柏拉图式的,因为柏拉图会说有一个现实世界,还有一个抽象世界。而我们现在聊的这套逻辑,基本上是在说:根本没有两个世界,一切皆是关系。
真正让我朝这个方向思考的,是与土谷尚嗣的许多讨论,他也向我展示了佛教的视角也是如此。还有数学家泰-达奈·布拉德利(Tai-Danae Bradley)的工作,她是一位年轻的数学家,我想她现在是谷歌人工智能的负责人。她参加了一个关于范畴论的暑期学校,绘制了这些精美的手写图表等等,并且全部公开了。她向我介绍了米田引理(Yoneda Lemma)。
我记得,当土谷尚嗣写了一篇关于米田引理的论文发给我时,我心想:“这哥们儿疯了吧。”因为那时候,我压根儿就没往数学这方面想。说实话,我当时甚至有点难过,因为你肯定也同意,在科学圈里,数学有时候是会被人拿来当遮羞布的。
保罗:太同意了。事实证明,什么东西都能拿来当遮羞布。
亚历克斯:我记得听过一首吐槽学术圈的歌,里面有句歌词是:“如果你的实验结果太垃圾,就用高阶微积分把它们糊起来。”
保罗:没错。
亚历克斯:这也是个问题。我以前也干过这事儿。我得承认,我以前数学烂得一塌糊涂。顺便提一句,我对数学的狂热,完全是最近才被逼出来的。
保罗:你为什么感到难过?你难过什么?
亚历克斯:因为我以为土谷也是在搞这种“糊弄人”的把戏。你肯定知道著名的“索卡尔事件(Sokal affair)”吧?当时欧陆哲学界在逻辑连贯性上简直烂透了,然后有个叫索卡尔的物理学家,故意写了一篇堆满高深数学公式、假装在探讨深刻哲学的论文去投稿,结果里面全是他妈的胡说八道。现在学术界甚至衍生出了一门极其搞笑的学科,我强烈推荐大家去搜一下,叫“废话研究(bullshit studies)”。他们故意用计算机生成一堆毫无逻辑的废话,结果发现,居然有大概40%的人不仅没看出这是胡扯,反而觉得……
保罗:这和哈里·法兰克福(Harry Frankfurt)的《论扯淡》(On Bullshit)概念不一样吗?
亚历克斯:不,不一样。
保罗:法兰克福说的“扯淡”是不在乎真假,有意为之的。这俩不同?
亚历克斯:这事儿说起来有点尴尬,搞这个研究的甚至都不是心理学家,而是经济学家。他们弄了个随机词汇生成器,拼凑出各种句子,然后让人给这些句子打分。最让人毛骨悚然的是,很多人给这些狗屁不通的句子打出的“深刻度”或“真实性”得分,居然比那些大实话还要高!比如,“一个年幼的孩子需要很多照顾”这种大实话得分极低,而“没有真理这种东西”这种废话,得分却奇高无比。
保罗:在哪个量表上评分更低?我们评价什么?
亚历克斯:评价这句话的“洞察深度”。这简直是个悖论,比如“没有真理这种东西”,这句话本身就把自己给扇死了。如果这句话是真的,那“真理”不就存在了吗?但大家偏偏觉得这句话有着极其、极其深邃的洞见。这种因为逻辑不通而产生的困惑感,反而被大众当成了某种“开悟”,大家会惊呼:“哇,这太深奥了!”
保罗:哦,不过我们都太容易受此影响了。
亚历克斯:哦,是的。事实上,如果你看这些研究,科学家往往比普通人更容易受到这个问题的影响。这恰恰是我现在死磕“形式化”的原因。我心里很清楚:“我也极有可能被忽悠”,所以我才要画那些“olog(本体日志)”图表,去死死盯着里面有没有形式上的漏洞,我的逻辑链条到底断没断。
回到索卡尔事件,他们发表了这些充满胡言的假论文,通过了严格的同行评审,最终刊登出来。这里面有一个极其危险的信号:很多人因此彻底放弃了数学。他们会想:“我数学本来就烂,考试总拿F,我真的看不懂这些。”这当然也牵扯到我们糟糕的数学教育,以及我们对数学的认知偏差。
所以我觉得,把“单纯的计算”和“数学本身”剥离开来,是非常有帮助的。真正性感的是那个“数学性”。我发现很多人在听讲座时,一看到屏幕上蹦出方程式,大脑就自动休眠了,心里默念:“我才懒得管这方程写了啥,也不管它到底是不是真的高斯分布,只要它看起来够严谨就行了。”你甚至可以利用大众的这种心理去招摇撞骗。这正是我的担忧:现在的意识科学,是不是因为走投无路了,开始病急乱投医,抓着纯数学和高阶概念当救命稻草——
保罗:所以当土谷把“米田引理”甩到你脸上的时候……你当时的本能反应是:“完了完了,我们这个领域也开始堕落到用高等数学来装神弄鬼了。”
亚历克斯:我真的很担心。我特别难过,因为我觉得“意识”就是宇宙的终极谜题。如果在我的有生之年,大家只是在用这些抽象的数学符号来掩盖我们的无知,而我作为一个搞实验的神经科学家对此毫无还手之力,那我们永远也别想取得突破。
但我错了。错得离谱。我读了米田引理是什么,然后就被深深吸引住了。
引理是一种证明,是一种次要的证明,这有点讽刺,因为它其实是一个非常深刻的洞见。它触及了范畴论的核心。我在我的YouTube频道上讲过这个。很多数学家对此颇有微词,所以我现在说话必须非常小心。
不过他们的批评主要是不满我没用专业术语。我请了几位数学家帮我审过那期视频,他们都说“核心逻辑没毛病”。我只是试图用人话把它解释清楚,而不是用那种拒人于千里之外的数学黑话。
保罗:是的,科普就得这样。
亚历克斯:理解米田引理最简单的方法是这样的:在传统的集合论里,我们总是从“对象(也就是集合里的元素)”出发。比如数字1、数字 2,或者一个红色的三角形、一个蓝色的正方形等等。假设我们现在有一个“形状”的集合,里面有三角形、正方形;然后我们还有一个“颜色”的集合,里面有蓝色、红色。接着,我们可以在这两个集合之间画箭头,比如建立一个函数。这个函数可以表示“这是一个红色的三角形”,所以我从“红色”画一条线,指向“三角形”,或者反过来。这就是算术,以及我们平时搞的大部分数学的基础。
现在,范畴论在某种程度上做着同样的事,但侧重点不同。它觉得,你一开始摆在那儿的那些“对象”根本不重要;它真正感兴趣的是:“函数”到底是什么意思?那个连接事物的“箭头”到底是个啥?
米田引理表明,如果你随便拎出一个数学对象——它可以是个数字、是个三角形,或者任何你觉得是个东西的玩意儿——只要你知道它所有的“输入”和“输出”关系(也就是所有连着它的箭头),也就是说,只要你知道在你的这个数学小宇宙里,它是怎么跟其他所有事物产生联系的……
保罗:是结构吗?
亚历克斯:正是关系的结构。那么,这个对象就被唯一确定了。换句话说,除了所有这些“关系”之外,这个对象本身根本没有任何其他属性可以用来识别它。你其实可以这么想:如果我以一个三角形为起点,你可以顺着关系一路往回倒推,退回欧几里得几何,看看三角形是由什么线构成的,线又是怎么跟点产生关系的,等等。
只要你掌握了所有的关系,那么关于这个对象的全部数据、你能知道的一切,就全都在这些关系里了。就在它的整体性之中。就在所有向外辐射的箭头的总和里。泰-达奈·布拉德利在她的文章里深入思考了这一点——你要知道,这在范畴论里可是个被铁板钉钉证明了的定理。只要你承认那些基础公理,你就必须咽下这个结论。
你可能会觉得,这在计算机科学里肯定很有用,所以程序员们对它很狂热。但泰-达奈·布拉德利指出:“这玩意儿有着极其恐怖的哲学意味。”如果你把自己当成一个人,那么到底是什么定义了“你”?亚里士多德的玩法是贴标签:“我是一个人类,我是一个父亲。”这都是我拥有的“属性”。但米田引理给出的视角是:一切皆是关系。我脱胎于其他哺乳动物,我抚养我的孩子。正是你与宇宙中一切他者的关系总和,定义了你到底是个什么东西。
保罗:这就像一个概念空间,对吧?
亚历克斯:是的,就像一张极其庞大的网络图,上面密密麻麻地画满了你是怎么跟其他任何事物关联的。它描述了你所有的关系,甚至包括你今天早上吃了什么。一旦你拿到了所有这些关系的总和——也就是你如何与万事万物咬合在一起——所有的数据就都在那儿了。它极其完美、极其唯一地定义了“你”。在这张图里,绝对不可能存在另一个拥有完全相同关系、却又不是你的东西。你想想,你出生在哪个家庭、跟谁结了婚、在人生的哪一秒交了哪个朋友……哪怕你只算人际关系,就算是连体双胞胎也绝对不可能一样,因为他们跟你的关系、以及他们彼此之间的关系是完全不同的。
保罗:请继续。那这张图是死板刚性的吗?我们能对它做特征向量分解吗?能对它做数学变换吗?或者说,它的维度是不是高到离谱,以至于里面分了无数个层级?你刚才还提到了超图(hypergraphs)之类的。它到底是个死板的结构,还是我们可以对它进行“翻译”?顺着这个思路,我感知到的“红色”,跟你感知到的“红色”,在图上是同一个东西吗?
亚历克斯:是的。我都能预感到搞数学的同行又要来骂我了,因为严格来说,在数学上它不叫“图(graph)”,它叫“范畴(category)”。尽管它长得确实像张图。你手里有这些箭头,但它们永远只是箭头。比如在普通的图论里,两个点之间可能就是一条线。你可能会问:“那它是有向图吗?”看起来像,但它是范畴,是一种有别于图的数学构造。
不过它看起来确实像图,我平时脑子里也是把它当成图来理解的。你直觉很准。正是顺着这种“图形化描述”的思路,你会发现它跟斯蒂芬·沃尔夫勒姆(Stephen Wolfram)的物理学构想,以及IIT理论,产生了极其美妙的交集——这种图形化的视角简直太好用了。显然,如果你真的去跑范畴论,比如我前面提到的那个“olog(本体日志)”软件,你最后跑出来的结果,确确实实就是一张图。在视觉和概念上,它们有着巨大的重叠。
接下来你提到的一点非常有趣:它仅仅是一张“成对关系(pairwise relations)”的图吗?我只能在两个点之间画线或箭头吗?IIT的答案是否定的。当我突然顿悟到,世界上居然可以存在一种包含“共享边”的图——也就是一个连接或关系,可以同时把三个或更多的对象绑在一起时,我的世界观被彻底颠覆了。正是这个概念让我大开眼界,而我们以前搞神经科学的时候,可能完全把这个给漏掉了!
在神经科学里,我们确实很吃“图论”那一套,也天天在用。实际上,我们现在甚至已经开始在用这些“高阶图”了。只是大多数人没意识到,当他们在跑拓扑数据分析时,嘴里喊着的“单纯形(simplex)”或者“单纯复形(simplicial complex)”,在数学本质上就是高阶图。我们正在疯狂朝这个方向狂奔。机器学习圈子里现在也有大把人在搞这个。
数学家卡洛斯·萨帕塔-卡拉塔拉(Carlos Zapata-Carratala)让我深受启发。他写了几篇出色的论文指出,一旦你打破了“两两配对”的世界,踏入存在三元甚至多元关系的领域,就会爆发出一些根本无法被向下还原的数学奇迹。这是一种真正的数学“涌现”,这可能至关重要。
尽管在数学上存在争议——即一切是否都能归结为成对关系——但不可否认的是,我们人类搞出来的绝大多数数学,都是建立在“成对操作”上的。乘法、加法、减法,全都是二元运算。你可能会反驳:“不对啊,我脑子里能直接算3×3×3,但实际上,你是在偷偷调用结合律:你大脑里是先算了3×3,再将结果乘以3。你始终在进行成对操作,或者只是记住了结果。
保罗:对,靠记忆。
亚历克斯:如果我说17×47×65,你或许能算出来,但你会先算前两个数的积,再用结果乘以第三个数,对吧?
保罗:没错。
亚历克斯:从根本上说,这些运算是被公理化定义为成对操作的。这对绝大多数数学和物理学似乎都适用。但有一个著名的反例:内燃机。在你的汽车里(如果是燃油车),你需要氧气、一点点燃料和一个火花(某种热量或能源),三者必须在精确的时间点汇集,才能引发爆炸,从而产生驱动汽车的能量。这个过程每秒要重复无数次。
有趣的是,如果你死守着“成对关系”去研究内燃机——比如你只研究空气和燃料混合,你永远也推导不出爆炸;如果你只研究空气和火花,你也绝对看不出这能把车开动。
现在,咱们把镜头切回神经科学。如果你去研究大脑,盯着所有神经元的相互作用,但你只看成对关系图(现在绝大多数发在顶刊上的论文,画的都只是脑区或神经元之间的两两连线),你就会彻底错过最关键的魔法:如果两个神经元同时对第三个神经元开火,结果会发生极其恐怖的质变!这就是著名的“赫布突触(Hebbian synapse)”。《自然》杂志上的论文早就证明了,在这种情况下会发生完全非线性的现象,它绝对不可能被拆解还原成简单的成对关系。如果我们只靠两两配对的相关性去试图破解大脑,我们似乎把最核心的灵魂给弄丢了。
这也直接触及了关于AI的辩论:硬件是否决定了AI是否有意识?传统的图灵机(也就是我们现在的电脑),骨子里就是基于“成对操作”的。在电脑里,“时间”根本不是一个操作变量。你电脑里有CPU时钟周期,但在一个周期内到底发生了什么,根本不重要。对于一个逻辑“与门(AND gate)”来说,它只是在那儿傻等:“信号进来了没?”两个信号根本不需要精确同步,只要在规定的时间窗口内到了就行,然后它就判断:“哦,两个都亮了,那我就翻转晶体管,准备下一次刷新。”信号在路上有没有延迟,完全不影响最终结果。“与门”的布尔逻辑,根本不在乎时间。
但你的大脑,极其在乎时间。我想,这就是为什么现在学术界都在疯狂炒作神经形态计算、脉冲神经网络的原因。突然之间,“时间”变成了一个核心操作数。这不仅能大幅节省能耗,效率也高得吓人。而IIT理论会非常硬气地告诉你:没错,这极有可能就是产生“意识”的先决条件,因为这些极其吃时间的“高阶互动”,从一开始就被死死地嵌在IIT的数学底层结构里了。
对我来说,作为一个神经科学家,回到我们对话的开头,学习这些数学很艰难,因为我数学真的很差,而且我不喜欢它,一点也不享受。但当你硬着头皮学下去,突然发现:“卧槽,原来这个理论里居然藏着这么宏大的宇宙……”(笑)
保罗:不过,当你越来越擅长这些数学的时候,难道就没开始享受它吗?
亚历克斯:完全没有,还是极其痛苦。
保罗:抱歉,我这么问有点自私,因为我和你一样——可能比你更甚——看到方程时就会想:“啊,这要花好多时间,值得我费这个劲吗?”如果我有一丝“哦,最终我会享受这个”的念头,那会帮助我降低行动的“活化能”……每年我都想“我真的需要弄懂这组方程”,下一年又想“天哪,我怎么又得去啃那堆方程”,如此反复。你付出了这么惨痛的努力,肯定很有成就感,但你居然说你不享受这个过程?
亚历克斯·迈尔:一点也不享受,相当痛苦。坦率地说,如果没有AI的帮助,我甚至无法做到。我曾经熬了无数个通宵,就为了搞懂香农对“信息”的定义。公式里凭什么有个对数?我天天跟AI吵架、辩论,直到最后终于懂了……然后,通常过了两天,我又忘得一干二净了。因为那些方程的信息密度太恐怖了,结构太反人类了。但同时,这个过程也让我明白:不,我根本不需要去死记硬背这个具体的方程。
我真正需要搞懂的,是这个方程肚子里,到底藏了多少值得怀疑的假设。凭什么我们要把这个公式奉为信息的绝对定义?有没有别的信息定义?当然有。那我们为什么不把其他的定义用在研究大脑上?显然,连香农本人都亲口承认过,他那套公式根本处理不了“语义(意义)”。那我们现在为什么还在死抱着这个定义不放?
我想,这就是你死磕在桌前、试图看懂一个方程的真正意义所在。也许,这也是某些人嘴里说的数学之美吧。这种美,其实是停留在哲学和概念层面的,它被死死地藏在那些丑陋、晦涩的数学符号背后。当你熬过痛苦,你会突然看清整个宇宙运转的齿轮。
就像弗拉马里翁(Flammarion)版画里的那个人,他跪在世界里,掀开了天空的帷幕。在天空背后、宇宙本应在的地方,他只看到这些齿轮、旋转的机器、星星,以及被画上迷幻色彩的人们。这更像我的感受:在一切背后,你看到了数学的结构。美就在于此,你会看到:“对啊!如果万事万物本质上都是关系,那你的意识当然应该跟大脑的物理状态挂钩!这当然应该是一种能用极其严密的数学去描述的关系!”突然间,一切都豁然开朗:是的,物理学的尽头就是数学,这完全说得通,而且越来越说得通,因为我们确确实实是在用数学,去描摹这个世界的终极结构。
当然啦,走到这一步之后,你大可以继续去跟哲学家们吵架,去争论“这到底是不是宇宙的全部”,或者“这只是我们人类可怜的认知能力所能触及的极限”。但在我看来,这至少是我们能踩得最实的一块基石了。
数学是发现,还是发明?
保罗:这回到了那个问题:难道只有数学才是真实的?而我们感知到的所谓物理世界、所谓的“现实”,仅仅是依附在宇宙底层数学轨道上的一层混沌表象吗?
亚历克斯:是的。我对此很纠结。这是我目前觉得最引人入胜的问题之一,并且很高兴有越来越多的人加入探讨。这呼应了罗素曾引发的一场辩论,他理解到:在科学中,我们发现的只是关系。当你说“电子”时,你能发现的唯一东西就是,当我对其施加作用时它会怎样,或者它会对其他事物产生什么影响。更深层的问题是,你所谓的因果又是什么意思?这打开了另一个潘多拉魔盒,而对IIT来说,关键是我们是否有描述它的数学。
现在很多人认为现有的数学框架似乎并不完备。我们目前拥有的关于因果的数学很强大,但存在问题。这触及自由意志等议题。如你所说,更深层的问题是:在外在关系之外,是否存在某种内在的东西?我对两种可能性都持开放态度。我的直觉是,我的意识肯定有某种内在性。第一人称视角是实打实存在的。但让我心里打鼓的是,咱们这又绕回了“隐喻”和“语言”的死胡同。你刚才提到了直觉的作用。
作为一名心理学家,我担心的是,直觉——大量研究显示——是基于我的经验。你的直觉会随着你经历新事物而改变。如果你深入探究直觉的核心,或许有遗传成分,但那也不过是你祖先经验的累积。本质上,它让你能凭直觉应对世界。
我担心的是,我对第三人称视角没有任何直觉。我从未见过它,甚至无法想象。“视角”到底指什么?我能想象到的任何视角,或者别人说你拥有的视角,撑死也就是个180度的视野。我连松鼠那种360度的视觉世界都想象不出来。我曾经疯狂研究过那些有过濒死体验或者嗑药致幻的人,我总是抓着他们问:“你当时看到的是360度的全景吗?”但即便如此,那依然不是真正的第三人称视角。
正如托马斯·内格尔(Thomas Nagel)所说,那是一种“无源之见”( view from nowhere)。它仍然会以你物理所在的位置为中心。这意味着我从未体验过它,我没有相关的直觉。我认为,很多关于“一切都是结构”的争论,根源在于:是的,我的直接经验是第一人称的,你的也是。我们只有第一人称经验。我是个笛卡尔主义者,所以我相信这就是你所拥有的一切。你就像被困在柏拉图的洞穴里,死死盯着墙上的影子。你的大脑硬生生给你捏造了这个第一人称体验,然后你就被永远锁死在里面了。剩下的一切,全都是假设。你真的亲眼见过放射性吗?你对因果到底了解多少?
我认为问题在于,当我们思考第一人称视角(我们的意识)与数学的关系时,这是不平衡的:我们对第一人称视角有大量直觉(我知道我的意识是怎样的),但对第三人称视角毫无直觉。如果我试着去“直觉”你此刻的感受,我可能做得很差,但比完全没直觉好一点,因为我好歹知道“作为一个大活人坐在那儿”是什么感觉。
但如果我们把两个方程式摆在桌上,纯粹用第三人称视角去看它们,我们脑子里是没有任何直觉的。不过,正因为我们对这俩(方程和第三人称视角)都没直觉,所以我们平时也不觉得别扭。比如勾股定理,a²+b²=c²,它们不过是一堆指向某种原理的抽象符号,这根本不会困扰我,因为我压根儿不会去对它产生什么“直觉”。我脑子里最多就是浮现出大家画的那个三角形的隐喻图像。
可一旦你想把我的“意识”强行映射到一套看似是第三人称的“数学描述”上,系统就崩溃了:我在这头(意识)直觉爆棚,在那头(数学)却毫无直觉,于是这个映射怎么看怎么别扭。我就会想:“不行,我没法用这玩意儿描述一切。”我担心,这种抗拒很大程度上仅仅是因为:我对第一人称视角直觉泛滥,却对第三人称视角直觉无能。
我想,这大概也是为什么量子场论会遭遇同样的白眼。当很多人得知“不不不,世界根本不是一堆小乒乓球撞来撞去,而是场里的激发态”时,他们会追问:“行,那场到底是个啥?”结果物理学家告诉他:“哦,就是个张量(tensor),就像个3D或4D的超级Excel表格,只是空间每个点上填了个数字而已。”他们听完绝对会大失所望:“这怎么可能是世界的本质啊!”但现实是,它就是能给出最精准的预测。说句实在话,要是没有它,你现在根本用不上这些高科技,对吧?
保罗:没错。以方程E=mc²为例。我在想,不管是IIT,还是其他任何试图把意识数学化的路子,咱们就假设是IIT这种用结构主义解构意识的方法吧,它最终的终极目标,可能就是得出一组(或者一个)极其优美、预测力爆表的数学方程。假设它特别简单,比如“意识 B 等于神经胶质细胞数量的平方”之类的。但即便如此,它依然不能……就像E=mc²,我们至今也搞不清引力的形而上学或本体论本质到底是个啥,但我们就是能把它描述得极其完美。这是我们能拿出的最优解,我们总得在某个节点停下脚步,心满意足地承认“这就是解释”。
我们总是习惯性地觉得:“哇塞,我们彻底懂引力了,因为我们能写出它的方程式!”但这根本不是我们的潜台词。我们压根儿没在聊它的形而上学底座。科学家们不一定(也不应该)去对形而上学本质指手画脚。如果意识科学最后也走到了这一步,你会觉得爽吗?那当然很美妙,但它依然只是一个“近似值”,因为科学的边界是无限的。它会成为一条铁律,但它不一定非得去死磕意识的形而上学本质,这样咱们不就能完美避开形而上学的雷区了吗?对吧?
亚历克斯:是的,我认为没错。不过,我个人的倾向性更强一些。我的论据会是简洁性,即奥卡姆剃刀原理(Occam’ s razor)。奎因也有类似的论点。如果一个理论能如此完美地描摹这个世界,而且这就足够了,比如量子场论,那你非要再硬塞进去一只我们看不见、摸不着,却能改变粒子轨迹的“粉色隐形独角兽”,那就纯属吃饱了撑的。对我来说,如果你说:“看,大功告成,我们现在拿到这个方程了。让我们来开个脑洞……”当然啦,这其实是个坏习惯,我们不该对未来瞎做思想实验,因为未来根本无法预测,历史早就证明人类在这方面错得有多离谱。
但咱们就先假设,我们真的拿到了那个大脑方程。我们现在其实只是在测试人类的“可构想性”,而我们的想象力极有可能是个残次品。说到底,我们现在只是在拿自己的直觉做压力测试。尽管如此,咱们就顺着往下想,然后你跳出来说:“嗯,我还是觉得这背后应该还有点别的什么。”如果我能在这里完美描述你的意识,甚至能在电脑屏幕上一比一重现你此刻看到的东西——顺便说一句,我们正在以极其恐怖的速度逼近这个目标,现在已经有人能部分解码梦境了:把你塞进核磁共振,用AI跑数据,再用生成式AI把画面还原出来,结果已经准得吓人了。这在我们的有生之年绝对能完全实现。
但你肯定会说,那依然不是一回事,因为我依然是透过我的第一人称视角在看屏幕。也许我有色弱或者色盲,看着就不一样等等。我完全理解你会反驳:“嗯,肯定有一些极其内在的东西,是这些外在关系永远抓不住的。”但我的反击是:“行,但如果你非逼着我在我的形而上学、我的本体论世界观里再多塞点东西进去,你总得拿出点实打实的数据或者逻辑论证来按着我的头让我认账吧?你不能光凭一句‘我的直觉告诉我还有更多’就想打发我啊。”
最终,我谨慎地(重申,我是贝叶斯主义者,所以我从不相信我掌握了真理)认为:“就可能性而言,一个认为‘一切皆是结构’的简化模型,似乎……在可预见的未来,是相当合理的。”它现在还没彻底成型,但我已经能看到它跑通的希望了。我非常同意你的担忧,我觉得真正的毒瘤是“相对主义”。最可怕的就是那种“哎呀,科学也给不出绝对真理”的调调,或者像我之前吐槽的,干脆觉得“根本没有真理”。这不仅是自我打脸,还会直接滑向“怎么着都行”的虚无主义。
我觉得在这个圈子里,最烂的一句毒鸡汤就是“所有模型都是错的,但有些模型有用”。这简直是大错特错!明明就存在一些完美的、对应的模型,它们一点毛病都没有。我经常拿“一米”的定义来举例子。那曾经就是一个模型。当年一帮人凑在巴黎,拿出一根金属棒,极其严谨地把它定义为1米,然后向全世界宣布:诺,这就是一米。
保罗:那是一个定义,不是一个模型。
亚历克斯:那绝对是个模型。在数学上,那就是个模型。它是一个抽象概念的物理实现。搞数学的人管这叫“模型”。实际上……
保罗:那是他们定义它的方式啊。那是他们给“一米”下的定义。或者说,那不是一米的模型。那就是“一米”本身被定义出来的过程。
亚历克斯:你完全可以拿一个东西的模型……数学家会告诉你,在现代理论里,这就是一种“实现(instantiation)”。当你平时说“我在给某物建模型”时,你潜意识里觉得你是在做减法、做简化。但你注意到了吗,世界上是存在一一对应的模型的。你完全可以搞一个跟英格兰岛一比一等大的模型。如果你把它……
保罗:那它就是英格兰本兰了,而不是英格兰的模型。
亚历克斯:一份拷贝。那会是一份拷贝。那是在另一个星球上一个夸克一个夸克复制出来的,对吧?那就是一个一一对应的模型。
保罗:是的。
亚历克斯:它是完全等价的。同构的。
保罗:哎,好吧。我估计那些科学哲学家肯定得跳出来抗议,说那算哪门子模型,因为从定义上讲,模型就必须是对某物的抽象。
亚历克斯:是的,但那不是数学意义上的定义。我觉得大家把概念搞混了。人们天天把“模型”挂在嘴边,但在理论体系里,模型其实是理论的一个“实现”。你先有一套概念性的理论,然后模型通常是某种计算或者数学形式体系,它是从你的理论里通过逻辑硬生生推导出来的,而且是可以拿去检验的。这是一个自上而下的箭头,不是自下而上的。它不是向上做抽象减法,而是向下做具体构建。
保罗:我猜那个最著名的反驳例子就是:如果你把一只猫的每一个细节都完美复制了,那你得到的其实就是那只猫本身。咱们是不是可以这么说:在极限状态下,一个完美的模型确实是一一映射的,但我们在现实中几乎永远也摸不到那个极限?我还是不同意你那个关于“一米”的例子。你得换个例子才能说服我。
亚历克斯:保罗,你仔细想想,它真的是一个“一米”的模型。从根本上说,“米”是一个极其抽象的概念,而那根躺在巴黎的金属棒,就是我们为“米”打造的一个物理模型。
保罗:行吧。也许我们可以在“定义”和“模型”的边界上继续杠下去,因为那确实是它在物理世界里的定义方式。
亚历克斯:现在我们把它物理定义为光在一定时间内传播的距离。那是一个定义,但这也是一个模型。你只是取了它的一部分。总之,我的观点是,那种“所有模型都是错的”之类的毒鸡汤,最大的危害在于,它们会疯狂暗示你去脑补一些根本不存在的东西,比如“所有的理论归根结底都是扯淡”,或者直接把你推进相对主义的深渊……
保罗:是的,你担心相对主义。
亚历克斯:我认为出路是实用主义。威廉·詹姆斯当年就试图告诉大家:有些理论,它就是比别的理论好用。你必须得认命。绝不是所有的理论都生来平等。咱们肯定都能达成这个共识,因为如果我要坐飞机出门,我绝对希望工程师用的是现代空气动力学理论,而不是古希腊那套胡扯的空气运行学说。
但在我看来,实用主义有个问题,那就是你得向我解释,为什么有些理论比另一些更好用。如果你死活不承认这个宇宙里存在一个绝对的真理,而且我们的理论正在结构上无限逼近它、对齐它,那你就根本没法解释这个现象。我的想法与真实存在的事物之间必须有某种结构上的重叠,这才是它“好用”的根本原因。我还没听到一个真正有说服力的论证,能说明如果不存在真理,为何有些想法可以比另一些更好。要论证这一点非常困难。
所以,我们在这一点上是一致的。没错,科学在狂飙突进,我们懂的越来越多,模型也被打磨得越来越变态,但如果你拿放大镜去看,最底层的骨架其实从来没变过。你看看牛顿的经典力学,它其实完好无损地套在量子物理的肚子里,也套在相对论的肚子里。你完全可以把牛顿物理学看作是这些宏大理论在低速宏观下的一个“特例”,它从来没有真正被“干掉”。你再看生物学,没错,我们现在是用分子生物学和DNA的底层机制来解释遗传进化,而不是理查德·道金斯(Richard Dawkins)他们当年搞的那套个体进化论(比如《自私的基因》),但达尔文的“自然选择”依然死死地嵌在最核心的地方。
是的,我们在疯狂给理论打补丁,但我们其实从来没有真正经历过那种颠覆一切的库恩式范式转移。似乎一旦某个理论极其优秀,特别是当它被数学形式化之后,它就已经无限逼近真理了。就像皮亚特·海恩(Piet Hein)那句绝妙的诗:“我们一错再错,但错得越来越少,越来越少。”它可能依然有瑕疵,但我们必须承认,它就是比其他一堆破烂选项要强得多。
顺着这个逻辑,你完全可以在人生的每一秒钟都保持极致的怀疑——承认你在宇宙面前就是个一无所知的文盲。也许你唯一能确定的就是“我存在”,仅此而已。但有些理论就是比别的好,而我们每个人都被死死地困在自己所处的时代里,我们只能抓住那些在当下看起来最靠谱的解释。既然如此,我们就绝对不该去凭空捏造多余的假设。我们不该往里面瞎塞别的东西,尤其是在没有任何实打实的经验或逻辑证据撑腰的情况下。对我来说,正是这种克制,让“万物皆结构”这个想法变得极其性感、极其诱人。
我对其他那些意识理论最大的不满就在于,它们总是把意识搞得特别“反自然主义”。在自然主义的视角下,宇宙就只有一个物理宇宙,一切都归物理定律管,而那些没有意识的死物完全是……我完全愿意接受这一点,但如果你想反驳,你得拿出极其硬核的证据。因为我们是从自然主义起步的,我们默认存在一个极其自洽、因果链条完全封闭的真实世界。除非你把铁证拍在我脸上,否则我绝对会顺着这条路一直走到底。而这,恰恰就是结构主义和IIT理论最迷人的地方:它把“意识”这个原本看起来跟物理世界格格不入的刺头,完美地安抚了下来。它严丝合缝地把意识嵌进了物理宇宙里。
对谈链接:
https://www.thetransmitter.org/brain-inspired/alex-maier-argues-that-a-scientific-explanation-of-consciousness-requires-grounding-in-formalized-mathematics/
关于追问nextquestion
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。您也可以在后台提问,我们将基于追问知识库为你做出智能回复哦~
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。
Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、科普视频媒体「大圆镜」等。
热门跟贴