A Computational Model of Minimal Phenomenal Experience (MPE)
《最小现象体验(MPE)的计算模型》
https://www.preprints.org/frontend/manuscript/2c5592c69907b50f46348753274b894b/download_pub
摘要:
最小现象体验(MPE),或称“纯粹意识”,是一种基础的意识体验形式,其特征是具有反身性元意识,且缺乏常规现象学中的许多特征。它被描述为例如非概念化的、非时间性的、无自我的、无视角的。本文旨在利用自由能量原理(FEP)推导出的变分自由能量最小化的数学方法,开发一个MPE的计算模型。我采用计算神经现象学方法,在主动推断框架内形式化MPE的关键现象学特征。该模型包含参数深度,允许对生成模型参数进行高阶推断。我将特定的模型参数化与报告的MPE品质(如元意识、平静、无努力感和非概念化)联系起来。所提出的模型表明,当一个主体通过自我导向的意识和对其生成模型的调节实现极低的自由能量时,尤其是通过强调对意识本身的意识,MPE就会产生。该模型预测了MPE现象学的元素,包括一种无努力感、无时间感以及“零人称视角”的可能性。文中概述了对所提模型进行模拟的实施细节,以及实证验证的方向。
关键词:自由能量原理;现象学;纯粹意识;最小现象体验;计算建模
1. 引言
本文的背景是托马斯·梅青格(Thomas Metzinger)发起的关于人类意识的最小模型解释的研究计划(Ramstead, Albarracin, Kiefer, Williford, et al., 2023; Wiese, 2020)。他认为,任何对意识的解释都应首先努力解释我们能够识别出的该现象的最简单版本。这引发了问题:人类所具有的最简单的意识体验形式是什么?为了回答这一问题,梅青格开展了一项雄心勃勃的现象学调查,记录了数百名报告经历过(或正在经历)一种绝对简化后的“最小现象体验”(MPE)的个体的经历(Metzinger, 2020),这种体验也被称为“纯粹意识”。
“MPE项目”的研究成果被记录在梅青格最近出版的《盲人摸象》(Metzinger, 2024)一书中,书中记录了MPE中常见的、被广泛报告的特征或品质的集群。他的研究发现,存在一个现象学集群,这些看似相关的体验主要由经验丰富的冥想修行者报告。这些体验的标志在于其简单性,MPE似乎缺乏我们通常会期望的许多特征,例如概念性内容、时间感,甚至主观视角。对这种简单但不常见的体验的解释,或许可以为意识研究搭建一个稳固的基础框架,或者至少作为一个任何意识理论都必须解释的经验数据点。
然而,本文的主要目的并非为某种意识理论提供证据。相反,我的目标是概述一种从事计算现象学的方法,并通过开发对MPE的初步解释来展示其潜力,我和其他人可以在这一基础上继续构建。这种方法的价值在于它为我们提供了一种用于解释和理解我们体验的计算语言,尤其是与MPE和冥想实践相关的引人入胜且常常具有变革性的现象学。这些感知模式对于体验者本身具有深远的内在价值,因此,对MPE的机制性解释的价值超越了它对候选意识理论所提供的证据。此处所呈现的计算现象学最好被理解为一种严谨的概念框架,用于促进我们对自己亲身体验的第一人称研究(“指向月亮的激光”)。我认为,这项工作的真正“成果”在于对意识的直接体验性认知。因此,此处的主张是实用主义的,而非形而上学的。这项工作为底层建模框架作为意识理论的有效性所提供的任何证据,是一种次要效应,供读者自行解读,并非核心动机。
本文提出的模型是对梅青格在《盲人摸象》(Metzinger, 2024, pp. 475–477)中最初提出的模型的迭代更新,以涵盖MPE更广泛的现象学特征。建模方法基于一种被称为计算神经现象学(Ramstead et al., 2022; Sandved-Smith et al., 2024)的方法论,该方法利用了从自由能量原理(FEP)(Friston, 2019)推导出的变分自由能量最小化的数学方法。FEP认为,持续存在于时间中的生命系统可以被理解为对其环境进行一种变分贝叶斯推断(Da Costa et al., 2020; Da Costa, Friston, et al., 2021; Friston et al., 2022)。使基于FEP的计算神经现象学成为可能的核心假设是,这种变分推断所产生的(贝叶斯)信念,即变分密度,可以用来建模第一人称现象学(Hohwy, 2013)。这可以被视为弗朗西斯科·瓦雷拉(Francisco Varela)最初提出的第一代神经现象学(NPh)研究计划的现代版本(Varela, 1996, 1997)。
鉴于MPE的证据库主要是现象学报告,在本文中,我通过形式化MPE现象学的几个选定特征来构建解释模型。对于每个特征,我都探讨它如何可以用计算语言来描述,从而构建起一组计算约束条件,这些条件将为所提出的MPE模型提供信息。基于FEP的神经现象学的一个独特之处在于,这个基于现象学构建的模型,原则上可以生成神经生物学预测,以测试并进一步完善所提出的模型以及我们对MPE的理解。
接下来,我首先简要概述自由能量原理及其与本文所采用的计算神经现象学方法的关系。然后,我将对MPE的几个关键现象学特征进行计算解释。在这些要素的基础上,我构建了一个关于MPE的提议模型。请参阅附录以了解模拟实现细节和由此提议得出的神经生物学预测。
在此过程中,一个假设逐渐浮现:MPE代表个体处于极低自由能量状态的现象学,这种状态是通过递归自我建模和优化自身生成模型参数实现的。
2. 从自由能量原理到深度主动推断
为了构建一个能够解释最小现象体验(MPE)核心特征的计算模型,我们需要一个稳健的建模框架。这里采用的框架被称为主动推断框架(AIF)(Smith et al., 2022),它是自由能量原理应用于主体系统的一个特定应用。除了对其环境进行变分推断之外,主体系统还会执行自主行动以最小化自由能量,这使它们具备了规划和决策的能力。这意味着不仅要最小化基于当前和过去感觉数据的变分自由能量,还要最小化预期自由能量(EFE),后者基于对选择特定行动方案(策略)后将接收到的感觉输入的预测。值得注意的是,通过行动来最小化自由能量,等同于最大化对自身和环境生成模型的证据,这一过程被称为自我证实(Hohwy, 2016)。
如上所述,我们假设现象学与后验分布的动态有关,即状态推断。实际上,这意味着我们在寻找可能与参与者报告的MPE特定特征相关联的状态推断,以及这些推断形成的依据。
本文提出的计算模型采用部分可观测马尔可夫决策过程(POMDP)的形式,这是一种常见的方法,用于建模主动推断主体感知和行动背后信念更新的过程。
特别是,这种模型表现出一种反身性或深度。在之前的研究中,我们曾提出,对认知状态的意识以及心理行动可以通过一个具有参数深度的分层主动推断模型来建模(Sandved-Smith et al., 2021)。这种深度使主体能够对其他推断过程的参数进行高阶推断,即形成关于信念的信念。这正式捕捉了元认知或“深度推断”的概念(Da Costa & Sandved-Smith, 2024; Sandved-Smith & Da Costa, 2024),并为心理或隐蔽行动提供了机制。
在本文中,我将采用同样的方法。这很重要,因为它为基于观察自身模型参数的状态推断提供了一种机制。如果没有这种深度,现象体验(即状态推断)就只涉及外部状态,主体无法感知其感知是如何形成的(即推断中涉及的生成模型的参数)。感知形成的过程对主体来说将是“透明的”,因为主体是通过其生成模型的参数化来看待世界的。当主体能够通过观察其内部参数进行二阶推断时,我们说它们使生成模型中一个原本透明的方面变得“不透明”(Metzinger, 2003; Limanowski & Friston, 2018)。这使得主体能够形成后验信念,用于建模人类现象学更深层次的方面,例如对认知状态的意识,以及如我们即将看到的——对意识本身的意识。
3. 方法论
本文所提出的模型的新颖之处之一在于将参数深度机制扩展到更广泛的模型参数范围。在之前提出的模型中,只有似然精度受到二阶推断的影响。在这里,我赋予模型形成关于其他参数(例如偏好精度和策略精度,见图2)的深度推断的能力。这种扩展增强了模型的解释能力,因为由此产生的状态推断可以与各种现象学特征相关联。
将现象学与模型参数之间的关系进行建模的方法,首先从理解每个参数在后验形成中所扮演的数学角色开始。通过实践,这使我们能够直觉地理解调节某个特定参数“会是什么感觉”(从被建模主体的角度来看),就其感知或行为体验可能如何变化而言。基于这种数学基础的直觉,我们可以形成关于如何建模不同现象学特征的假设。这还得到了对所讨论现象学的深入第一人称熟悉程度的促进,例如定期进行冥想实践。
这种方法论乍听起来可能像是数学上的编故事——我们如何(不)验证现象学与参数之间所假设的关系呢?首先需要注意的是,建模架构强制执行了一定程度的内部一致性。这是因为模型参数是相互依赖的。因此,我们对一个参数所做的假设会对其他参数及其相关现象学产生影响。因此,模型的内部一致性以及其与现象学特征之间关系的对齐,提供了构念效度的初步来源。
此外,生成的模型具有预测能力,我们可以利用它来检验提议的预测效度。作为一种计算模型,我们可以运行关于未来模型动态的模拟。这产生了三种形式的预测:现象学预测、行为预测和神经生物学预测。
现象学预测来自于对给定参数化下感知推断预期动态的研究。我们将在第4.4至4.7节中看到现象学预测的例子。
行为预测来自于在特定任务设置中模拟行动选择的能力。这一部分在此没有涉及,但在原则上是可以处理的。例如,进入MPE状态是否会改变在用于测试冲动性的“行动/不行动”任务中的行为表现?
神经生物学预测则得益于对主体内部状态动态的双重解释,这些动态既可以被理解为信念动态,也可以被理解为状态本身的热力学特性。这种所谓的“双重信息几何学”是深度计算神经现象学的基础(Sandved-Smith et al., 2024),它使得现象学和神经生物学之间的预测流动成为可能。这一内容在附录B中进一步解释。
4. MPE现象学特征的形式化
在以下各节中,我们将考察与MPE相关的一些核心现象学特征。每一节都将提出对这些特征的计算解释,逐步构建出一个详细的模型。最终的模型将作为对MPE体验的计算解释,我们可以利用它来推导关于MPE机制的见解,并生成实证预测,以检验现象学是否能够转化为数学模型。请参见第5节中的表1,其中总结了这些形式化内容。
4.1 元意识
元意识是我们将在构建所提议的MPE模型中形式化的第一个现象学特征。在MPE中,参与者经常报告具有高度的元意识,即对意识内容的清醒意识。
“687 我处于一种清醒的状态。我对当下的时刻有很强的意识。就好像我是一只看门狗:我的所有感知似乎都变得敏锐了。我处于意识之中,但我并没有做任何事情,除了感知声音、气味、身体的感觉。”(梅青格,2024,第33-34页)
在之前的研究中,我们曾提出元意识可以被建模为对模型参数的二阶观测的似然精度(Sandved-Smith et al., 2021)。请参见图1中的(2)参数。为了证明这一定义的表面效度,我们在一项注意力任务中模拟了高元意识和低元意识的影响,结果表明,当元意识更高时,走神的时期(在未意识到分心的情况下分心)减少了。这重现了实证结果,并与现有的元意识定义一致(Dunne et al., 2019)。
这种元意识参数使主体能够意识到自身的内部状态,因为它决定了由生成模型参数产生的观测的精度或权重。鉴于这些参数定义了主体的行动 - 感知模型,高度的元意识意味着对其推断过程的驱动因素的持续“不透明化”。这与元意识的常见定义一致,即明确注意到意识内容的能力。
因此,在参数化MPE的计算模型时,我们可以利用这些现象学数据来确定这一高阶似然精度参数的值,将其设置为“高”。从数值上看,这意味着其值大于1。从计算角度看,其效果是主体能够对各种生成模型参数的状态形成明确无误的推断。
4.1.1 元意识与反身意识
有趣的是,在MPE期间,元意识的体验通常被报告为具有反身性。换句话说,元意识被体验为对意识本身的意识。
“1350 [……] 当相关状态出现时,就像看到了“看”,或者意识到正在意识到。”
“1617 体验到对意识本身的意识,或者对认知本身的认知。”(梅青格,2024,第396-398页)
乍一看,这种反身性似乎与迄今为止所提出的元意识机制相矛盾。“元”一词可能会让人联想到一种“更高视角”或一个单独的观察点。此外,这种紧张关系可能会因对图1中呈现的分层模型的简单解读而得到加强。似乎主体被分裂了,产生了意识到内部状态的部分与内部状态本身之间的某种分离。
然而,经过更深入的调查,我们可以看到这种反身性的现象学实际上与这种计算解释是一致的。
需要澄清的误解是,分层推断会创造出一个单独的“更高视角”或内部的“小矮人”。通过利用贝叶斯力学的数学原理,我们可以证明,尽管主体具有分层或嵌套的结构,但存在一个最内层的“认知核心”或“内在屏幕”,它包含了来自其他层级的所有信息。有兴趣的读者可以在(Ramstead, Albarracin, Kiefer, Klein, et al., 2023; Sandved-Smith & Da Costa, 2024, §8.1)中进一步探索这一主题。对我们目前的目的而言,关键点在于存在一个单一的变分密度,它捕捉了推断层级中所有层级的信念。其中一些信念是关于支撑其他信念形成的底层过程的,然而所有这些信念都是同时被体验到的。
让我们进一步剖析赋予元意识体验反身性特征的计算机制。或者用梅青格的话说,就是“自我认知的现象学特征”。当模型中引入参数深度和元意识时,在计算逻辑的流程中出现了三种反射性的来源。这些为其他人所描述的反身意识的现象学提供了一个数学基础,他们将其称为一个“美丽的循环”(Laukkonen & Chandaria, 2024)。
第一个机制与元意识参数在使主体自身模型参数的动态可供推断方面所起的作用有关。主体的模型参数共同支撑了导致后验信念形成的推断过程,我们将后验信念与感知体验联系起来。换句话说,元意识使得对感知内容(即后验信念的形成)的意识过程得以建模。因此,高度的元意识使得主体能够意识到其体验产生的过程——他们正在意识到对感知内容产生意识的过程。这一观点将在第4.2节中进一步展开。
第二种反身性机制出现在我们将主体建模为能够基于元意识参数进行状态推断时(见图2)。这种更高阶(第三层)的元意识状态推断,使主体体验到对自己意识程度(即元意识参数值)的意识(即元意识状态推断),这种意识程度是关于意识过程(即生成模型参数的动态)的。在观察到这个特定参数之前,主体已经意识到自己的体验。这种元意识的额外反身性提供了一种对已经存在的意识的认识。
最后,第三种反身性机制来自于分层方案中信念信息传递的“循环”逻辑。顶层推断影响并被底层推断影响。因此,分层推断的层级诱导了信念信息传递的层级循环。然而,正如上文提到的,这种循环产生的信念被捕捉在最内层变分密度的动态中——因此被体验为一种单一的整体体验。因此,我们期望关于元意识的现象学报告会试图表达一种反身性的印象,即体验领域指向自身。或者用梅青格的话说:
“……就好像认知的现象学特征动态地向自身折叠,悄无声息但持续不断地将意识重新嵌入自身。”(梅青格,2024,第394页)
在继续之前,需要注意的是,梅青格区分了双重元意识和非双重元意识,这种区分基于是否存在一个体验元意识的“我”的感觉。我不认为这种区分是元意识机制本身的一部分,而是个体模型包含“自我作为原因”状态因素的程度的结果。这一内容将在第4.6节“零人称视角”中讨论。
4.2 建模认识空间
梅青格提出的一个关键直觉是“认识空间”这一概念。这是主体能够知晓的可能现象内容的空间。梅青格进一步提出,纯粹意识,即对意识本身的意识,可能与主体知晓或建模认识空间的能力有关。
“在我看来,认识空间这一隐喻是纯粹意识或最小现象体验(MPE)的最好现象学隐喻。……而体验纯粹意识仅仅意味着拥有这个空间的模型,……。”(梅青格,2024,第46-47页)
这一基于现象学的直觉在我们考虑具有参数深度的模型的后果时,找到了一个可信的计算对应物。生成模型的输出,称为状态的后验分布,是一种信念形式化为概率分布,它代表了主体对其感官数据原因的最佳解释。在计算现象学的背景下,这一分布被理解为主体感知体验的计算对应物(Ramstead, et al., 2022)。产生这一解释的推断过程是接收的观测和那一刻生成模型的特定参数化(即感官信息和先验信念)的结果。如果我们假设一个部分可观测马尔可夫决策过程(POMDP)模型结构,这些参数包括例如似然映射,它编码了关于状态观测映射的信念,以及转移映射,它编码了关于状态从一个时刻到下一个时刻可能转移的信念。不同的参数化(例如不同的学习历史)会导致不同的后验分布。
我们可以将每个可能的后验分布作为一个点绘制在统计流形上,即一个高维平面上,每个点定义一个概率分布,每个维度是生成模型的一个参数。这个流形有效地代表了主体可能持有的所有可能的信念,即所有可能的感知体验。这与梅青格的认识空间概念非常相似:
“根据定义,认识空间是一个可能性的空间:它包含每一个可能的认识场景以及每一个可能发生的自身动态划分——每一个可能被给定系统知晓和体验的潜在事物。认识空间包含了一个给定系统所拥有的知识状态的全部。因此,它涵盖了在特定的时间和空间位置上,主体获取世界和自我、使现实向自身呈现的多种方式。”
(梅青格,2024,第50页)
后验分布本质上是认识论的,因为它捕捉了主体当前的信念状态。因此,定义所有可能后验分布的统计流形似乎是认识空间的一个合适候选的计算模型。
如果我们接受这一点,那么主体形成对这一认识空间的模型意味着什么呢?这正是参数深度所支持的二阶推断所实现的。它赋予了主体将自身的模型参数作为进一步推断的观测对象的能力。结果是对模型参数本身的生成模型。鉴于这些参数定义了可能的后验分布(体验)的统计流形(认识空间)的维度,因此具有高度元意识的主体可以形成对这一空间的模型——通过对参数本身的动态和相互作用进行建模。
因此,我们找到了梅青格关于纯粹意识作为认识空间模型的自然计算对应物。需要注意的是,这在模型中创造了另一个有趣的递归或反身性,主体本质上是在对其感知背后的建模过程进行建模。
4.2.1. 深化对觉知、空性与止息的理解
通过将觉知描述为可能后验认知空间的模型,我们面临这样一个事实:地图并非领土本身,即认知空间的模型并非认知空间本身。这只是一种对包含所有可能信念的统计流形的主体模型。我们可以从这一事实中得出两个洞见。首先,这为“变得更觉知”或“深化到纯粹觉知”的体验提供了一种机制。
“1354 [...] 在冥想中,纯粹觉知的体验随着时间的推移和冥想实践的发展而变得越来越明显。”
(Metzinger,2024,第450页)
这也与将觉知视为一种不断进化、无边无际的过程的冥想传统相呼应,其中认识到觉知既是一种初始的洞见,也是一段没有固定终点的不断扩展的旅程。这种扩展的计算隐喻是持续映射可能后验信念的流形。
一些评论者指出,由于自我表征的内在限制,这一过程本质上是开放的(Friston等人,2012;Fields等人,2024;Sandved-Smith和Da Costa,2024)。从启发式角度我们可以理解为什么;随着越来越多的空间被映射,主体自身也在发生变化,从而改变了要被映射的对象。换句话说,通过了解自己,我们正在改变要被了解的事物,这种方式使得完全的自我表征始终难以完全实现。乍一看,将最小自由能与MPE(最小预测误差)联系起来似乎与持续的模型扩展过程相矛盾,因为“最小”可能会让人联想到一个稳定的终点。然而,需要注意的是,最小化自由能等同于最大化生成模型的证据,即“自我证实”。
从对认知空间的计算理解中,我们可以得出的第二个洞见是“觉知本身是空的”。空性指的是体验的一个特征不具有固有的品质或存在。纯粹觉知本身通常被报告为体验的基础,某种非常“真实”的东西。然而,如果我们把觉知建模为主体对认知空间的模型——我们可以看到,纯粹觉知的体验本身也是一个正在进行的构建(即,没有与主体无关的固有本质)。
这指向了超越觉知的更深层次的非体验的可能性,通过解构这一基础的认知空间模型本身来实现。
“3323 [. . .] 然而,后来在冥想中出现了更多的“体验”,其中纯粹意识的最后一点痕迹被熄灭了。这就像一种内在的死亡,但同时也比纯粹意识本身带来了更大的自由。——在那里,很明显地体验到,纯粹意识远非最深(或最高)的——事物,而是“在它背后”——存在着一个更广阔、无法用言语描述的“非任何事物”。但它无法用言语描述,因为它不再是体验;最多只能被描述为所有体验的缺失,或者作为绝对的自由。”
(Metzinger,2024,第189页)
这段优美的引文讲述了在高级冥想修行者中并不罕见的“止息”体验(Laukkonen等人,2023;Agrawal和Laukkonen,2024;van Lutterveld等人,2024)。止息是一种体验的中断,是一段短暂或延长的什么都没有的时刻。这与MPE(最小预测误差)不同,后者仍然是一个体验,尽管它可能非常微小。然而,我们可能会问,MPE与止息之间(如果有的话)有什么关系?
一个初步的假设是,MPE是一个在止息附近的体验簇,即MPE是一个在状态空间中产生最小自由能的区域的体验,而止息是零自由能的极限情况。
4.2.2. MPE作为生成模型掌握的结果
从计算角度来看,认知空间的模型是通过经验和内省学习而来的,关注构成主体推理过程的参数的动态。这唤起了一个与冥想中对感知本质的洞察相似的概念,即完善对觉知空间本身的模型。
如果假设生成模型的某些参数对主体对它们的信念是敏感的,即存在一种心理行为可以调节生成模型的参数(Limanowski & Friston,2018),那么做好这一点将带来独特的优势。例如,我们在图1中看到了如何在注意力调节心理行为的情况下形式化这一点。将这种能力推广到其他模型参数,为主体在自由能最小化过程中开辟了一个全新的自由度。除了更新模型并积极寻求能够确认模型的数据(即主动推理)之外,通过参数深度,主体可以动态且智能地调整其精度权重。改变模型参数相当于采用一种“看待事物的方式”(Burbea,2014),因为由此产生的后验(感知体验)发生了变化。
这导致了关于MPE在抽象计算层面可能是什么、如何达到以及为什么这种体验对经过广泛冥想训练的个体最为可靠的一个高级假设:凭借对生成模型参数的足够觉知和控制,主体能够进入一个最小自由能的区域,主要是通过自我调节生成模型本身(即内在而非外在的掌握)。当主体强调对认知空间的觉知时,这会汇聚成一种MPE的沉浸状态。由于主体正在建模其模型中始终存在的一个特征,即任何体验发生的空间,因此这使得自由能的产生可以非常低。在适当的条件下,这会导致一个近乎完美的预测反馈循环(“觉知吗?觉知。觉知吗?觉知。等等。”),这是由于无法想象无意识是什么样的“反事实不变性”所导致的(Metzinger,2024,第51页)。这一假设将MPE中的“最小”与“最小自由能”联系了起来。
4.2.3. 无界认知开放性作为一种平坦的状态先验
Metzinger还引入了“认知开放性”的概念,他将其定义为“无障碍的认知空间”,并认为这是纯粹觉知的一个重要现象学特征(Metzinger,2024,第47页),与在MPE(最小预测误差)中常见的“无界性”特质密切相关。从计算角度来看,这一特征意味着对由转移映射B编码的先验期望的减弱。精确的先验会限制可能的后验信念空间,而一个完全平坦的先验则为每一刻的任何后验时刻打开了可能性。通过调节转移精度来实现对先验期望影响的弱化(见图2)。由此得出的假设是,在MPE期间,转移精度的值较低,使得可能信念的认知空间保持无界。因此,主体完全开放于任何认知状态的可能性,不对下一刻的解释加以限制。
4.3. 平静
MPE现象学的另一个核心特征是平静的特质,被描述为宁静、平静、静止甚至是“存在的安逸”。这一特质意味着对传入刺激的非反应性或不易受扰动的状态,可以用先验偏好的平坦分布来建模。
“2985 [. . .] 在我看来,最重要的是放手。我能够感知身体感觉和思想,但与日常生活不同的是,我对它们什么也没做。这让我一步步走向一个更深层次,一个我从未体验过的意识状态。这是一种无限的平静状态。[. . .]”
(Metzinger,2024,第10页)
在主动推理的术语中,行为是基于预期自由能G来选择的。这是行为(或行为序列)在未来可能产生的自由能,鉴于对行为如何影响状态转移以及这些未来状态可能产生的观察结果的信念。预期自由能可以分解为认知项和实用项,其中实用项取决于主体对结果的先验偏好,记为C。
这些偏好促使主体选择能够从内部(内感受)或外部环境中获取预期观察结果的行为。
如果预期观察结果与偏好出现偏差,精确的先验偏好分布将导致较高的预期自由能,驱使主体分别回避或寻求不偏好的或偏好的观察结果。较高的偏好精度转化为较高的敏感性和反应性,成为回避行为的强大驱动力。
在MPE(最小预测误差)中,我们观察到相反的现象学特征,参与者报告出一种稳定的平静感和轻松感。这意味着这种精度被下调了,使得行为的实用驱动力被弱化,对传入观察结果的反应性也降低了。从计算角度而言,这是通过将参数深度机制扩展到先验偏好C来实现的。与其他模型参数一样,用于二级推理的信息并非参数本身,而是通过精度推理捕捉到的关于参数的二级信念。例如,在图1中,反馈到模型中的是似然精度,而不是似然A本身。这些精度参数(记为)是主体通过自由能最小化推断出来的,它们代表了主体对相关参数编码的信念的信心(Parr等人,2022,方程(B.20))。
因此,通过引入一个二级精度参数来调节C对策略选择的影响,可以在计算上实现对偏好的调节。预期自由能变为:
通过将这个参数引入深度生成模型,主体可以根据对参数值的观察来进行状态推断(见图2)。一旦能够做到这一点,主体就将模型中原本透明的一个方面变得不透明化(即进行了建模)。这使得主体能够基于预期自由能最小化来选择心理行为,而这些行为通过下行信息传递来影响参数的值。
因此,在MPE(最小预测误差)发作期间,假设是个体有意识地培养一种深度的平静状态。我们可以将其建模为通过一种降低偏好精度的心理行为来弱化先验偏好的分布。鉴于偏好定义了与主体生物生存和持续存在(“拉回吸引子”)相关的吸引态集合(Sajid等人,2022),“存在的安逸”这一描述尤其贴切。
4.4. 无为性
到目前为止,使大部分现象学建模得以实现的机制是参数深度所支持的心理行为。这为认知主体如何对其自身感知系统的参数产生影响提供了一个计算上的解释,这种影响可能会合理地引发所报告的MPE(最小预测误差)现象学的某些方面。
这种主动机制似乎与MPE的一个重要现象学特征相矛盾:无为性。个体将MPE报告为一种几乎没有或完全没有认知努力感的状态。这是一个有趣的报告,它使我们能够进一步检验这种计算模型解释。我们会发现,鉴于我们已经在上面列出的参数化,无为性实际上是由模型预测的。
“79 [...] 这种体验是无为的,并且没有任何明显的欲望感。——不再有任何需要到达某个地方或获得某样东西的感觉。”
(Metzinger,2024,第331页)
我将采用(Parr等人,2023)中概述的论点,其中作者提出认知努力可以形式化为情境敏感的心理行为选择与习惯性心理行为选择之间的差异。这种差异代表了一个复杂性项,可以理解为在给定情境性感觉信息的情况下,心理行为信念更新的信息长度。这一论点部分基于热力学要求,即根据情境信息更新习惯性先验信念,以及从情境不敏感到情境敏感的行为选择的转变,这种转变在信息处理需求上会产生一种“成本”,被体验为认知努力。因此,认知努力项被定义为:
其中,表示Kullback-Leibler散度,是对隐秘策略(一系列心理行为)的信念,G是预期自由能,E是对策略(或习惯)的先验信念。
因此,无为性的现象学在其计算对应物中表现为这种努力项趋于零。从数学角度来看,这可以在几种特定条件下发生:1)当G对所有策略都是均匀的或相似的;2)当E的幅度相对于G较大;或3)当G和E对齐。
在MPE(最小预测误差)的情况下,条件1和条件2同时起作用。如上所述,在MPE期间,元觉知水平很高,偏好精度很低。这转化为心理策略的预期自由能的值很低且均匀。要理解这一点,请参考方程(1)中G的表达式,并注意到高元觉知会增加似然映射A(2)的精度,从而降低其熵,进而减少感知模糊项的幅度。通过上一节中描述的平静机制,成本项也得以降低。因此,预期自由能G将在策略上具有低幅度且均匀的分布。此外,正如我们将在下一节中看到的,MPE期间的时间规划深度被弱化,这也导致了策略上的均匀分布。最后,鉴于MPE通常与冥想背景相关,我们可以通过反复训练和习惯化来预期E的幅度较大。
因此,到目前为止概述的MPE的计算模型预测了MPE中报告的无为感,这为模型提供了一定程度的预测有效性。
4.5. 非概念性
MPE(最小预测误差)的体验通常被报告为没有任何概念性加工。这有时被描述为缺乏思辨性思维或心灵的宁静,有时则被描述为完全没有概念性的存在,包括任何关于叙事性自我概念的观念。
“1196 [...] 在我看来,这种体验最好被描述为‘非概念性’的。”
(Metzinger,2024,第23-24页)
先前的研究认为,非概念性的认知加工模式可能出现在导致时间规划视野被弱化(即时间深度为零)的情况中。这些情况包括使用致幻剂(Deane,2021)、心流状态(Parvizi-Wayne等人,2024)以及深度冥想沉浸(Laukkonen & Slagter,2021;Czajko等人,2024)。这些情况的共同点是强调对当下时刻的观察进行加工。无论是通过药物诱导、情境强制还是有意识地培养,这些体验都促使认知资源专注于当下时刻。将这种现象与非概念性联系起来的论点假设了一个物理主体在每一刻能够进行的推理的热力学极限(Fields等人,2024),因此,对当下时刻的强烈推理权重意味着相应地减弱了规划中所需的面向未来的推理。
对反事实未来进行模拟需要将主体的一个隐含概念投射到未来的时间中,以及对未来的行动序列可能产生的反事实后果进行概念性粗粒化。我们可以将策略推理的这一计算过程与Metzinger所说的“认知主体模型”联系起来。
因此,通过完全弱化时间深度,主体不再为了行动选择而推理这些概念的展开过程。因此,这些概念在现象学上不再出现,导致一种没有与自我相关的思考或与规划相关的更高阶认知加工和概念化的状态。
因此,非概念性意味着当前观察数据的精度足够高,需要将认知资源专门用于其处理,从而导致时间深度很小或为零。在我们的模型中,这转化为高似然精度(已经从元觉知的形式化中预期到)以及控制规划深度的参数值接近零。
概念化和反事实规划的缺失也与第4.2.3节中讨论的转移信念的弱化相一致。随着转移精度的降低,任何推断出的后验信念都不会延续到下一刻。这导致一种完全开放于当下且没有任何概念性约束的感知。这也使得反事实规划变得不可行,因为状态的展开变得极为模糊。
4.5.1. MPE模式与MPE状态
MPE(最小预测误差)的体验可以分为两大类:MPE沉浸状态和持续的MPE模式。MPE模式的特征是纯粹觉知与其他感知内容同时存在,而沉浸发作则是纯粹觉知而无感知内容的状态。
如果MPE模式和状态都强调对当下时刻的处理,那么区分它们的机制是什么?在(Metzinger,2024,第475-477页)中,我们提出MPE状态涉及对感官数据的弱化,同时保持对觉知本身的推理的高精度(见图2中的s(3))。而MPE模式可以被建模为既有这种元觉知推理,又有其他正在进行的感知推理。
在具有感知内容的MPE模式中,所有感官映射的似然精度保持较高。而MPE沉浸状态则可以通过将所有可用的精度完全分配给更高阶的观察模态来建模。这意味着沉浸发作可以被建模为一个系统,其传入数据主要是内部生成的对其生成模型参数的观察。
4.6. 零人称视角
MPE最引人入胜的特质之一是Metzinger所说的“零人称视角”(Metzinger,2024,第xix页)。对于报告类似MPE现象学的一部分人来说,这种体验被描述为没有主体感或任何形式的自我意识。
“1612 [...] 我所体验的世界不再独立存在,因为我已经成为那个体验的展开。之前的‘我’作为体验者、选择者、思考者已经不存在了。相反——只有体验本身。——体验有一个视觉中心,但只是因为光在那里与眼睛相遇。中心不再有任何意义。”
(Metzinger,2024,第397页)
如果没有亲身经历,很难想象或概念化这种体验,因为主客体区分似乎如此不言自明。然而,高级冥想者通常会描述一种“无中心的感知模式”(Ingram,2018)或一种没有体验者的体验模式。假设这种现象学特质存在于MPE状态和模式中(即持续的无中心性),我们该如何从计算角度来解释呢?
在上文中,我们讨论了时间深度的弱化如何削弱叙事性自我构建和概念化。然而,我提出零人称视角代表了感知处理中更根本的转变。我们可以通过指出零人称视角是一种持续的存在模式(而不是一种暂时状态)来支持这一点。即使在需要深度时间规划的活动(例如预约牙医)中,这种无自我意识的形式仍然存在。
由于我们把体验与后验信念联系起来,我们可以通过问:与习惯性的第一人称视角相关的后验分布是什么?与体验中的“我”或“我”第一人称指代相关的后验是什么?后验是主体对某些观察子集原因的最佳猜测。因此,我们可以将这个问题重新表述为,主体存在哪些观察,这些观察可能被解释为由主体自身引起的?
由于参数深度的存在,主体正在观察其自身的模型参数(见图1)。产生这些观察的因果过程既依赖于外部动态,也依赖于主体的内部动态(即主体模型参数的相互依存动态)。因此,如果主体没有对自己内部状态的准确模型,就会有影响其自我观察的因素无法被预测(即其自身的参数动态),从而导致意外的观察,即自由能。
因此,这里提出的关于第一人称视角来源的计算假设是,主体通过将其原因归因于主体自身(即主体的内部状态)来解释这种不确定性。从某种意义上说,这种后验解释是正确的——主体的内部状态(这些状态参数化了它的信念)确实是预测误差的原因。然而,对一个抽象原因的诉求(我将其称为“内部原因概念”)并没有提供避免预测误差的预测能力。这是因为这种解释是事后应用的,是对尚未建模的因果过程的一种合理的粗粒化。主体推断出产生这一观察子集的生成过程位于马尔可夫毯的主体一侧。这种对原因的抽象归因可以在没有对过程本身进行详细预测模型的情况下进行。因此,预测误差仍然存在,但很快被归入内部原因概念的“地毯下”。关键点是,这种策略创造了对主体模型内部状态的引用,作为对其感知过程观察的解释,我假设这可能是对第一人称视角现象学的一个很好的解释。
为什么这种概念在MPE中会缺失?如果我们假设,如上一节所讨论的,MPE产生于个体对其认知空间(即其自身的模型参数)有一个足够不透明化的模型,那么可以推断,MPE将缺乏以这种方式定义的自我概念。有了这样一个精确的模型,主体不再需要这种抽象的解释来解释由于其对自身参数动态缺乏理解而产生的预测误差,因为这些预测误差根本就不会出现——正是因为发展出了一个准确的预测模型。换句话说,当主体对这些原因有一个良好的模型时,就不需要通过“内部状态作为原因”来解释未被感知的内部动态。
因此,在一个瞬间(或一系列瞬间)的洞察或贝叶斯模型简化(Friston,Lin等人,2017)中,内部原因概念状态因子被剪枝,以支持对支撑感知内容推理构建的机制的更准确理解,即通过参数深度建模的参数动态。换句话说,通过清晰地看到心灵的运作,主体从对自身的抽象引用和由于缺乏理解而产生的预测不一致中解脱出来。
4.7. 无时间性
MPE(最小预测误差)的另一个迷人特征是报告中的无时间感。
“3330 我会用‘时间的停止’、‘没有时间的空间感知’等术语来最好地描述我的体验[……]
2771 这是一种既不向前移动,也不向后移动,甚至也不是静止不动的体验。”
(Metzinger,2024,第248页)
两种计算机制可能分别解释这种体验的不同方面。在某些情况下,无时间感被描述为“无时间的变化”或“变化的当下”,而在其他情况下,体验则是一种更抽象或纯粹的无时间性(例如“永恒体验”)。我们将会看到,这两种情况都由到目前为止所呈现的模型所预测。
“变化的当下”的体验很好地被第4.5节中描述的时间规划视野的弱化所捕捉。在这些条件下,不存在心理上的时间旅行或对未来或过去状态的投射。相反,对当下时刻感官数据的感知推理占主导地位,而没有对接下来会发生什么的感觉。变化仍然存在,因为后验分布正在逐刻更新,然而只有关于当前观察的当前信念被考虑。
另一方面,纯粹的无时间性可以从计算角度解释为MPE沉浸期间信念更新的信息长度很小的结果。最近,时间持续的体验已被与信念轨迹的信息长度联系起来(Da Costa等人,2024)。因此,缺乏时间持续意味着信念更新的信息长度非常小。从数学上讲,这将时间持续感与先验和后验信念关于状态之间的KL散度联系起来:
这一假设尚未得到实证验证。然而,从现象学角度来看,它具有表面上的合理性,因为信息长度代表了主体的体验在每一刻的变化程度。
如果我们接受这种观点,那么MPE中的纯粹无时间感就遵循了到目前为止所概述的计算模型。回想一下,参数深度使主体能够感知其自身的模型参数。每一层的观察结果是由下一层的参数精度生成的。精度可以被理解为参数的一个总结性统计量;它在较慢的时间尺度上波动,并且包含的信息比参数本身更少。因此,随着我们沿着参数层级向上攀升,信念更新的幅度会减小。正如我们所看到的,在MPE沉浸期间,只有更高层次的推理存在,而低层次的感官数据被弱化了。假设个体已经稳定了他们的觉知,那么对这种状态推理的更新的信息长度将趋于零。这在主观上被体验为时间持续的停止。在MPE模式中,与更高层次推理相关联的无时间感的体验与低层次感知推理相关的正常时间感知同时存在。
4.8.Bliss
最后,这种计算模型如何解释MPE期间关于积极情感的报告呢?
“3305 [...] 我感到极大的幸福在流淌。[……]
2687 [……] 一种深深的喜悦、无时间感和幸福涌现出来。”
(Metzinger,2024,第147页)
在MPE(最小预测误差)的报告中,体验到喜悦、敬畏、欣悦或感恩是很常见的,但这并不是一个必要的特征。许多冥想者报告了没有这些特质的纯粹觉知体验。此外,这些特质也常常出现在其他正常的日常体验中。那么,我们的计算模型如何解释这种差异呢?
在主动推理框架内,情感体验已经被建模为基于对“模型精度”参数的观察的状态推理。模型精度(记为或ீ)是一个依赖于生成模型所有其他参数的全局总结性统计量。它编码了主体对其整个行动模型的信心。推断这个参数就是回答“我减少自由能的效果与我预期的效果相比如何?”这个问题。因此,这种关于“情感推理”的计算解释(Hesp等人,2021)将情感价值与自由能的变化率联系起来(Joffily & Coricelli,2013)。因此,我们可以将高情感价值建模为自由能的负变化率,即当主体在减少自由能方面“越来越好”的时候。
在上文中,我们讨论了主体对其模型参数的准确建模如何能够改善自由能的最小化,因为由内部原因产生的预测误差通过改进的自我建模得以解决。自由能的减少也是高元觉知(低感知模糊)和高平静(低偏好精度)的结果。如果我们假设定义MPE的这些条件的转变持续了一段时间,这就创造了一个场景,即主体产生的自由能可能比其模型预测的减少得更快。
因此,在这种情况下,从计算角度来看,他们会对伴随着越来越不透明且无偏好的自我模型的自由能减少感到“愉悦的惊喜”,这反过来会表现为模型精度的增加和积极情感价值的上升。然而,一旦达到自由能的稳定最优值,变化率就会下降,相关的情感价值也会逐渐减弱。这或许可以解释在MPE报告中看到的差异,并构成了一个预测的基础,即积极情感价值最有可能出现在MPE的起始阶段。
5. 结论
本文提出了一个基于自由能原理和主动推理数学的最小现象体验(MPE)的更新计算模型。通过在深度主动推理框架内形式化MPE的关键现象学特征,我们开发了一个机械论解释,能够用计算描述来解释第一人称体验报告。该模型表明,MPE是进入一个非常低自由能(或等价地,非常高自我证实)状态的结果,其特征包括:
- 高元觉知,建模为对模型参数更高阶观察的精度增加。
- 先验偏好的弱化,导致一种平静的状态。
- 对主体自身建模过程(即生成模型参数)的精确模型,使得“零人称视角”成为可能。
这些条件进一步导致了与MPE报告的现象学特质相关的更多计算预测,包括无为性、无时间感以及一种没有概念内容的纯粹觉知感。
这项工作的意义不仅在于解释MPE。它展示了计算神经现象学在形式化和帮助我们理解意识体验微妙方面的潜力,为研究意识的改变状态和冥想实践提供了一个严谨的框架。此外,它还为自我意识的本质以及不同感知模式的计算基础提供了新的视角。
然而,必须承认存在一些局限性。该模型仍然是理论性的,需要实证验证。未来的工作将专注于推导和测试关于MPE状态期间的神经生物学动态的预测,并设计实验来评估模型的准确性。
最后,正如在引言中提到的,我希望通过这项工作为描述现象学贡献一种计算语言。这种语言可以作为一张地图,用于指导和启发我们对自身生活体验的第一人称研究。在我看来,对意识的体验性理解远比另一种意识理论更有价值。
附录A. 模拟MPE
本文中探讨的MPE现象学的形式化足够详细,可以定义一个适合模拟MPE的体验和动态的生成模型参数化。模拟的实现和结果超出了本文的范围;然而,下面的图2以贝叶斯图的形式描绘了模型结构,下表则总结了要实施的参数化,这些参数化是从MPE的现象学特征中推导出来的。
附录B. 实证预测
在构建神经现象学模型时采用自由能原理的优势在于,其形式化为所提出模型的实证检验提供了一条合理路径。请参阅(Ramstead等人,2022;Sandved-Smith等人,2024)以获取关于这一主题的详细讨论。简而言之,这是通过自由能原理(FEP)对内部状态动态的双重解释实现的。一方面,内部状态可以被理解为参数化主体对外部状态的信念(所谓的“外在动态”)。另一方面,它们的动态可以用内部状态本身来描述(“内在动态”)(Friston等人,2020)。
其结果是,我们对信念动态所做的假设必然包含关于内部状态动态的预测,这些预测可以通过实证方法进行检验。描述内在热力学动态和实证神经生物学之间关系的是伴随自由能原理的神经过程理论(Friston,FitzGerald等人,2017;Parr & Friston,2018;Da Costa,Parr等人,2021)。对这里所提出的模型所暗示的神经生物学含义的详细探讨是未来工作的主题。然而,为了展示其逻辑,下面突出了一些示例方向。
6.1. 无时间感与代谢成本
我们提到的与时间持续体验相关联的信念更新的信息长度,也与信念更新所产生的代谢成本相关联(Da Costa等人,2024),即信念更新的幅度与能量消耗的幅度相关。因此,将现象学上的无时间感计算化为信念轨迹中的小信息长度,意味着对代谢负荷的预测。因此,我们可以预测,在MPE期间,通过BOLD fMRI信号幅度测量的大脑整体能耗将更低。
6.2. 无为性与大脑
在(Parr等人,2023)中,作者提出他们的理论预测可以将认知努力与基底神经节和前额叶皮层联系起来。这导致了一个可操作的实证预测——在MPE期间,我们应该观察到与认知控制相关的前额叶皮层和前扣带回区域的激活减少。
6.3. 精度参数与神经递质
其他人认为,似然精度、转移精度和模型精度参数的功能角色分别由胆碱能、去甲肾上腺素能和多巴胺能神经递质系统介导。这些系统共同具有的基本作用是对突触传递的影响(即神经调节增益控制)(Parr & Friston,2017a;Schwartenbeck等人,2015)。
这里提出的MPE计算模型涉及这些参数的具体动态,即高似然精度(第4.5节)、低转移精度(第4.2.3节)以及最初较高、随后逐渐减弱的模型精度(第4.8节)。这转化为关于与相应神经递质系统相关的大脑区域活动的实证预测,即Meynert基底核(胆碱能)、蓝斑核(去甲肾上腺素能)和腹侧被盖区(多巴胺能)。从正常清醒意识向MPE过渡时,我们应该观察到这些区域激活模式的变化。
伦理声明:本提交内容仅包含理论分析。未进行涉及人工智能、人类或动物受试者的实验。我谨慎设计了我们的方法,专注于形式化描述,而不是可能引发意识的实现,尽管这种可能性极小。这项研究旨在进一步推进科学理解,同时严格遵守不创造或冒险创造人工有感知能力的生物的伦理边界。
原文链接:https://www.preprints.org/frontend/manuscript/2c5592c69907b50f46348753274b894b/download_pub
热门跟贴