元认知粒子、心理行动与代理感|代理感|元认知粒子|原理|心理行动|现象学|贝叶斯|马尔可

Metacognitive particles, mental action and the sense of agency

元认知粒子、心理行动与代理感

https://arxiv.org/abs/2405.12941

摘要

本文使用统计物理和贝叶斯力学的语言来阐述元认知。元认知信念，即关于信念的信念，在这种形式化框架中找到了自然的描述，这使我们能够定义“元认知粒子”的动态，即具有元认知信念的系统。我们进一步通过区分被动和主动元认知粒子来剖析这种元认知系统的类型学，其中主动粒子具有更新其他信念参数的心理行为能力。我们为这种架构在主观能动性意识和与环境分离的体验的出现中的必要性提供了论据。其动机是为认知——以及更高形式的认知——的数学和物理理解铺平道路，进一步推动认知科学在数学物理语言中的研究和形式化。

关键词：贝叶斯力学、自由能原理、马尔可夫毯、朗之万方程、元认知、能动性、计算现象学

1. 引言

在这篇理论性论文中，我们建立了经典物理与元认知之间的联系。我们提出的问题是：元认知在简单的物理术语中会是什么样子？我们采用贝叶斯力学的视角，将元认知定义为“关于信念的信念”。根据这一定义，元认知可以简单地用统计物理的语言来描述。我们探讨了由此产生的架构如何引发心理行为和主观能动性的形式化概念。接着，我们讨论了与计算现象学的联系，提出了初步的经验预测，并指出了未来工作的方向。其动机是为认知——以及更高形式的认知——的数学和物理理解铺平道路，进一步推动认知科学在数学物理语言中的研究和形式化。

2. 系统、状态与涨落

我们考虑一个系统在一段时间内的演化。为了简化并便于阐述，我们假设该系统按照随机微分方程（即朗之万方程）演化：

这个方程将系统在某个状态空间中的运动分解为我们对系统的了解（用流 f 表示，即状态空间上的一个矢量场）和我们不了解的部分。我们不了解的部分由噪声过程 w 概括，它代表随机涨落，通常被假设为均值为零的平稳高斯过程（根据中心极限定理）。这种动态的形式将方便我们稍后用流来描述不同状态子集之间的因果关系。

这是一个自然的起点，因为物理学的大部分内容，特别是统计物理、量子力学和经典力学，都可以用随机微分方程来表述。简而言之，如果我们想要一种与物理学其他部分兼容的认知物理学，那么这就是正确的起点。

随机微分方程是对系统随机轨迹的隐式描述，这些轨迹是流和随机涨落的函数。涨落的随机性意味着系统也表现出一定程度的随机性，只能用概率来描述。

2.1 符号说明

在接下来的内容中，我们用 x（状态空间路径上的随机变量）表示系统的轨迹，用 w （同上）表示噪声过程的轨迹。我们将系统在某个时间点 t 的状态和随机涨落的状态分别记作 x(t) 和 w(t) （状态空间上的随机变量）。这些随机变量都可以用状态空间或路径空间上的概率分布来等价描述，例如 P(x(t)) 和 P(x) 。我们用大写字母 P 来强调我们处理的是随机变量的概率分布，这些分布可能存在也可能不存在密度。不过，为了直观理解，可以将它们视为密度。我们将在后面遇到的所有其他随机过程（即系统的各个子部分）中使用类似的符号。

3. 粒子与事物

在我们的系统中，任何被研究的对象——在其被观察的时间段内——根据定义必须能够与系统的其余部分区分开来。这反过来又意味着存在一个边界，将对象的内部路径与外部路径分开。因此，我们将系统划分为外部、边界和内部。

因此，我们将在下文中交替使用“边界”和“毯”这两个术语。相应地，我们将由内部状态和边界状态构成的研究对象、事物或人称为“粒子”。这是指一个粒子可以描述统计物理中的一个简单的微观粒子，也可以描述经典力学或广义相对论中考虑的一个大粒子（如行星），或者生物物理学中考虑的一个生物有机体（如细胞或人类）。参见图1（右侧）。

或许保证存在马尔可夫毯的最简单的动态形式如下：

当外部、边界和内部状态上的随机涨落相互独立时。

3.1 感觉运动边界

接着，我们将边界或毯进一步划分为我们所称的感觉路径和主动路径。

我们将感觉路径操作性地定义为那些直接影响内部路径但不被内部路径直接影响的边界路径。相应地，我们将主动路径定义为那些直接影响外部路径但不被外部路径直接影响的路径；那么系统的运动可以表述如下：

参见图1（右侧）以了解说明。

3.2 认知和元认知粒子

我们说一个粒子是认知的，当且仅当其内部路径参数化了关于其外部路径的信念。这里的“信念”是技术意义上的，指的是由某些充分统计量参数化的条件（即贝叶斯）概率分布。其定义属性是存在一个从内部路径到关于外部路径的信念的映射，使得在边界路径给定的情况下，最有可能的内部路径编码了关于外部路径的后验信念：

直观来说，这意味着内部路径在给定边界信息的情况下追踪外部世界。粒子成为认知粒子的充分条件已在文献 [11, 4, 20] 中给出。请注意，在某些情况下（即在随机微分方程的一般化坐标表述中），路径是由状态参数化的，因此内部状态参数化了关于外部路径的信念 [11]；但我们将不在此深入这些技术细节。

注3.1：在现有的自由能原理处理中，粒子被默认为是认知的 [11, 8, 12]。我们在这里特意做出区分，认为粒子是通过在一段时间内存在的马尔可夫毯来定义的——这对应于“存在”的定义——而认知粒子则被定义为具有近似后验信念的粒子（并隐含地具有可以从边界状态中明确区分的内部状态，如上所述）。

我们进一步区分被动元认知和主动元认知。被动元认知信念是由内部路径的一个子集参数化的，它们只能通过共享的边界路径来影响低层次的信念（见图2）。例如，一个人突然发现自己无法品尝咖啡的味道（这可能是胰腺癌的迹象）而感到惊讶，可能会进行内省并相应地采取行动 [16]。

主动元认知信念是由更高层次的内部路径参数化的，这些路径通过一个内部马尔可夫毯与低层次路径分开（见图3）。术语“主动”指的是存在更高层次的主动路径，这些路径可以影响低层次的内部路径（见第5节）。

请注意，在主动情况下，可以构成粒子关于世界的信念的全部参数集合。相比之下，被动元认知信念必然只是关于粒子关于世界信念参数的一个子集。

我们现在通过一些例子来看看这具体是什么样的情况。

4. 被动元认知粒子的一个例子

这种耦合的形式也可以在图2中看到。

在这种设置中，可以证明感觉路径在更高层次和更低层次的内部路径之间形成了一个马尔可夫毯 [11, 方程 29]。简单来说，给定感觉路径，低层次路径中没有进一步的信息是高层次路径中所不包含的。

特别是，低层次的内部路径只能通过感觉路径间接地被高层次的内部路径推断出来。因此，我们可以定义由高层次内部路径编码的元认知信念。

读者可能会注意到，元认知信念是关于低层次信念的参数的，并且想知道这是否合理地意味着信念关于信念。我们指出，这确实如此：贝叶斯信念是一个概率分布，它可以像这里一样，通过其参数或充分统计量来完全描述。因此，定义一个信念的充分统计量或参数的概率分布，就等同于对这个信念本身的一个（元认知的）信念。

接下来，我们考虑另一类粒子，这类粒子在更丰富的意义上是全面元认知的，因为它对其关于世界的信念的所有[充分统计量]都有信念。这些是嵌套粒子。

5. 嵌套粒子与主动元认知

在这里，我们考虑嵌套粒子，即粒子内部还有粒子。参见图3以了解说明。我们将嵌套粒子的动态描述推迟到附录A，因为它对我们的讨论并非至关重要。要点是，较低层次的内部路径（来自外部粒子）可以编码关于外部路径的后验信念，给定较低层次的边界路径：

满足（13）和（14）的嵌套粒子在更全面的意义上是元认知的，因为更高层次的内部路径——即内部粒子的内部路径——编码了关于（外部）粒子所持有的关于世界的信念的所有[充分统计量]的后验信念。这必然涉及对低层次信念参数的主动元认知控制，如果内部边界包括主动和感觉路径的话。这可以被理解为一种自我控制的形式，因为更高层次策略的结果是粒子内部路径的明显依赖。

为了提供信息，需要注意的是，也有满足（23）和（13）的嵌套粒子，具有更高层次的主动和感觉路径——因此具有元认知控制——其中元认知信念只涉及低层次内部路径的一个子集，使它们部分元认知。

6. 奇异元认知粒子与能动性意识

回想一下，在文献 [11] 中定义的奇异粒子，其主动路径并不直接影响内部路径，且边界和内部状态上的随机涨落可以忽略不计。在 [11] 中，作者指出，尽管奇异粒子（8）具有一种能动性——定义为拥有依赖于内部路径的主动路径——但该粒子无法推断出它们确实是其行为的主体。关于奇异粒子，他们写道：

“从观察一个主体（比如一条鱼）的人的视角来看，似乎这条鱼在寻找食物颗粒。然而，从鱼的视角来看，它认为自己被一种幸运且仁慈的方式推动着在水中游动，这种方式将食物颗粒送到它的嘴边。换句话说，鱼并没有意识到它是其行为的主体，它只是相信这就是世界运行的方式 [...]" [11, 第27页]。

作者进一步提出，能够认识到自己的行为是由能动性所支撑的主体，可能需要一个具有层级深度的生成模型，即拥有关于信念的信念。通过这里定义的元认知粒子，我们可以明确地阐述这一说法的依据。简单来说，奇异认知粒子只有关于主动路径和外部路径的信念，因此永远无法形成关于内部路径和主动路径之间关系的信念。换句话说，它们缺乏意识到它们（即它们的内部路径）是其行为的因果上游的视角。

然而，一个奇异的、主动的元认知粒子拥有关于其低层次内部路径的（元认知）信念。因此，它们有能力形成关于的因果依赖的信念。我们提出，这种信念可以被理解为粒子的能动性意识。

我们现在用数学方式明确这一点。我们奇异粒子的动态方程为（24），其中我们移除了因果方向

以及所有特定路径上的随机涨落，即内部路径、感觉路径和主动路径 [12]。这种缺乏直接影响意味着低层次的内部路径必须通过低层次的感觉路径（除了外部路径之外）来推断低层次的主动路径。

文献 [11] 中的构建得出了以下奇异信念（由这类奇异粒子的广泛类别所持有）：

7更高级别的元认知
我们可以进一步考虑多重嵌套的粒子，即一个粒子内部包含另一个粒子，而这个粒子内部又包含另一个粒子，等等。参见图4。按照上述方法，最高层次的内部路径可以编码关于下一层级内部路径的信念，依此类推。而最低层次的内部路径则编码关于外部路径的信念。在这种情况下，我们得到了一个具有与嵌套粒子层数相同级别的元认知层次的粒子。在每一层，主动路径可以影响下一层的内部路径，而这个内部路径又影响当前层的感觉路径，而感觉路径反过来又影响内部路径，从而闭合了（心理）行为（心理）感知循环。这种嵌套的描述方式等价于说描述系统的生成模型是一个层级模型，其层数与嵌套组件的数量相同。最后，多重嵌套的粒子可能是N次全面元认知的，因为在每一层，内部路径都持有下一层所有内部路径的信念（见第8.1节方程22）。

8. 讨论

关于元认知粒子的描述存在许多问题。我们借此机会讨论四个关键点：

8.1 无限回归与认知核心

在考虑多重嵌套粒子时，可能会自然地产生两个问题。

第一个问题是是否存在对潜在无限数量的嵌套毯的限制。这种限制并非由本文的处理给出，而是由自由能原理 [11, 12] 决定的。自由能原理表明，粒子倾向于最小化其信念的复杂性，同时最大化其预测准确性（关于每个毯之外的事物）。在这里，我们简单地说，额外的嵌套参数深度会带来额外的复杂性（以额外的信念为代价），而这种复杂性必须被其带来的预测改进所抵消。因此，层数保持有限，并受到自由能最小化中隐含的复杂性-准确性权衡的限制 [11, 12]。

因此，我们推测存在最内层的内部路径，它们不能被更高层次的元认知信念所推断（见图4）。这在系统中对自我表征设定了一个根本的限制：总会有一个“认知核心”，其内部路径编码了信念，但永远不会成为更高阶信念的目标。这一点被 [10] 优雅地表达为：“我永远无法想象成为我自己的感觉，因为这将需要我能够物理上容纳的递归次数，再加上一次。” 此外，这种限制已在 [7] 中通过自由能原理的量子信息理论表述得到证明，并与 [22] 中提出的“不可约马尔可夫毯”的概念一致。

如果我们接受主观体验与近似后验信念所编码的信息有关的观点，那么第二个可能出现的问题是，多重嵌套的马尔可夫毯如何与单一、统一的体验领域相协调。这个问题假定了内部路径参数化的信念与现象学之间的关系。这是一个正在进行的辩论；然而，我们简单地指出，尽管嵌套层之间似乎存在分离，但由最内层路径参数化的信念是关于所有其他层的最深层嵌套内部路径以及外部路径的。因此，内部马尔可夫毯上编码的信息捕捉了所有低层毯上编码的信息。我们可以通过数学方式表达认知核心所持有的信念。假设有一层元认知（即图3）：

因此，如果假设现象学与近似后验信念所编码的信息之间存在关系——这被称为外在信息几何学 [13]，那么就存在一个具有统一体验结构的形式对象。

8.2 数学特征描述

尽管我们已经从概念上用不同类型的内部路径所编码的信念来描述了几种类型的粒子，但一个重要的研究方向是确定这些信念存在的动态条件。这些特征描述通常需要专注于驱动系统的特定动态形式，而在几种情况下已经给出了充分条件 [11, 4]。到目前为止，本文的重点是：这些信念存在于一大类受考虑的动态影响的粒子中。根据我们的特定定义，元认知粒子是存在的。未来的工作将解决符合我们定义的粒子必须满足的具体条件，这反过来将使我们能够对它们的信念动态进行数值模拟。

8.3 计算现象学

这里提出的理论处理与描述内省和元意识等元认知过程（如冥想）的计算模型之间存在一个有趣的联系。当我们尝试对元认知进行数学定义时，这就提出了一个问题：本文中所描述的内容是否可以进一步细化，以更接近我们对这一现象的计算和经验理解。

近期关于冥想的主动推理建模方面的进展表明，某些方面可以通过分层生成模型中的主动推理来充分建模，其中高层的动作调节下一层编码的信念的精度（即逆协方差）[23]。从这一角度而言，这相当于多层嵌套的奇异粒子的行为[11]，其中内层粒子对活跃路径持有信念，这些信念会影响低层粒子所持有的信念（的充分统计量）。未来有一个有趣的方向是，冥想的计算模型提供了我们期望从元认知现象学中看到的例子，以及沿着这些思路的理论处理，展示了这些模型所描述的现象学出现的一般条件。

例如，在大手印（Mahamudra）或自我探究等冥想实践中，一个核心主题是从第一人称角度探究与外部世界的明显分离感。在这些实践中，注意力被引向从“在这里”的视角感知“那边”的事物的印象。类似于代理感可以与内部和活跃路径的联合概率分布相关（第6节），这种分离感在内部和外部路径的联合概率分布中找到了一个潜在的数学候选。这种信念必然编码了我内部与外部分离的理解，因为马尔可夫毯强制了内部和外部路径的条件独立性。

这意味着，在没有关于内部路径的信念的情况下，非元认知粒子可能具有一种“前二元”的、非代理的体验现象学。二元性，被理解为一种分离感，随后作为元认知自我表征的结果而出现，即关于信念的信念。我们提出，原则上，进一步的非二元体验模式可能可以通过贝叶斯力学进行数学描述。

对这一方向的全面探索超出了本文的范围，本文的目标是呈现一种架构和形式主义，可能为思考冥想现象学以及更广泛的元认知现象学中的这些基本主题提供一种数学基础的方式。

8.4 实证检验

原则上，应该可以通过实验来验证任何给定的粒子（例如分子、老鼠或人类）是否符合本文所描述的粒子特征，方法是考察其动态结构和性质。实际上，这需要：1）从实证数据中推断动态——例如，通过基于粒子及其周围环境的时间序列的贝叶斯选择随机动力学模型；然后2）分析得出的结构是否符合上述关于元认知的数学特征。在实践层面，已经有程序可以从实证时间序列中识别嵌套的马尔可夫毯，从而识别多层嵌套的粒子。请参见中使用脑成像数据的示例。这些程序是否能够在进一步的实证研究中用于分解跨尺度的分布式系统，还有待观察。

关于代理感形式化的实证预测也是可能的。例如，我们预测公式（20）中的KL散度将与参与者在方块任务中的行为相关，这些行为由代理感引导，参与者通过动态闭合行动-感知循环来确定他们控制的是哪个方块。有趣的是，这可能为研究心理和发育障碍（例如自闭症谱系障碍）中的差异开辟新的研究途径，其中元认知可能受到影响。

另一个可能的实证研究途径是考察高层动态通过（心理）行动对低层路径的影响机制。注意，主动元认知粒子在层次间的作用机制是通过影响低层信念的参数来发挥作用的。这对我们理解可能促成这种影响的物理相互作用类型具有启示意义。例如，在元认知粒子中，我们预期高层内部路径的动态是影响低层路径动态的过程的起源。在神经生物学中，这导致了关于存在其活动是神经调节动态起源的神经元群体的预测。在心理学中，这可以被理解为建立注意集，或者更简单地说，是注意力。

9 结论

我们提出了一个在贝叶斯力学和自由能原理框架内，基于统计物理学的元认知定义。元认知，被理解为形成关于信念的信念的能力，在这种形式主义中找到了自然的数学表述。我们进一步区分了元认知的不同类型和程度，例如强元认知与弱元认知、主动元认知与被动元认知。

通过这种方式，我们为代理感（与代理本身的在场不同）找到了一个数学对应物，并论证了如此定义的元认知是这种感觉的必要条件。我们将[11]中认知粒子的分类扩展到包括更接近我们自身的粒子，从而为复杂认知生物体中起作用的物理和信息动态的进一步实证和数学研究开辟了方向。

A 嵌套粒子的动态

图3中嵌套系统的动态如下：

原文链接： https://arxiv.org/abs/2405.12941