宏观物理发现动态马尔可夫毯检测|宏观物理|算法|贝叶斯|马尔可夫毯

DYNAMIC MARKOV BLANKET DETECTION FOR MACROSCOPIC PHYSICS DISCOVERY

用于宏观物理发现的动态马尔可夫毯检测

https://arxiv.org/pdf/2502.21217

摘要

自由能原理（FEP）及其相关概念 —— 马尔可夫毯（Markov blankets）和本体论势（ontological potentials），最近被提出作为广义建模方法的核心组件，该方法能够以数学方式描述随机动力系统中持续存在的任意对象，即一种关于 “每个”“事物” 的数学理论。在此，我们利用 FEP 开发了一种数学物理方法，用于识别对象、对象类型以及支配其行为的宏观特定类型规则。为此，我们揭示了马尔可夫毯、强化学习、系统识别理论与宏观物理发现之间的深层联系。更具体地说，我们使用马尔可夫毯的统计特性，将文献中系统等价的两个条件操作化，并开发了一种子系统发现方法，即如何将系统最佳划分为子系统，以及如何对（子）系统进行最佳分类。

通过马尔可夫毯的统计特性，我们证明：给定系统的两个子系统若其毯子共享相同的稳态统计或奖励率，则为 “弱等价”；若其边界的时间演化或路径具有相同的统计特性，则为 “强等价”。这使我们能够根据对象与环境的交互方式正式定义对象类型，也能将系统识别和宏观物理发现的问题重新构建为马尔可夫毯检测问题。我们采用生成建模方法，利用变分贝叶斯期望最大化开发了一种动态马尔可夫毯检测算法，该算法可在微观动力学部分可观测的情况下，识别和分类宏观对象。这种无监督算法利用贝叶斯注意力机制，根据可观测微观元素在给定系统中的当前角色（作为某宏观对象的内部元素或边界元素）对其进行显式标记，并识别支配对象与环境交互的宏观物理规律。由于这些标记是动态的或随时间演化的，该算法能够识别在固定介质中移动或与环境交换物质的复杂对象。

这种方法直接催生了一类灵活的结构化无监督算法，可将复杂的多粒子或多组件系统合理划分为相互作用的宏观子系统集合，即 “对象” 或 “事物”。我们推导了这类宏观物理发现算法的若干示例，并通过简单的数值实验验证了其有效性 —— 算法正确标记了牛顿摆、燃烧的导火索、洛伦兹吸引子和模拟细胞的组件。

1 引言

在本文中，我们借助信息论工具（尤其是自由能原理（FEP）文献中发展的马尔可夫毯（Markov blankets）和本体论势函数（ontological potential functions）概念），重新审视了系统识别理论、工程学和统计物理学中用于系统识别与分类的方法。受近期从信息论原理推导出经典力学和统计力学的研究 [31, 10] 启发，我们提出了 FEP 的一种新推导方式，重点阐释其如何用于构建 “本体论势函数” 以定义对象类型或表型。该方法基于杰恩斯最大 caliber 原理的相对熵表述 [41, 36, 42]，并对特定类型的宏观对象或子系统的边界（即马尔可夫毯）施加约束。我们表明，这些马尔可夫毯约束完全刻画了对象（或对象类型）与环境中其他对象的交互关系，从而通过子系统对其他子系统的影响，形式化定义了子系统的行为特征。这一方法涵盖了当代强化学习、系统识别理论和宏观物理发现中更标准的物理对象识别与分类方法。

系统与子系统的识别和分类问题看似简单。通俗地说，传统系统识别理论关注的问题是：如何用简单的黑箱函数近似器刻画多组件系统的复杂交互与行为？在系统识别的标准方法中，用户将子系统定义为大型多组件复杂系统的一个连通子集，然后刻画该子系统的输入与输出关系。例如，在强化学习中，系统的输入是智能体的观测，输出是其动作。将输入映射到输出的函数称为 “策略”；在此框架下，执行相同策略的两个智能体在相同输入条件下会产生相同动作，因此被视为等价。更一般地，具有相同输入 - 输出关系的两个子系统可归为同一类型。除了为子系统分类提供方法外，该方法的价值还在于能通过将复杂子系统建模为简单传递函数或低维动力系统，实现对其的紧凑描述 —— 这通常需要将整个系统的内部组件 “黑箱化”，即围绕多对象或多组件系统划定边界，然后通过子系统边界的输入 - 输出关系（即其与其他子系统的交互），推导一个（有望简化的）数学表达式来概括边界内复杂过程的影响。在此场景中，边界本身是用户自定义的，用于分离目标子系统与其他子系统。

强化学习中采用的系统等价定义源自系统识别理论：若两个系统具有相同的输入 - 输出关系或策略，无论其内部机制细节如何，均被视为同一类型。统计物理学中也存在类似的宏观系统等价概念：若两个系统可由相同动力系统或能量函数（哈密顿量或拉格朗日量）建模，则属于同一类型。系统识别方法与统计物理方法的主要区别在于，后者通过粗粒化过程简化复杂的微观动力学 —— 该过程首先围绕微观粒子的连通区域划定任意边界，识别用于概括该区域内微观组件活动的宏观状态变量（如温度、压力、密度），然后从微观动力学知识中推导出将内部状态变量与边界守恒量净通量相关联的规则或定律。由于通量是守恒量，不同区域可通过连接形成场方程，以描述由使用相同通量变量的子系统组成的更大系统。因此，某一类型的宏观系统可定义为：由能通过相同通量 - 状态关系建模的连通区域构成（例如，一桶水之所以是 “桶中的水”，是因为桶中每个流体单元具有相同的通量 - 状态关系）。这一过程将状态空间扩展为依赖宏观对象形状的场，并将 “桶” 确立为边界条件。

自由能原理（FEP）被提出作为统一统计力学与信息论的通用数学建模框架，为信念形成、更新及信息处理提供了形式化且符合生物学合理性的方法。FEP 对 “事物” 或 “对象” 的数学定义始于：任何可被合理标记为 “对象” 的实体，必须通过边界与环境分离。在 FEP 框架下，该边界被形式化为马尔可夫毯，其建立了对象与环境的条件独立性。严格来说，马尔可夫毯为变量集 Z⊂X 定义了统计边界，即最小集合 B⊂X，使得在给定毯 B 的条件下，Z 与所有不在 Z 或 B 中的变量条件独立 [15, 36]。在 FEP 文献中，马尔可夫毯通常被视为 “对象” 概念的形式化表达，因为其统计特性完全刻画了对象与环境中其他对象的输入 - 输出关系。

这种看似抽象的边界定义，实际上隐含在系统识别和统计物理学的边界定义中。在系统识别中，系统的边界直接由其输入和输出定义。完整指定系统的输入与输出，可将子系统视为整个系统的驱动力。类似地，在统计物理学中，子系统的流入与流出通量知识既能完全刻画该子系统，也能描述其对系统其余部分的影响 —— 正如初始条件与边界条件足以确定状态变量的演化。因此，“条件独立性是子系统与其环境边界的属性” 这一观点并无争议。在 FEP 文献中，因此有人主张：我们可以通过马尔可夫毯定义对象类型或表型。但为精确起见，需注意更准确的表述是：给定系统中马尔可夫毯的存在仅表明该系统可能被划分为两个交互的子系统，而无其他含义。在识别出毯子后，可利用其总结相关子系统输入输出的特性，进而得出 “毯子的统计特性定义了对象类型” 的结论。近期研究已明确在稳态下保证系统划分为带马尔可夫毯子子系统的数学条件 [44, 20]，且这些条件在 FEP 的路径表述中也被保证成立 [43, 44]。

相比之下，“如何以数据驱动方式首先发现这些边界” 的问题却鲜少受到关注。事实上，在多数 FEP 文献中，研究重点在于阐释存在毯子时的信息流动力学，因此通常假定马尔可夫毯的存在（即毯子的存在性与作用域是先验指定的）。当文献中提出识别马尔可夫毯的方法时（如 [17]），其关注点往往是平稳分布中的近似毯子结构。但这种毯子很少在实际存在毯子结构的系统中实现。此外，马尔可夫毯常被假定为静态的，或与固定组件相关联，这导致一种错误认知：即认为显示物质更新的现象（如行波、火焰、生物）无法用马尔可夫毯建模 [35, 30]。综上，FEP 文献中关键的缺失要素是一种识别动态马尔可夫毯子系统的程序，该程序需能描述广泛的稳态与非稳态现象，包括火焰、闪电、生物体等具有瞬态或渗透性边界、且可能随时出现或消失的系统。

这需要阐明一个理论框架及相关推理算法，以实现隐喻层面的 “顺理成章地分割世界”：即将复杂的多组件系统划分为宏观对象与对象类型，并发现支配这些对象交互的物理规律或宏观规则。理想情况下，这种无监督分割应满足：（1）生成对象及其交互的紧凑低维描述；（2）与人类直觉高度一致，即其生成的系统划分子系统的方式应与人类对相关感知现象的直觉基本一致。基于下文将阐释的原因，我们描述的这类算法称为动态马尔可夫毯检测算法。我们采用的整体方法基于 FEP 在系统路径或轨迹空间中的表述（源自杰恩斯最大 caliber 原理），并结合基于马尔可夫毯的对象与对象类型定义。该表述直接引出 “本体论势函数” 的概念，其通过对毯子统计特性和毯子动力学的约束来定义，并可作为对象类型分类的基础。此处，“毯子统计特性” 指子系统与其环境输入输出关系的典型动态总结，而 “毯子动力学” 指边界本身随时间的变化方式。

从对象与对象类型的这一定义出发，我们考虑一类宏观生成模型，其利用两种潜在变量：（1）宏观潜在变量，以与马尔可夫毯结构一致的方式对微观动力学进行粗粒化；（2）潜在分配变量，根据微观元素或观测在宏观对象、其边界或环境中的角色对其进行标记。关键在于，这些潜在分配变量也允许随时间演化，且演化方式与马尔可夫毯结构一致。最后，通过采用贝叶斯模型发现方法，我们利用贝叶斯推理的自动奥卡姆剃刀效应来选择系统划分为子系统的方式，使全局动力学尽可能简单或低维。

总之，我们将系统识别问题重新表述为马尔可夫毯检测问题。采用生成建模方法并利用变分贝叶斯期望最大化，开发了一种动态马尔可夫毯检测算法，该算法可在微观动力学部分可观测的情况下识别和分类宏观对象。这种无监督算法利用贝叶斯注意力机制，根据微观元素的当前角色（作为给定宏观对象的内部或边界元素）对其进行显式标记，并识别支配对象与环境交互的宏观物理规律。由于这些标记是动态的或随时间演化的，该算法能够识别在固定介质中移动或与环境交换物质的复杂对象。至关重要的是，这种方法消除了系统识别通常依赖的用户指定任意边界的需求，允许对复杂系统进行无监督分割，生成相互作用的宏观对象集合。此外，由于基于发现马尔可夫毯的统计特性，该方法自动具备识别对象类型的能力，使我们能够根据支配对象与环境交互的宏观规则或规律对子系统进行分类。

本文其余部分结构如下：首先概述马尔可夫毯及其在 FEP 中的应用；然后探讨强化学习、系统识别理论和宏观物理发现的核心要素，将系统等价的两种概念映射到马尔可夫毯的统计特性上，并讨论其局限性；随后回到 FEP 框架下的马尔可夫毯，探讨静态与动态马尔可夫毯的数学原理；接着介绍马尔可夫毯检测算法，并考察其在简单系统中的数值应用；最后讨论该工作对 FEP 的广泛影响及未来研究方向。我们认为，FEP 文献中表述的马尔可夫毯统计特性为我们提供了建立 “本体论势函数” 概念所需的数学工具，即通过边界约束严格定义对象类型的函数。

2 自由能原理：核心要素 2.1 自由能原理表述中的马尔可夫毯

从更高层面看，FEP 的标准表述始于施加了马尔可夫毯结构的统计物理方程。马尔可夫毯的概念最初由 Pearl [33] 提出，用于识别影响一组给定 “内部” 随机变量取值推断的完整随机变量集合。1 实际应用中，图模型中每个节点的马尔可夫毯信息可用于确定消息传递算法的结构，以实现高效的概率推断。这一性质直接源自 “内部” 随机变量集合 z⊂X 的马尔可夫毯定义：即集合 b⊂X 满足 z⊥s|b，其中 s 是 z 与 b 并集的补集，或等价于：

在有向图模型中，节点集合 Z 的马尔可夫毯由 Z 中节点的所有父节点、Z 中节点的所有子节点，以及 Z 中节点的子节点的所有父节点组成。这在 Z 中的节点与所有不在毯 B 中的其他节点之间建立了条件独立关系，即 S = (Z ∪ B) 的补集，其中上标 c 表示补集。

其中小写字母表示相应集合中随机变量的取值。

在 FEP 中，这种马尔可夫毯结构的实现方式是假设微观系统的动力学可划分为三类变量子集：内部变量（z）、边界变量（b）和外部或环境变量（s），满足：

条件独立性源于 s 和 z 之间不存在任何直接因果交互，但可以直观地理解为：如果观察到路径 bτ，那么它可以被视为两个独立子系统的已知驱动力。需要注意的是，与该系统相关的马尔可夫毯适用于路径（即系统的时间演化或轨迹），而非稳态分布。同样重要的是，具有毯子结构（即符合公式 6）的动力系统通常不会导致同样具有毯子结构的稳态分布。关于这一普遍规则的一些例外情况，请参见 [15]。

马尔可夫毯与子系统或对象类型之间的联系也直接源于条件独立关系。这是因为，根据定义，两个边界遵循相同路径的对象，无论其内部动力学细节如何，对环境的影响必然相同。因此，可以通过马尔可夫毯的路径统计特性来定义对象类型，另请参见 [42]。关键在于，我们注意到这种对象类型的统计定义与系统识别理论中使用的对象类型定义一致，而系统识别理论在强化学习中是标准的。这是因为毯子统计特性充分刻画了子系统与其环境之间的交互，因此包含了子系统的输入和输出。因此，两个内部结构和状态差异很大但边界统计特性相同的对象，也会具有相同的输入 - 输出关系，并且与环境的交互方式完全相同。在简单情况下，当可以将毯子划分为直接影响外部变量的主动状态和直接影响内部变量的感知状态时，即 b = {a, o}，这一点显而易见。在这种情况下，将贝叶斯规则直接应用于基于马尔可夫毯的对象类型定义，可以直接计算，我们将其视为智能体的策略或子系统的响应函数。

值得注意的是，这种基于马尔可夫毯统计特性的系统等价表述提供了比系统识别更完整的描述，因为它包含的不仅仅是相关智能体或对象的策略。这是因为方程是对称的，因此毯子统计特性还编码了外部系统的 “策略” 。这清楚地表明，基于马尔可夫毯的对象类型定义是依赖于环境的。

2.2 通往本体论势函数的最大 caliber 路径

任何定义的价值皆源于其预测能力。在此我们表明，当将基于毯子统计的对象定义与杰恩斯的最大 caliber 原理 [23, 10, 31] 结合时，可直接推导出 “本体论势函数”—— 该函数通过实例化特定类型对象所需的宏观行为规则，将对象类型的概念形式化，其中类型由毯子统计特性定义 [41, 36]。即给定马尔可夫毯的路径统计量 p (bτ)，杰恩斯原理可用于识别能量函数及相关拉格朗日量，以刻画环境、边界与对象变量的动力学，从而生成该类型的对象。这与物理学中系统分类的概念一致，即物理系统由其最小化的能量函数或稳态作用量定义。（关于基于最大熵原理的类似论证，参见 [27]。）此处我们证明，边界统计特性直接导向对象特有的能量函数 —— 即对应广义自由能及相关拉格朗日量的本体论势函数。这填补了基于马尔可夫毯的对象类型定义与统计物理学中类型概念之间的空白，并自然形成了基于马尔可夫毯统计约束的系统分类学 [37]。

将毯子统计与杰恩斯最大 caliber 原理结合所得的目标函数，正是自由能，这为 FEP 的另一种推导提供了基础。为此，我们从近期纯粹基于信息论推导统计物理学的研究 [31,10] 中汲取灵感，并在最大 caliber 框架内施加边界约束。我们表明，这最终会形成一个自由能最小化问题，与 FEP 基于路径表述的核心要素一致 [36]。杰恩斯的最大 caliber 原理是一种信息论表述，将约束最大熵方法 [24] 扩展到状态空间中的路径或轨迹空间。这种信息论方法常用于统计推断中，以确定数据的最简约模型 —— 即在从数据或已知物理定律导出的约束下最大化熵或 caliber [23]。

最近研究表明，将杰恩斯原理应用于状态空间中的路径，可为推导物理学基本方程提供信息论基础：即给定一组适当选择的约束，优化杰恩斯 caliber 目标可直接导出经典物理、统计物理和量子物理的所有核心方程，并清晰揭示作用量、能量、功和热（哈密顿量或拉格朗日函数）之间的深层联系 [10,31]。该原理还可直接推导出非平衡统计物理中的重要定理，包括克鲁克定理、诺特定理、雅津斯基不等式，甚至热力学第二定律本身 [31,22,19]。

当杰恩斯最大 caliber 原理与基于毯子统计的对象类型定义结合时，其近乎普适的适用性使我们能将非稳态、非遍历系统纳入 FEP 建模框架 —— 这在以往表述中难以实现（参见 [6,35,11,30]）。如我们将所见，这种灵活性使我们能够定义（并最终以数据驱动方式发现）动态或漂移的马尔可夫毯，用于建模非稳态、变化的移动物体（如火焰、闪电、行波），以及与环境交换物质的对象。

2.2.1 杰恩斯原理与本体论势函数

从数学角度看，最大 caliber 理论始于对物理定律的概率性（通常是粗粒化的）刻画 p (˙x, x, t)。该理论假设我们掌握关于特定系统运作的额外信息，这些信息以含时期望的约束形式呈现：

这些期望提供了 “瞬时” 约束，当与动力学先验知识结合时，可有效定义系统类型。例如，稳态几何约束 < f (x)>=C（∀t）会导出经典力学的传统势函数，而动能项则源自牛顿定律（通过 p (˙x, x, t) 表述）。与该系统类型相关的概率定律 q (˙x, x, t) 可通过最大化相对路径熵获得，并通过拉格朗日乘子 λ(t) 施加约束，即：

期望能量、熵与自由能之间的这种关系，使我们能够将 caliber 的最大化转化为自由能的最小化，这与 FEP 的最新表述一致 [16]。此外，借助拉格朗日量可直接推导出相关的哈密顿量，并将哈密顿动力学解释为产生最可能路径的机制 [10]。若约束与时间无关，且假设时间平移对称性成立，则拉格朗日乘子 λ 为常数，进而可确定守恒能量（λ・F）。

关键在于，我们可将这种自由能的对数配分函数形式解释为势函数，其偏导数对应热与功的广义概念 [31]。在最大 caliber 框架中，正是约束条件最终推导出该势函数，以及定义物理系统的朗之万动力学和哈密顿动力学。这意味着约束本身可视为系统类型的定义依据。因此我们得出结论：该自由能泛函是噪声动力系统的本体论势函数，也是 “每个”“事物” 通用定义的核心组成部分。

2.2.2 “每个”“事物” 的马尔可夫毯

FEP 方法为杰恩斯最大 caliber 原理补充的，是对 “每个”“事物” 边界的物理定义。即 FEP 在最大 caliber 框架中加入了一种表征方式 —— 边界并非虚构的（例如，不仅是区域间的通量关系），而是对应于独立、可分离的对象。这源于 “子系统由边界或毯子约束定义” 的概念。

将上述本体论势函数的概念与子系统类型的马尔可夫毯定义相结合，可直接得到给定环境中子系统、“对象” 或 “事物” 的简洁定义：

不难证明，施加毯子约束不会破坏从先验动力学继承的条件独立结构。尽管可以直接强制实现特定的 p (bτ) 约束 [10]，但我们发现通过（可能无限的）含时期望约束集来重新表示毯子分布更为直观。当然，表征任意 p (bτ) 所需的约束未必属于最大 caliber 目标通常使用的 “瞬时” 约束。然而，瞬时约束更受青睐，因为它们会导出因果动力学，因此被视为 “物理上可实现的”。我们通过定义含时毯子 ΩB (t)⊂X 并施加以下形式的约束，将自身限制在这类瞬时约束中：

2.3 一个简单示例：火焰

对马尔可夫毯 “事物” 定义的一个常见批评是，该定义不适用于火焰 [30, 35]。这种误解源于一种错误假设，即认为马尔可夫毯必须是静态的或与物质相关联。

然而，此处提出的形式体系巧妙地涵盖了火焰和其他行波，这得益于对动态边界的考量所赋予的灵活性。

例如，将沿着一维导火线燃烧的简单火焰视为一种非稳态行波（我们将在以下章节提供一个数值示例）。在此，我们将边界定义为区分已燃烧区域和未燃烧区域的点，记为 yb (t)。我们施加的约束条件是，该点的温度应对应于驱动火焰的放热化学反应的着火温度。

2.4 至此小结

在实际应用中，如何使用本体论势函数？我们首先通过动力学先验)确定物理规律，再通过约束指定边界的统计特性。由此确定的动力系统，必然会生成由边界统计特性所定义的对象类型。这可以理解为回答以下问题：（1）微观元素（无论属于子系统内部还是外部）必须如何组织自身？（2）为了实例化特定类型的边界，系统必须如何注入和耗散能量？²

然而，这种实例化目标对象的方法仍无法确定：给定动力系统中哪些特定子集应被视为 “对象”。它仅能告诉我们关于 “支持已识别出的特定对象类型的系统” 的信息。事实上，尽管上述方法有用，但都未能充分解决子系统识别与分类问题 —— 原因正是边界本质上由用户定义。

既然合理的边界对应马尔可夫毯，人们可能会认为 “任何具有马尔可夫毯的元素集合都是对象”。但遗憾的是，马尔可夫毯的定义过于宽泛，缺乏实际应用价值：因为每个微观元素的每个瞬时状态都有其毯结构（图 2a）（相关批判性讨论参见 [6]）。因此，多数 FEP 文献引入了 “事物性” 的附加原则：即 平稳性 [9]。也就是说，毯与对象必须是整个系统的真子集，且构成毯与对象的元素必须不随时间变化 [15]。这一假设排除了任意流体元素的可能性，因为物质可自由进出这类元素 —— 当物质穿过毯时，会从 “对象内部” 转变为 “对象外部”，因此对于构成流体的元素而言，毯并非平稳的。但这也排除了建模各类有趣系统的可能（或许是最有趣的系统）：即具有动态边界且存在物质更新的系统。

本文认为，这种 “边界平稳性” 表述对我们的研究目标而言，既过于严格，又不够严格。一方面，它过于严格：因为毯的平稳性会否定火焰、行波等现象作为 “对象” 的可能性 —— 这是由于行波传播时，构成介质的元素会随波的移动而变化。另一方面，它不够严格：因为它暗示 “任何任意连通的元素子集都是对象”。在上述火焰示例中，这意味着 “火焰燃烧所经的导火线任意片段，无论其温度分布、反应速率及动力学如何，都必须被视为‘事物’”。

这个例子明确说明：对 “对象” 或 “事物” 的更一般定义，应能容纳 “可移动或变化的毯”，且需纳入系统整体动力学的某些方面。此外，引入动态毯会导致 “给定系统中存在的毯数量” 急剧增加。显然，我们需要一个附加原则来筛选出 “真正值得称为‘事物’的毯”。由于目标是 “顺理成章地分割世界”，一个显而易见的选择是将奥卡姆剃刀原理应用于全局动力学。我们通过寻找 “具有动态马尔可夫毯结构的低维动力系统” 来实现这一原则，并采用贝叶斯建模方法落实奥卡姆剃刀。

3 动态马尔可夫毯检测算法

我们在此提出一种具有动态马尔可夫毯结构的概率生成模型（通用形式），通过对其进行反转，可识别马尔可夫毯，并根据毯子的统计特性和动力学将对象分类为不同类型。总体而言，马尔可夫毯检测是一个难题 —— 即便在静态场景中，该问题也属于 NP 难问题 [18, 48]。这是因为，即便毯子是稳态的，给定系统中马尔可夫毯的数量也会随系统组件数量呈组合式增长；而允许毯子动态变化只会让问题更复杂。

为解决这一问题，我们从宏观物理发现中汲取灵感 —— 这类研究专注于发现可概括高维系统的低维动力学。具体而言，我们提出一类降维算法，将高维动力系统划分为具有马尔可夫毯结构的子系统。实现方式是假设：低维潜在动力学具有马尔可夫毯结构，且原始高维观测空间中的每个元素仅由一个低维潜在变量驱动。例如，若假设存在单个对象，则需寻找三组状态变量：一组代表环境（s），另外两组分别概括属于边界的元素的集体行为（b）和边界内部元素的集体行为（z）。我们保留 “内部元素集可能为空” 的可能性。

为使模型能够识别具有非稳态毯子的对象，我们设计了足够的灵活性：将边界 ΣB (t) 直接建模为潜在分配变量。这通过实例化动态注意力机制实现 —— 该机制对每个微观元素或测量值进行概率性标记，标记结果表明该元素是内部元素、外部元素还是毯子元素。这些标记之间的转换遵循马尔可夫毯的常规规则，即禁止从 “内部” 到 “外部” 的直接转换，且标记转换概率仅依赖于宏观毯子变量。当存在多个对象时，我们允许每个对象都有一组边界宏观变量（bn）及其内部状态变量（zn）（n=1・・・N），同时共享一个环境变量 s。

观测数据记为，被视为对系统活动的较细粒度测量。每个观测指标 i 都对应一个离散的时变标记 ωi (t)∈{S, Bn, Zn}。这些标记用于识别每个对象的边界，并确定哪些宏观变量会影响相关的微观观测。具体而言，每个测量值的标记决定了如下条件独立关系：

对于 ωi (t) 为 S 或 Bn 的情况，也存在类似的等式。尽管该观测模型是以生成形式写出的，但它对应于从观测值到目标宏观变量的带噪声非线性投影，且受分配变量的调制。宏观变量的动态以及分配变量的转移概率均受限于马尔可夫毯结构，此外还有一个附加限制，即标签的转移概率仅依赖于边界变量。

这构成了这一类毯子发现算法的一般形式。为了将这种一般动态马尔可夫毯模型转化为更易于处理的形式，需要一些额外的简化假设。例如，非线性动态可以通过循环切换动态系统实现，并通过变分推断[29]发现，或者通过神经网络指定并通过梯度下降学习[34]。在这里，我们将假设简单的线性动态，并使用切换线性变换来实例化非线性观测模型。我们还将假设分配变量的转移概率先验独立于宏观潜在变量。
这导致了一个混合离散和连续潜在变量的因子隐马尔可夫模型（HMM），其独特之处在于每个观测节点 i 所关联的标签都有自己的离散 HMM。见图 4。

对于单个对象，这个线性模型表示为：

3.1 推断与学习
我们使用变分贝叶斯期望最大化（VBEM）来近似贝叶斯推断，其后验分布分解为参数和两类潜在变量，即

4 结果
我们呈现了简单的数值实验，以展示动态马尔可夫毯检测算法如何合理地标记牛顿摆、燃烧的引信、洛伦兹吸引子和人工生命模拟的组成部分。该模型的推理和学习是通过一个自定义的消息传递框架实现的，该框架专门设计用于利用条件共轭性和随机坐标上升法 [21]。动态马尔可夫毯检测算法及其所基于的 VBEM 推理模块的代码可在https://github.com/bayesianempirimancer/pyDMBD获取。所有模拟都在完整数据集上进行训练，学习率设置为 0.5，训练轮次为 50 次。此过程至少重复 10 次。所展示的结果来自实现了对数似然的最大期望下界（ELBO）的计算运行。

4.1 Newton’s cradle
牛顿摆的模拟由 5 个大小和形状相同的球组成，这些球悬挂在绳子上，球与球之间的距离等于任意一个球的直径。静止时，这些球靠在一起，刚好相互接触。当最左边的球被赋予一个远离其他 4 个球的初始位置时，它会向下摆动，在其静止位置停止运动，并将动量传递给其他球。这些球依次运动，并以类似方式将动量传递给最右边的球，最右边的球随后向上摆动并远离，之后返回，重复这一过程。如果最初有两个球受到扰动，那么另一边就会有两个球弹出，依此类推。我们模拟的牛顿摆中，初始时有 0 个、1 个、2 个或 3 个球受到相同的随机选定角度（介于 0 到 3π/2 之间）的扰动。所有球随后都会受到一个小角度差的随机扰动，标准差为 0.1 弧度。

将该算法应用于该数据集时，一种基于施加力的静态马尔可夫毯检测算法 [15] 会识别出一个单一物体，其以中间球为中心，而不考虑系统的动态变化，也不关注初始被移动的球的数量。相比之下，动态马尔可夫毯检测算法对球的标记方式与人类的直觉相符：即我们倾向于将牛顿摆的动态过程感知为要么是一个钟摆，要么是一对相互作用的球组，一组在左侧，一组在右侧。这两种常见的认知恰好与这种简单的 DMBD 算法最常识别出的两种分区相对应。具体而言，图 5 展示了这两种解决方案，其中颜色表示标签，绿色代表边界，红色和蓝色分别代表物体和环境。

如果初始时有两个或更多的球受到扰动，那么那些一起运动的球总会被赋予相同的标签。最常识别出的解决方案（图 5（a-c））将物体标记为运动的球，无论它们位于摆的哪一侧。在这种情况下，环境标签被分配给大致静止的球。边界由那些因碰撞而短暂获得高速度的球组成。因此，边界在大多数时候并不实际存在。

第二种最常识别出的分区将边界定位为静止的球，而将运动的球标记为物体和环境。摆一侧的球总会被标记为环境，而另一侧的球则被标记为物体（见图 5（d-f））。同样，当最左侧或最右侧的球大致静止时，它们就会成为边界的一部分。

4.2 燃烧的引信
为了证明该方法能够处理火焰和行波，我们对沿一维介质传播的燃烧前沿（即燃烧的引信）进行了建模。引信被模拟为一种非均匀介质，由离散的燃料颗粒组成，颗粒之间的距离是随机的，均值为 1，方差为 0.02。氧化剂被模拟为一种具有无穷尽来源的扩散过程，其方向与引信正交。它对燃烧的影响是决定热量释放速率。当颗粒达到临界温度时，会发生点火。假设引信的热扩散率恒定为 1。我们选择这个玩具模型是因为已知它能支持行波以平滑、周期性或混沌的方式传播，即使在燃料颗粒大小、位置和氧化剂可用性不存在随机扰动的情况下也是如此 [4]。在这里，可观测变量 yi t 包括燃料和氧化剂的浓度，以及引信上每个位置的温度。大致来说，在燃烧前沿前方，燃料和氧化剂充足；而在燃烧前沿后方，燃料耗尽但氧化剂仍然充足。在燃烧前沿内部，燃料迅速降至零，氧化剂先下降后回升至与其当前可用性对应的水平，同时释放热量（见图 8a）。

我们通过系统地改变作为位置函数的燃料可用性和作为时间函数的氧化剂可用性，模拟了多种燃烧波。这些参数的组合导致燃料颗粒燃烧时的热量释放速率产生变化。我们还在一个小范围内（0.4、0.5）调整了点火温度。这使得燃烧波以不同的平均速度传播，并伴随一系列周期性或随机性波动。有些燃烧波还会熄灭。图 8（b）展示了一个波速存在周期性波动的燃烧波示例。有趣的是，内部变量与物体位置的相关性很弱，似乎只表征热量释放 9。相比之下，与火焰位置相关性最强的是环境变量。为了完整起见，我们需要指出，虽然这里展示的结果是最常见的，但该算法有时也会收敛到不太合理的解。例如，物体有时对应于燃烧波后方的已燃烧部分，边界有时对应于热量释放的区域。不过，前面描述的那些解与最大的 ELBO 相关联，因此在贝叶斯模型比较中被强烈偏好。

4.3 洛伦兹吸引子洛伦兹吸引子也为该方法提供了一个独特的测试平台。在这种情况下，存在一个单一的三维观测值，即物体的 x、y、z 位置。该系统的混沌动力学特性支持两个低维（约 2 维）吸引子，以及在吸引流形之间切换的全局动力学行为。在这里，该算法发现了一种可称为 “相变” 的现象：当观测值靠近左侧吸引子时，将其标记为 “物体” 的一部分；当靠近右侧吸引子时，则标记为 “环境” 的一部分。边界标签合理地与轨迹中描述两个吸引子之间过渡的部分相关联。由于物体和环境具有对称性，我们可以将其解释为模拟了一种相变 —— 即单个物体在穿过相变边界后会改变其属性。

4.4 合成生物学模拟作为最后一个示例，我们使用粒子莱尼亚（Particle Lenia）模拟一个具有类细胞结构和行为的自组织系统。我们在模拟中采用了 “旋转体” 示例 [7]。单个粒子具有不同的距离依赖性吸引和排斥函数，这催生了有趣的自组织行为（如图 11 所示）：初始时随机分布的粒子群迅速形成类细胞结构，具有 “细胞核” 和简单的 “细胞膜”。一段时间后，细胞膜会形成类似鞭毛的旋转结构，细胞核则收缩为更小的形状。我们将该模拟用作多物体识别方案的测试平台，希望它能够识别出细胞的不同 “部分” 是同一环境中的不同物体。我们假设存在 11 种不同的物体，每种物体的毯变量和物体变量均具有二维动力学特性。每个物体通过毯潜变量和物体潜变量的单一角色与观测值相关联，以促进空间局部化物体的识别。在所示示例中，模拟识别出 5 种物体，分别对应：（1）无序状态（绿色）、（2）简单细胞膜（黄色）、（3）复杂细胞膜（橙色）、（4）无序细胞核（紫色）和（5）致密细胞核（蓝色）。这体现了该方法在将复杂系统分割为多个相互作用的动态子系统方面的潜在价值。

5 讨论
在本文中，我们将自由能原理（FEP）、贝叶斯力学、马尔可夫毯和本体势函数置于贝叶斯统计和信息论的更广泛思想体系中，探讨了其在杰恩斯主义与贝叶斯方法交叉领域中，对数学物理及更广义数学建模的应用。具体而言，我们的研究表明，若要运用 FEP 的逻辑和结构来建模复杂事物，就必须跳出 FEP 自身的逻辑框架，借助一个额外的原则 —— 从指数级数量的可能划分中挑选出最佳的马尔可夫毯划分。令人欣慰的是，这一原则与我们最初发展 FEP 时所基于的核心思想一致，即杰恩斯原理和惊喜最小化原理。这对我们而言并不意外，因为我们开发的动态马尔可夫毯检测算法本身就源于那些促成 FEP 发展的底层思想。

我们提出了一类模型及相关推理算法，将动态马尔可夫毯检测问题视为宏观物理发现问题。这类模型和算法从根本上基于对动态边界元素的识别，而这些边界元素能使整个系统的宏观描述更为简洁。这一过程的输出是一组特定于宏观物体类型的规则，这些规则支配着物体边界与其所处环境之间的相互作用（通过某些可能虚构的内部变量介导）。我们提出这一方法的依据是：马尔可夫毯的统计特性以一种与系统识别理论和强化学习一致的方式定义了物体类型；并且，当与杰恩斯的最大 caliber 原理相结合时，这一定义可通过能量函数、哈密顿量和拉格朗日量对相关物理系统进行常见描述。此外，这些数学工具的结合直接导出了基于本体势函数的物体表征，该函数与自由能泛函精确对应，因此，这相当于从信息论（最大 caliber 建模）出发对 FEP 进行了另一种推导，而非传统上从统计物理方程出发的推导方式。

就其本身而言，这种用于物体分类的信息论方法无法确定系统中众多动态毯中的哪一个应被标记为恰当的子系统。为解决这一模糊性，我们引入了另一个原则：简约性。也就是说，良好的标记应能对整个系统进行紧凑、低维的描述。这并非意味着被标记的物体具有某种形而上学的意义，而只是说良好的标记有助于预测、泛化和数据压缩。

为理解这一切在一般情况下如何应用，不妨以普通的质子为例。尽管质子由多种更基本的粒子组成，但将这一 “粒子群” 正确标记为 “质子” 会降低我们观测结果的熵 —— 至少因为质子具有正电荷、特定质量等属性，并且会表现出相应的行为；而随机选择的粒子可能具有不同的质量、电荷等，其行为也会相应不同。事实上，这正是给这一粒子群命名的原因：这个标签具有预测能力，即只要知道这个标签以及质子的可观测属性（位置、动量、自旋等），我们就可以预测该粒子与环境中其他事物的相互作用，而无需考虑其内部情况。

也就是说，良好的标记能全局最小化未来观测的条件熵（或惊喜）。从这个意义上讲，在数学物理建模中，标记扮演着可检验假设的解释性角色：一个好的假设能理解数据，即如果生成数据的过程可被标记为某种类型，那么在这一假设下，数据就变得不那么令人意外了。因此，标记是有用的，因为它们能让我们简洁地描述事物的动态或可观测行为，与不使用标记相比，在观测新数据或回顾过去数据时，能减少惊喜感。事物的动态取决于其属性，而标记是表示具有相似属性和行为的事物的有效方式。事实上，如果在给定标记的条件下，我们观测结果的熵并未降低，那么根据定义，标记与观测结果之间的互信息为零，因此，无论从实用角度还是信息论角度来看，这个标记都是无意义的。

有趣的是，条件熵恰恰是与自由能原理（FEP）联系最为紧密的 “惊喜” 目标。然而，在该领域的文献中，惊喜最小化的作用被视为一种同义反复，而非经验性的概念：其核心思想是 “事物会将惊喜最小化”，而非 “将某物标记为特定类型的物体能让我的惊喜感降低”。举一个具体的例子，还是以普通的质子来说。将一个粒子正确标记为 “质子” 会降低我们观测结果的熵，至少因为质子具有正电荷、特定质量等属性，并且会表现出相应的行为；而随机选择的一个粒子可能具有不同的质量、电荷等，其行为也会因此不同。事实上，这正是给它赋予 “质子” 这一标签的原因：该标签具有预测能力，即只要知道这个标签以及质子的可观测属性（如位置、动量、自旋等），我们就能预测该粒子与环境中其他事物的相互作用。从这一点来看，我们之所以费心将质子标记为一个 “事物”，是因为正确使用这一标签能减少不确定性 / 熵，并增强我们预测质子自身及整个系统行为的能力。也就是说，好的标签能从全局层面将惊喜最小化。这表明，惊喜最小化这一目标发挥着关键的经验性作用。

这与传统上对 FEP 的讨论方式有所不同。一个好的同义反复能为定义提供良好的起点。FEP 从物体的定义出发，将物体视为一组具有马尔可夫毯的状态集合，其内部状态和活性状态（或路径）会将惊喜（以马尔可夫毯状态或路径的自由能为特征）最小化，并由此推导出最小作用量原理及相应的贝叶斯力学。也就是说，FEP 领域的文献主要关注事物的必要属性，而非从经验上发现哪些状态集合可以合理地被标记为物体。相反，本文所描述的方法虽以基于马尔可夫毯的系统类型定义为起点，但采用了观察者或建模者的经验视角，旨在为观察者在建模系统动态时所做的决策提供依据，二者形成互补。

5.1 对 FEP 技术批评的回应
这项工作解决了基于 FEP 建模的一些核心技术批评和局限性，而这些问题迄今为止可以说仍悬而未决。3 基于马尔可夫毯的系统识别方法已被证明存在争议（例如，参见 [6, 35, 11, 5]）。一些人认为，基于马尔可夫毯对物体及物体类型的定义并不像其支持者所说的那样显而易见或微不足道 [35]。4 另一种批评观点认为，实际识别马尔可夫毯（无论是在数学层面还是在经验层面，针对现实世界数据）都依赖于非 trivial 的建模决策，因此，马尔可夫毯形式体系并不像声称的那样易于应用或具有普适性 [6]。还有一些人指出，FEP 近乎普适的适用性证明似乎与马尔可夫毯的假设形式以及非平衡稳态条件相矛盾，而这两者共同保证了有机体与环境之间或内部状态与外部状态之间的划分 [1, 5, 11, 30]。实际上，基于马尔可夫毯对宏观物体的定义已被批评为表述不当（因为许多有趣的系统类型似乎具有多个马尔可夫毯 [6]），或者不适用于与环境强耦合、高度可变或与环境交换物质的系统 [35, 11, 30]。显然，我们最感兴趣的系统是开放系统，它们与环境交换物质和能量，远离热力学平衡，通常具有可移动、动态的 —— 且可能不连续的 —— 边界。那些被认为是基于马尔可夫毯方法适用性反例的事物，最终被证明是具有可移动或漂移边界的事物，如火焰和有机体。这一问题尤其棘手，因为 FEP 最初是为了模拟大脑动态和生物行为而开发的，并且在这一应用中可能最为人熟知。

正如人们所期望的那样，这些批评引发了大量争论，同时也让人们明确认识到，为稳态系统制定的 FEP 仅适用于一类相当 “特殊” 的宏观物体，这类物体与环境的相互作用稀疏或微弱 [15, 1]。在此，我们认为，许多此类批评最终源于 FEP 文献先前对 “静态” 马尔可夫毯结构的关注。从数学角度来看，通过将 FEP 从基于状态的表述转变为基于路径或路径积分的表述 [43, 16]，一些反对意见得到了解决，这使我们无需对系统的稳态统计特性做出假设（详见 [36] 的讨论），也无需依赖整个系统稳态统计中近似的马尔可夫毯结构。在基于路径的 FEP 表述中，相关量及关联方程现在是针对系统的路径来定义的，也就是说，它们定义在构成结构化空间的物体或轨迹集合上，每个轨迹都代表系统可能随时间演化的一种特定方式。此外，对动态毯和最大 caliber 建模的考虑 [36, 42]，使我们能够在包含相变的复杂系统中识别出合理的物体和边界，并对具有瞬态和移动边界的物体进行建模。我们在此的贡献是提供一个数学框架和数值演示，明确表明此类动态物体可以在该框架内建模，从而从经验上解决文献中的这一争议。

5.2 生态位构建与环境在主动推理中的作用
在我们对燃烧引信的模拟中，环境扮演了一个出乎意料的角色：我们发现火焰的位置最好通过环境状态来追踪，而非燃烧网络的内部状态。我们在前文还提到，由于支配马尔可夫毯动态的方程在内部状态和外部状态方面具有对称性，因此毯编码了内部子系统和外部子系统的策略，由此得出结论：基于马尔可夫毯的物体类型定义始终具有环境特异性。这一结果与近期重新审视环境在主动推理中作用的研究，以及关于社会文化系统中主动推理的研究 [47] 高度契合。这类研究关注多尺度递归嵌套的动态结构，这种结构将个体主体、他们所构成的社会文化系统，以及通过行动塑造的生态位耦合在一起 [8, 39, 47, 32]。并没有先验理由表明，对于每一种任务和情境，我们的模型都必须以主体为中心。相反，我们可以将主体建模为更广泛环境中特殊的一部分 —— 对其他主体而言极具显著性；例如参见 [13]。这也与该传统中关于生态位构建的先前研究相关，这些研究强调，自由能原理所描述的物体间同步特性（即这种特性具有对称性）可被主体所利用。这类研究对生物栖息地中生态位的被动构建（习惯性的、非故意的）和主动构建（例如刻意设计）进行了建模，其结果是某些模式化行为被促成，而其他行为则被抑制 [8, 38]。

5.3 未来方向
我们所实现的这类马尔可夫毯检测算法中的特定版本，依赖于线性近似以及毯（标签）动态与宏观动态的解耦。这一选择造就了一种能够合理划分系统的算法，但它并不能可靠地用于预测。原因有二：（1）线性动态的假设会导致系统中任何非线性效应都被归因于噪声，从而实际上增强了扩散强度；（2）边界动态与宏观动态解耦的假设意味着，在缺乏观测数据的情况下，潜在分配变量会迅速扩散至均匀的稳态分布。我们计划在未来的工作中通过在切换线性动态系统模型的贝叶斯实例上施加马尔可夫毯结构来解决这些问题。这项工作还与通过降维对下行因果关系和涌现现象进行数学建模的研究 [2, 40] 相关，我们计划对这些关联展开探索。

原文链接：https://arxiv.org/pdf/2502.21217