Resilience and adaptability in self-evidencing systems

自证系统中的韧性和适应性

核心主题:该论文探讨的是基于"自证"(self-evidencing)原理的系统如何表现出韧性适应性

关键概念

  1. 自证系统

    (Self-evidencing systems):通常指遵循自由能原理(Free Energy Principle)的系统,通过最小化其内部生成模型预测与实际感官输入之间差异(即"证据"或自由能的上界)来维持自身状态。这涵盖了感知、行动和学习等过程。

  2. 韧性

    (Resilience):系统在面临扰动、干扰或内部/外部挑战时,能够维持其核心功能和结构的稳定性,抵抗崩溃或失衡的能力。

  3. 适应性

    (Adaptability):系统能够根据环境变化或内部状态调整其行为、结构或参数,以优化其生存或目标达成的能力。

重点

  • 机制探究 :分析自证机制(如主动推理 Active Inference)本身如何内在地赋予系统韧性和适应性。例如,通过感知推断、预测误差最小化和主动行动(干预环境)来应对不确定性。
  • 系统表现 :研究自证系统在面对各种类型扰动(如环境变化、模型参数扰动、噪声等)时,如何保持稳定(韧性)或调整策略(适应性)。
  • 理论框架 :可能利用自由能原理、贝叶斯推理、动态系统理论等工具,从理论层面解释韧性与适应性的来源。
  • 应用潜力 :这种理解可能对人工智能(设计更鲁棒的智能体)、神经科学(理解大脑功能)、复杂系统科学(理解自组织系统)等领域有重要启示,特别是关于系统如何在变化和挑战中维持生存和功能。

总体而言,该论文旨在从"自证"(或主动推理)的理论视角,深入理解复杂系统(如生物体、大脑、人工智能体)如何具备在动态、不确定环境中生存和繁衍所必需的韧性和适应性这两个关键特性。

打开网易新闻 查看精彩图片

摘要

本文将阐述在自由能原理下的韧性观点,反之亦然。自由能原理关乎存在与身份认同,而韧性是事物得以存在的条件。在以往工作中,这已被研究为使用自由能原理对韧性进行建模。我们将扩展该工作,论证自由能原理下的自组织就是关于韧性,其含义是:身份认同是一个自我重新配置的持续过程,这意味着存在一个自我模型以及重新配置该自我模型所需的能量——因此,也就是在变化中维持身份认同的韧性。将勾勒出在此情境下思考韧性的一般框架,并提供使用该框架的一些模型。

关键词:韧性,适应性,自组织,自由能原理

1 引言

本文主要关注在建模适应性系统时所涉及的身份认同(identity)与韧性(resilience)概念。自组织(self-organisation)隐含地以身份认同——即自我(the self)——来定义。然而,显而易见的是,自组织从来不是静态的,这里隐含的身份认同感必须在某种程度上是灵活的,或者至少能够适应环境的变化。例如,在耗散适应(dissipative adaptation)中,系统通过重构自身来吸收和耗散来自环境外部的能量来源而实现自组织[9,21,24,40]。这呼应了生成论(enactive)和自创生(autopoietic)理论:生命系统生产并维持自身[28],而有机体若要维持其自身及其环境的模型,必须生产出维持其生成模型(generative model)所需的东西[29]。Maturana-Varela 的自创生(autopoiesis)概念描述了系统如何持续再生其组成部分,但同时保持其身份认同完整——再次遇到了我们所强调的张力。本文旨在研究这种灵活性的适当描述可能是什么,以及如何对其进行建模,特别是,在动态环境中,韧性与变化的身份认同有何关联。我们将发展一个描述韧性的形式化初步构想,以及韧性在适应性系统中表现出来的一些简单模型。

适应通常通过(或可被建模为)一个推理过程来实现[15,37,39,47,51]。一个有趣的研究例子是人脑。现代理论神经科学断言,大脑维持一个内部自我模型,该模型作为其与世界进行预测性互动的一部分而被持续精炼。在预测性处理(predictive processing)中,智能体必须对其感觉输入的原因建模,以响应来自环境的扰动[12]。由于智能体自身的身体、特质和行动都牵涉到这些原因中,大脑编码一个“自我”模型以更好地预测传入的感觉[20]。特别地,Hohwy-Michael 提出,人们“通过一个分层的内源性(隐藏)原因的内部模型来感知和维持他们的自我”[20],其中像目标和特质这样的高层级原因生成预测,塑造感知和行动。由此可知,身份认同体现在大脑的生成模型中,并通过最大化模型证据和最小化预测误差来持续更新,这个过程可以称为自证(self-evidencing)。

如前所述,维持身份认同不仅需要变化,还需要核心特征的某种程度的稳定性,这构成了一个难题。为了进行自证,智能体会学习并不断调整其对世界和自身的生成模型,使用感觉证据来纠正差异。大脑消耗信息和能量资源,以保持其自我模型与现实的对齐——当出现不匹配(预测误差)时,修正信念或部署行动。这种持续更新是自我重新配置(self-reconfiguration)的计算本质。自我模型从来不是静态的,因为新经验需要被纳入。

解决这种张力的一种方法是将智能体视为在准确性(更新以适应数据)与精确性或先验信念的置信度之间取得平衡,正如主动推理(active inference)中所做的那样[14,33]。一些自我模型预测——例如根深蒂固的特质或价值观——是高精度先验,抵抗变化,提供身份认同的连续性。这种平衡在心理学中显而易见:人们寻求在面对不一致信息时保持连贯的自我概念(自我一致性或自我验证的动机),即使他们随着时间推移更新自我的其他方面[34]。例如,个体持续收集与自我相关的信息来构建内在的“自我理论”,根据社会和个人经验的反馈更新关于自身的信念。随着时间的推移,当更稳定的自我概念得到巩固时,人们开始更重视维持现有的自我信念,“以牺牲持续更新为代价”。

总体而言,这暗示“自我”不是一个静态的本质,而是一个工作模型,由它所定义的有机体持续再生。为了表征身份认同某些方面的可塑性以及另一些方面的刚性,我们将用韧性来框定它。身份认同(有机体的自我模型)通过持续的自我生产(self-production)和纠错(error-correction)得以维持——这些是韧性特征的相同过程。韧性通常指系统在不失去其核心功能或身份认同的情况下承受冲击或干扰的能力[18,33,42]。

韧性(resilience)一词具有多义性:它至少包含三个互补的方面[2,33]。它指代 (i) 惯性(inertia)——受到扰动时抵抗变化,(ii) 弹性(elasticity)——在偏离后反弹或恢复先前状态的能力,以及 (iii) 可塑性(plasticity)——在条件变化时灵活重组或寻找新稳定状态的能力。这三个方面描述的都是过程,而非静态特质。韧性不是一种简单的固定数量,即某人拥有一定量的韧性;而是某人随时间动态地所做之事

当考虑在每种情况下维持或恢复的是什么时,身份认同过程与韧性之间的联系变得明显。面对生活的扰动——无论是创伤、失落、疾病还是快速变化——通常受到挑战的是一个人的自我感和目标感。意识和认知灵活性区分了更具韧性的表型,使智能体能够预期和整合意外情况而不被压垮。一个有韧性的人设法抓住一个整合的自我概念(核心价值观、意义感、自尊)或重构一个新的自我概念,使他们能够继续运作和成长。这指向了自我的多重尺度,类似于具有不同程度可塑性——或变化速率——的俄罗斯套娃。

身份认同已以不同方式与韧性联系起来。这些概念在文献中具有渗透性,并带有一定的隐喻艺术许可。实证研究表明身份认同的某些特质与韧性结果之间有明确联系。例如,拥有更复杂身份认同的人——即那些将自己视为多个不同角色或属性的人——往往对压力和负面事件更具韧性[4,49]。如果自我的一个方面受到威胁,拥有多个方面的人可以从其他方面汲取力量并继续找到自我价值,防止自尊的全面崩溃。这种自我概念的灵活性,即身份认同的适应性重新配置,是一种保护因素。

同样,拥有一个连贯但可适应的叙事身份认同(一个赋予困难意义的人生故事)与韧性相关[17,25]。那些在创伤后能够“重述”自己生活的人,将逆境融入其身份认同中,作为幸存者或一个成长过的人,通常表现出更好的恢复,甚至创伤后成长[32]。相反,一个脆弱和僵硬的身份认同将导致个体无法从任何重大破坏中恢复。

最终,身份认同的连续性程度是至关重要的。Breakwell(2021)在身份认同过程理论中引入了身份认同韧性的概念,将其定义为“一种基于自尊、自我效能感、积极独特性和连续性的相对稳定的自我图式”,有助于应对威胁[3]。在这个意义上,韧性可以被视为对身份认同威胁的成功管理:在适应需要改变的方面的同时,维持核心身份认同的完整性。

打开网易新闻 查看精彩图片

鉴于上述情况,我们可以论证,身份认同形成和重新配置的过程本质上就是一个韧性过程。

在该背景下,韧性反应通过更新自我模型来纠正扰动或适应扰动。这对应于弹性和可塑性,其中韧性弹性是智能体在受到冲击后自然回归其特征状态(例如,吸引子)的能力,而韧性可塑性是拥有功能冗余或退化性——即,实现福祉的多种方式,或允许灵活重组。

同时,韧性-惯性对应于持有非常高精度的信念,以防止变化。在主动推理中,一个具有非常精确自我信念的智能体在抵抗影响的意义上可能显得“有韧性”(稳定的认同),但也可能接近于僵化。一个拥有更多退化解(许多可能的适应状态)的智能体可以在一种存在模式受到损害时探索替代方案。在心理学中,这种韧性自然地从生成性生态位(enactive niche)的概念中产生,即个体帮助塑造其周围的物理和社会环境[19]。一个智能体可能主动寻求支持性关系和稳定常规(塑造其生态位)以缓冲未来压力源,保护其身份认同和福祉。智能体推断世界状态并选择行动,使其保持在受调节的区域内,而这些行动同时有利地改变了环境。

韧性适应可以被视为身份认同的持续协商。个体或系统必须决定在面对扰动时要抓住什么以及要改变什么。维持功能完整性可能意味着保持某些核心自我方面(价值观、角色)不变(惯性),而适应性重组可能意味着转变其他方面(采用新身份、目标或信念系统)以适应新现实(可塑性)。

2 一个基本的数学形式化

我们可以将系统的身份认同配置或心理状态视为高维状态空间中的一个点。随着时间的推移,当系统经历典型的体验时,其状态描绘出一条轨迹——本质上是其平衡或习惯性行为。韧性与系统被推离这种通常轨迹时发生的情况有关。

某些自我配置可能是稳定的吸引子(吸引域),代表一个良好整合的身份认同或功能模式。扰动可能会将系统在域内轻推(从中它可以返回到吸引子,即恢复),或者,如果扰动足够强,可能会将系统击入一个不同的域(身份认同或功能的定性转变)。这类似于生态系统具有多个稳定状态;韧性是将生态系统推向替代状态的难度。

高精度信念创造深的吸引子(惯性),而可塑性则创造一个具有多个较小吸引子的更平坦的景观,允许向新状态移动。我们将首先关注高精度情况。

2.1 惯性

我们将首先假设我们有一个(一致利普希茨连续的)时变向量场 V 和一个满足以下条件的随机变量:

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

现在我们有理由声称,模态路径(modal path)编码了关于环境的变分推理(variational inference):它是拉格朗日量(Lagrangian)被最小化的状态,因此,也是变分自由能(variational free energy)被最小化的外部状态后验分布的参数。

从概念上讲,这是一个同义反复(tautology)。自由能原理(Free Energy Principle)是一个陈述:如果一个系统处于一个吸引子上,那么它看起来就像是在最小化一个变分自由能,并且吸引子上的动力学(以及围绕它的波动)可以使用近似贝叶斯推理所诱导的任何动力系统(被视为运动定律)来建模[43, §2]。这一陈述具有方向性(a direction)是至关重要的:我们从一开始就假设它是一个‘事物’。一旦我们有了一个‘事物’,FEP 就是一种高度通用的建模‘事物’并描述它们为何是‘事物’(特别是,为何是它们所是的那种事物)的方法。

现在我们将此与我们的论点联系起来。根据 (2),我们有惊异度(surprisal)或速率函数(rate function):

打开网易新闻 查看精彩图片

最小化变分自由能也通过 (3) 最小化这个量。因此,它增加了精度(precision)。

我们看到,随着关于环境的信念成为对环境状态分布的更好近似,高精度的自我信念被赋予了系统,使其能够在状态空间中保持接近其特征轨迹(characteristic trajectories)。从另一个方向看,拥有高精度的自我信念要求一个准确的世界模型:如果变分自由能不能被最小化,那么惊异度(surprisal)也不能被最小化,系统将偏离其特征轨迹。

这在最大熵原理(principle of maximum entropy)[45] 下具有双重观点(dual viewpoint)。一个约束对系统的不同状态施加了可接受性不可接受性。它可能意味着一个目标形态(target morphology)的存在,或者某种由功能驱动的所需形式——我们可以称之为表型(phenotype)的东西。这最终与我们所称的身份认同(identity)[26] 相一致。

2.2 可塑性

前一节假设系统能够形成一个足够好的环境模型以最小化 DKL。回想一下,如果变分自由能不能被最小化,那么惊异度也不能被最小化,系统将偏离其特征轨迹。因此,它必须指定新的轨迹为可接受的——其身份认同必须是可塑的(plastic)。可塑性(plasticity)的概念被引入以描述能够生长并改变其特征轨迹的系统。

我们现在将逐状态地工作。让我们做出拉普拉斯假设(Laplace assumption),使得对环境状态的每一个可能后验分布都存在一个唯一相关的(模态方差)对。假设环境的统计特性发生变化。从 (3) 可知,系统必须选择一个新的模态(mode)。系统有可能调整环境的统计特性,以使相应的内部模态更接近一个偏好,但并不总是可能完全满足那些偏好。

改变模态 回想一下,模态实际上是在给定毯态(blanket state)下的条件期望模态。实际上,存在一整套模态,每一个都是联合状态空间上速率函数的局部最小值,提供其自身的相位。换言之,这些模态提供了不同的吸引子或亚稳态(metastable states)。当扰动的幅度太大时,它可能会将系统从一个吸引子上踢开,系统可能会被另一个吸引子的势阱(well)捕获。一个或另一个模态是否可接受,取决于环境的统计特性,因此我们在不同的环境参数制度下有不同的表型,模态的选择由某个控制参数决定——在这里是毯态(blanket state)。如果我们有智能体与其毯态的双向耦合,例如 dμₜ = V(μₜ, bₜ, t) dt + Γ dWₜ,那么内部状态的模态也通过 σ 成为外部状态的函数,并沿着在这些亚稳态之间移动的轨迹演化。(注意,内部状态无法直接看到外部状态,环境对智能体的任何影响都是由(blanket)介导的。)

我们所设想情况的一个物理例子是相变(phase transition)。在相变中,同一个哈密顿量表征一种材料,但典型的动力学非常不同,取决于某个控制参数的值,并且不同相之间存在尖锐的不连续性。其一个简单模型是耦合到热库(heat reservoir)的晶格 Λ 上的伊辛模型(Ising model)。存在一个内部状态——自旋构型 s₁s₂s₃...s|Λ| ——一个外部状态——环境中库的状态——以及一个(blanket)——材料与环境之间的物理界面,以及系统与正在发生的任何环境动力学之间的具有温度 T 的热浴。重要的是,热浴与材料接触,但将环境遮蔽起来,起到马尔可夫毯(Markov blanket)的作用。

假设存在某种未知但非递减的传递函数,将环境与热浴关联起来。随着环境温度的升高,热浴的温度也升高。现在系统的模态(其期望的内部状态)取决于 T。模态是著名的磁化函数m(T)。模态在以下意义上编码了一个后验:如果热浴很热,那么环境很可能不包含任何热汇(heat sinks),并且可能包含热源,或者至少与热浴处于平衡状态。

虽然超出了本文的范围,但值得注意的是,大偏差(large deviations)与亚稳性和相变相互作用,遵循 [36] 中阐述的一般原理。

自由能曲率 我们还想对身份认同建模更连续的变化,而不依赖于控制参数的尖锐不连续性。如果毯态是恒定的或缓慢变化的,探索不同吸引子并引入局部最小值的另一条途径是降低自由能泛函的曲率。通过泰勒展开论证,自由能的曲率——参数中 KL 散度的二阶导数矩阵——是费舍尔信息(Fisher information)。

这可以解释为:当自由能在某个方向上的曲率很高时,系统会发现这些方向信息量更大,并沿这些方向移动。也就是说,费舍尔信息度量了每个参数在区分邻近分布方面携带多少信息。这在精确意义上是惯性韧性(inertial resilience)的反面:在拉普拉斯假设下,费舍尔信息与精度(precision)成正比(参见例如 [16] 以获得更长的讨论),因此更高的精度意味着更深的曲率,从而产生更强的吸引子。确实,对于高斯分布,分布方差小的方向——精度矩阵的大特征值方向——为参数估计提供更多信息,而方差大的方向——精度矩阵的小特征值方向——提供更少信息。通过压平自由能景观,系统无法从参数中获得强烈的(强曲率对应的)信息,因此对于使用何种变分后验没有强烈的偏好,能够进行探索,而不是被困在深的全局最小值中。

我们声称,当自由能景观更平坦时,适应性系统会找到更有效的自组织方式。为证明这一点,请注意耗散的热量是(参见 [38,47] 以获得扩展推导):

打开网易新闻 查看精彩图片

其中 Δ 是未混合的二阶偏导数之和,或者换句话说,是海森矩阵(Hessian matrix)的(trace)。

如果 μ 的每一个变化都代表一个新的可能参数,那么 ΔF(μ, b) 项就是费舍尔信息(Fisher information)。由于方阵的迹是其特征值之和,耗散的热量与负精度(negative precision)成正比。由此可得,低精度高精度耗散更多的热量,这表明当曲率较小时,自组织可以变得更加能量效率(energetically-efficient)。

3 复杂适应过程的模型

回顾一下,到目前为止,已经探讨了两种不同的韧性(resilience)概念。在 [33] 中,这些现象被区分为惯性(inertia)和可塑性(plasticity)——分别指抵抗变化的能力和响应变化的能力。在前一小节中,我们讨论了损伤阈值(threshold for damage)如何区分这些韧性形式,即在配置变化的连续性与不连续性意义上。在主动推理(active inference)中,存在某种东西使石头坚硬坚韧,也存在某种东西使人脆弱灵活。本节的任务就是找到这种东西。

一个猜想是,这个阈值是复杂系统分布式分层(hierarchical)性质的涌现效应(emergent effect)。人类可以将损伤模块化(modularise)并分散到许多较低层级的过程(lower level processes)中,以保护像意识这样的较高层级过程(higher-level process)。其身份认同并未存储在单一分辨率层级的配置中。例如,人类从许多不同的毛细血管或动脉流血,而不是仅从一个心脏流血。与此形成对比的是,一个细胞没有这样的“高速公路”(highways),一旦被刺穿就会立即死亡;或者一只蜜蜂,它根本没有血管,而是通过扩散(diffusion)将含氧血液输送到其身体各处。(注意,这隐含地假设分层(hierarchy)意味着模块化(modularity)。)[44] 中提出了类似的论点,并在 [33] 中使用。

为此,我们将讨论一个分层自由能最小化(hierarchical free-energy minimising)系统。

考虑一个系统,其包含一套 m 个内部状态 μ := {μ₁, ..., μₘ},k 个行动状态(active states)和 p 个感官状态(sensory states){a₁, ..., aₖ, s₁, ..., sₚ}(总计 k + p 个状态(blanket states)),该系统处于一个具有 n ≪ m 个状态 η := {η₁, ..., ηₙ} 的环境中。每个状态将由一个随时间演化的随机变量给出。

在一般条件下,存在一个从给定 a, s 下 μ 的条件期望轨迹(conditionally expected trajectory)到 η 的轨迹的映射,

打开网易新闻 查看精彩图片

在我们的情况下,参数化(parametrisation)存在冗余(redundancy):每个 中的某些信息部分映射到每个 上。这种冗余的一个例子是人脑,其中存在远多于环境特征的感觉神经元

类似地,假设内部状态被分组成 v 个(clusters),记为 C := {C₁, ..., Cᵥ},其中每一个簇都有一个由簇内最可能状态给出的模态(mode)。假设该簇的模态也对环境状态的某个自由能泛函(free energy functional)进行参数化。这可能针对环境的粗粒化(coarse-grained)特征,或者可能只是同一特征的重复表征簇。我们将这些外部状态记为 ̃η。我们也将假设在感兴趣的毯态(blanket states)中也存在相应的可能差异。

令 h 个状态簇 C 的经验均值(empirical mean)为:

打开网易新闻 查看精彩图片

h 个独立同分布(iid)的正态分布随机变量的样本均值偏离 E[C] 超过 ε 的概率可以估计为:

打开网易新闻 查看精彩图片

这意味着,随着 h 增大,Ĉ 指数级地更有可能越来越接近 E[C]。从概念上讲,随着簇中状态数量越来越多,丢失一个状态对簇平均值与最优参数之间距离的影响就越小。也就是说:如果某些状态丢失了,但仍有足够多的状态存在,那么该簇的模态不会发生显著变化。因此,高层级过程得以保持完整。

尽管这是一个合理的初步想法,但一个更复杂的论证会利用亚稳性(metastability)与多尺度大偏差估计(multiscale large deviations estimates)[8,27] 之间的关系来扩展这一框架。我们将此留待未来工作。

4 结语与心理学讨论

我们希望本文勾勒的框架不仅能为建模物理学中的适应性系统提供更有效的方法,也能为建模人脑和情绪提供更有效的方法。与本文的讨论一样,经典和当代心理学将身份认同(identity)框定为一个持续的、适应性的过程,而非一个固定实体。符号互动论理论(例如 Mead 和 Cooley 的自我概念)强调身份认同是通过社会反馈和迭代的自我反思(self-reflection)形成的[5,31]。

一个引人注目的形式化来自社会学中的身份控制理论(identity control theory),该理论将每个身份认同(例如角色或群体身份认同)建模为一个稳态反馈循环(homeostatic feedback loop)[7,23,48]。一个身份认同包含一个心理标准(mental standard)(例如“好父母”或“自豪的学生”的含义和期望),个体持续地将他们感知到的行为或反馈(输入)与此内部标准(比较器)[41,50]进行比较,这最终是一种社会测量(sociometry)[1]。

如果检测到差异(error)——例如,他人的反应表明个体未达到身份认同标准——个体将调整其行为或身份认同认知以减少误差。实际上,每个身份认同都充当一个控制系统(control system)。它旨在通过使内部和外部感知与其身份认同标准的含义一致(congruent)来控制这些感知。通过这种方式,任何误差都被最小化。身份认同在情况变化时实时地被实施和调整。个体的自我模型(their identity standard and current self-perception)因此被迭代地修订以更好地匹配经验,或者相反,他们作用于世界以使经验匹配其身份认同[35,52]。

身份认同可以在更长的时间尺度上通过诸如发展危机(developmental crises)或叙事重构(narrative reframing)等过程进行重组[6,22]。Erikson 经典的身份认同形成阶段和现代的叙事身份认同(narrative identity)概念都将身份认同视为一个演进的故事,持续编辑以理解人生的新篇章[11,30]。

例如,Epstein 的认知-经验自我理论(cognitive-experiential self theory)提出,人们逐渐从生活经验中构建一个自我图式(self-schema),该图式作为关于他们是谁的工作理论(working theory)[10]。

在生命的早期,这个图式具有高度的可塑性——年轻人会迅速地根据新的反馈更新他们的自我概念——但随着它稳定下来,他们越来越努力地维持连贯性,有时通过过滤或重新解释不一致的信息,而不是改变自我[34]。因此,一个健康的身份认同(healthy identity)涉及变化一致性,类似于一艘船在变化的海洋中调整航向,同时保持稳定的方向。这种动态性由认知能力(记忆、反思)和信息资源(来自关系、文化的反馈)所促进,这些能力使个体能够在需要时修订他们的自我叙事(self-narrative)。它也具有一个能量方面(energetic aspect):适应一个人的身份认同——例如,在文化适应或个人转变期间——可能是费力的并带来情感上的负担,这表明身份认同的韧性可能取决于拥有足够的情感和认知能量(emotional and cognitive energy)来适应变化。

所有这些观察都表明了韧性自由能原理中的一席之地——更关键的是,这提供了一种对自由能原理的解读,其中韧性是一个支撑自组装(self-assembly)和自组织(self-organisation)的关键概念。

原文链接:https://arxiv.org/pdf/2506.06897