打开网易新闻 查看精彩图片

导语

生命系统为何能在多变环境中保持稳定又不失灵活?本文从信息论与因果动力学的视角出发,将生命与人工系统统一为“系统—环境耦合”的信息处理过程。北师大系统科学学院杨明哲等人于2025年9月在《Digital Technologies Research and Applications》发表论文《Quantifying System-Environment Synergistic Information by Effective Information Decomposition》,提出基于有效信息分解的全新指标——活性(flexibility),用于定量刻画系统在不同环境下灵活调整自身动力学的能力。研究进一步在元胞自动机、基因调控网络与人工布尔网络中验证:真正具备适应性的系统,往往依赖系统与环境之间的协同信息,并工作在“混沌边缘”的动力学区域。

为系统梳理因果涌现领域的最新进展,北京师范大学系统科学学院教授、集智俱乐部创始人张江老师领衔发起,组织对该主题感兴趣的研究者与探索者共同研读前沿文献、交流研究思路。读书会将于2026年2月22日起每周日上午(创建读书会暂定时间为10:00-22:00)线上开展,持续约10周,包含主讲分享与讨论交流,并提供会后视频回放,诚邀相关领域研究者及跨学科兴趣者参与。

关键词:信息论、复杂系统、系统—环境耦合、有效信息、协同信息、元胞自动机

杨明哲丨作者

张江丨审校

打开网易新闻 查看精彩图片

论文题目:Quantifying System‑Environment Synergistic Information by Effective Information Decomposition 论文链接:https://ojs.ukscip.com/index.php/dtra/article/view/1492 发表时间:2025年9月29日 论文来源:Digital Technologies Research and Applications

作者简介:

生命一直是这个世界中很令人感到惊奇的系统。我们可以看到,各种生物为了适应环境演化出非常多样的策略和手段。刺猬发展出了带有外刺的物理保护,变色龙则有自己的拟态保护色。这样的属性,我们也希望人工系统能够具备。比如无人驾驶的汽车或机器人能根据环境的变化灵活切换自己的运动模式。如果能做到这一点,我们便认为这样的系统好像活了一般,是一个可以自发趋利避害的“生命体”。事实上,无论是先进的人工系统,还是我们在茫茫宇宙中试图发现的地外生命,都很可能不再是有机大分子构成的系统,却同时拥有生命才有的外在特征,此时我们要如何度量系统适应环境的能力?

对此,信息论是一个不错的工具。任何一个生命作为系统,其内部单元之间,以及环境与系统单元之间,都会有信息传递的过程。而信道容量的大小,也与系统能够采取的动力学模式或策略有着直接的关系,如下图所示[1,2]。其中横轴表示互信息大小,纵轴表示系统的表现或策略。可以看出,互信息越大,系统的能力也就越强。互信息可以看作是系统能力表现的上界。这种描述方式可以绕过复杂的生物学细节,直接刻画一个系统属性或能力的表现。这使得学者们越来越青睐于使用信息论的视角来刻画与研究生命系统[1,2]。

打开网易新闻 查看精彩图片

圣塔菲研究所所长、进化生物学家David Krakauer曾提出过个体信息论(The information theory of individuality)来研究一个系统在多大程度上可以被看作是一个生命个体,即个体性(individuality)。他先在一个马尔可夫过程上描述系统自身的变量(Xt)与环境变量(Et),如下图所示,图中空心圆和实心圆分别表示各个变量的不同状态,随着时间它们会因为彼此交互的动力学而产生变化。这样,我们便可以在一个动力学过程中量化系统自身的信息传递,以及环境对系统的信息传递。通过组合这些信息量,Krakauer定义出来了一系列的个体性,比如针对大型生物的有机个体性和针对细菌菌群的群落个体性等等。

打开网易新闻 查看精彩图片

这看起来是一个很简便的计算,但它没有直接揭示生命系统的动力学性质。其实,生命主体与环境的交互过程可以分为不同的动力学来看待,而许多生命主体在不同的时空坐标上都能维持稳定的生命特征,更多应当归因于动力学性质,而不是初始条件。

我们可以用一个动力学刻画环境对系统的驱动或影响,决定的是环境对系统的输入信息,另一个动力学则刻画系统内在的调整和变化,决定的是其自身传递的信息。还有第三个动力学,则是系统和环境耦合在一起对系统影响的动力学。在信息分解上,系统与环境耦合变量对系统未来状态的影响没办法拆成前两个动力学的简单加和,因为会多出来一部分是系统与环境对系统未来状态产生的协同信息,这也正是个体信息论中没办法分离出来计算的信息。

一般的物理过程,包括生命的变化,都可以看作是一个马尔可夫过程,所以我们可以用马尔可夫概率转移矩阵(Transition Probability Matrix,TPM)来描述诸多动力学过程。为了让信息指标直接刻画动力学本身的性质,我们借鉴整合信息论与因果涌现理论[4],把原本的分析对象联合互信息变成有效信息(Effective information,EI)。EI的计算公式如下所示,其中P表示TPM,X和Y分别对应转移矩阵的输入和输出,do(X~U)表示将输入干预为均匀分布。

这里干预操作的好处在于去除了初始条件的影响,从而使其只反映动力学性质的区别。接下来,我们对整体的EI做分解,便可以定义出活性(flexibility),即系统与环境耦合时,灵活响应环境能力的大小。

如下图所示,左图是空间上的因果图,右图是在时间上展开的因果图。对应的是系统与环境变量对系统影响的概率转移矩阵,分别是系统自身和环境单独对系统影响的概率转移矩阵。表示个体驱动信息,表示外部驱动信息。便是我们定义的活性,事实上,我们可以证明它是非负的并且刻画的恰好是系统与环境耦合后对系统自身传递的协同信息。该工作便是集智科学研究中心2025年9月发表在《Digital Technologies Research and Applications》上的《Quantifying System‐Environment Synergistic Information by Effective Information Decomposition》[5]。

打开网易新闻 查看精彩图片

为什么这里算出来的就是系统的活性?实际上,我们可以在数学上把该指标拆成两部分,即扩展性和内向性:

打开网易新闻 查看精彩图片

其中|ΩX|表示变量X状态的数量,H(.)表示计算某概率分布的香农熵,Px,e表示整体的TPM对应系统变量和环境变量分别取值为x,e时对应的条件概率分布。

在实验中,扩展性高往往意味着系统动力学在不同环境下有很大的差异,而内向性高则对应着系统不管在什么样的环境下,传递自身的信息总是很高,也就是噪音低。所以综合来说,所谓活性高的系统,便是在不同环境下动力学都尽可能存在差异,而且每个动力学都表现出低噪声。这里涉及的术语较多,下面表格给出了各个概念的物理解释或对应的例子。

术语摘要

术语

动力学描述

物理解释或示例

活性 (Flexibility)

TPM(转移概率矩阵)在不同环境间存在差异,并表现出低噪声。

灵活适应多种环境并总保持信道容量最大化。

扩展性 (Expansiveness)

TPM 在不同环境间存在差异。

水蚤在不同环境中切换繁殖模式。

内向性 (Introversion)

TPM 表现出低噪声。

刺猬的刺壳为抵御大多数威胁提供了物理保护。

个体驱动信息 (Individual Driving Information)

系统的状态仅取决于其上一时间步的状态。

大多数无机物质保持稳定的结构和状态。

外部驱动信息 (External Driving Information)

系统的状态仅取决于环境在上一时间步的状态。

大多数蛋白质在高温环境中会失去活性。

定量框架有了,我们要如何在实验上验证这些指标与真实物理含义的联系呢?早在上个世纪八九十年代,一批圣塔菲研究所的科学家就为我们搭出了实验场,让我们可以在计算机上就验证生命系统的性质,那便是人工生命。简单的局部规则(周围两个邻居加自身状态便决定中间邻居下一时刻的状态),就能让元胞自动机展现出纷繁复杂的宏观现象。Langton和Wolfram等人的研究 [6],让我们发现复杂类型的元胞自动机拥有最大信息处理能力,能够完成各种外界任务,就像真实的生命系统一样。这样的元胞自动机在动力学上正处于混沌边缘的地带。下图展示了4种初等元胞自动机,分别是固定型(左上)、周期型(右上)、混沌型(左下)以及复杂型(右下)。

打开网易新闻 查看精彩图片

圣塔菲研究所学者Melanie Mitchell发现 [7],对于一维二值的初等元胞自动机,Langton参数为0.5左右的元胞自动机具有最佳的任务表现。这里的Langton参数刻画的是规则表中下一时刻细胞平均存活的比例。通过对所有256个初等元胞自动机的活性的计算,如下图所示,我们发现活性与Wolfram的4种类型分类的复杂度呈正相关(a),而且就在Langton参数为0.5左右活性指标最高(b)。相比于传统的互信息对混沌边缘的识别,活性指标具有更小的方差(c)。而且,如(d)所示,活性指标与规则表种类一一对应,即它只依赖于动力学,而不依赖于初始条件。

打开网易新闻 查看精彩图片

与元胞自动机相类似,考夫曼等人 [6]也开发了随机布尔网络来模拟真实的基因调控网络。顾名思义,它是指每个节点可以取布尔的二值,分别对应基因表达的沉默和激活。而“随机”是指节点构成的网络可以是一个随机网络。这正是个体信息论中Krakauer所进行实验的对象。在新工作中,我们在真实的基因调控网络的数据上计算活性指标。数据[8]横跨单细胞生物、动物、植物等多个物种的不同的功能基因调控网络。我们把3个节点或4个节点的网络模块分别看成是系统,而能够影响该模块的其他基因看成环境。实验发现,平均来说,循环反馈回路活性最高(a),哪怕是在4节点的模块中它也是活性较高的类型(b)。这样的构造在生物学中往往与生物周期节律、动力学补偿等现象相关。图(c、d)则对比展示了活性高的模块和活性低的模块在面对不同环境切换的冲击下的状态演化的区别。可以看出,活性较高的系统具有更多稳态的可能性。

打开网易新闻 查看精彩图片

接下来我们拿一个人造的布尔网络来举例。其结构如下图所示,其中有两个参数,一个参数w控制系统ABC内部作用与两个环境变量对系统影响的比例,另一个参数温度T则对应整体动力学噪音的强度,T越大代表噪音越大。下图中的热图(a)展现了活性指标随两个参数的变化。当内部作用与外部影响相当时,活性指标基本上最高;同时噪音越低,活性越高,这也符合直觉。而有意思的是,活性与噪音大小并不总是负相关的关系。有时候,如果噪音的增加会使得系统在不同环境下的动力学有了更多的多样性,那么此时噪音的增加对于活性来说反倒是件“好事”。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

前面的实验建立在动力学已知的情况下,如果我们只有数据,能否用机器学习学习到动力学之后再应用活性指标?上图(b)中虚线便展示了对于机器学习动力学的活性指标变化,可以看出与真实值相近,可见指标计算对拟合的误差不敏感。此时能看到随温度T增加,活性有一个峰值,这其实就代表了适当的噪音(动力学内在的噪音)可以增强系统适应环境的能力。在生物学中,噪音对于诱导生物体构成产生生物钟节律的振荡至关重要。

最后我们总结一下该研究所涉及的领域和脉络。可以从问题和方法两个角度出发:在问题上,我们早已对生命系统独有的动力学特征有深入的研究,包括自组织理论、人工生命等等。而当我们想要对各种形式的系统都能度量生命系统适应环境的能力时,便需要信息论来作为工具。我们不只要借用熵、互信息等基本的信息论概念,还要在因果机制的层面上,关注多元变量间的信息传递和分解。可以说,活性指标的提出,离不开诸多经典理论的指导。而在未来,这种独特的研究方式必将在人工生命、地外生命等研究领域里大放异彩。

打开网易新闻 查看精彩图片

参考文献

[1] Bartlett, S., Eckford, A. W., Egbert, M., Lingam, M., Kolchinsky, A., Frank, A., & Ghoshal, G. (2025). The Physics of Life: Exploring Information as a Distinctive Feature of Living Systems (arXiv:2501.08683). arXiv.

[2] Tkacˇik, G., & Bialek, W. (2016). Information Processing in Living Systems.

[3] D. Krakauer, N. Bertschinger, E. Olbrich, J. C. Flack, and N. Ay, The information theory of individuality, Theory in Biosciences 139, 209 (2020).

[4] Yuan, B., Zhang, J., Lyu, A., Wu, J., Wang, Z., Yang, M., Liu, K., Mou, M., & Cui, P. (2024). Emergence and Causality in Complex Systems: A Survey of Causal Emergence and Related Quantitative Studies. Entropy, 26(2), 108. https://doi.org/10.3390/e26020108

[5] Yang, M., Pan, L., & Zhang, J. (2025). Quantifying System‑Environment Synergistic Information by Effective Information Decomposition. Digital Technologies Research and Applications, 4(3), 22–34. https://doi.org/10.54963/dtra.v4i3.1492

[6] Langton, C. G. (1990). Computation at the edge of chaos: Phase transitions and emergent computation. Physica D: Nonlinear Phenomena, 42(1–3), 12–37.

[7] Mitchell, M., Crutchfield, J. P., & Das, R. (1997). Evolving cellular automata to perform computations. In T. Bck, D. B. Fogel, & Z. Michalewicz (Eds.), Handbook of Evolutionary Computation. IOP Publishing Ltd.

[8] Kadelka, C., Butrie, T.-M., Hilton, E., Kinseth, J., Schmidt, A., & Serdarevic, H. (2024). A meta-analysis of Boolean network models reveals design principles of gene regulatory networks. Science Advances, 10(2), eadj0822. https://doi.org/10.1126/sciadv.adj0822

因果涌现第七季——从理论到应用


在神经系统中意识的生成、城市交通的拥堵演化、全球产业系统的协同与失稳之中,始终潜藏着一条贯穿微观与宏观的因果脉络:个体行为本身或许简单,却能在尺度跃迁中孕育出高度组织化、难以还原的整体结构。复杂现象并非微观规则的线性叠加,而是源于多尺度动力学作用下逐步形成的因果组织。正是在这一背景下,因果涌现理论被提出,并在因果涌现 2.0、工程化涌现以及多尺度因果抽象等工作中推进,逐渐发展出一套融合动力学分析、信息论度量以及谱方法与人工智能工具的研究框架,从而将研究重心从“复杂性本身”转向“因果结构如何出现、如何被度量并在现实系统中发挥作用”。


为系统梳理因果涌现领域的最新进展,北京师范大学系统科学学院教授、集智俱乐部创始人张江老师领衔发起,组织对该主题感兴趣的研究者与探索者共同研读前沿文献、交流研究思路。读书会将于2026年2月22日起每周日上午(创建读书会暂定时间为10:00-22:00)线上开展,持续约10周,包含主讲分享与讨论交流,并提供会后视频回放,诚邀相关领域研究者及跨学科兴趣者参与。


打开网易新闻 查看精彩图片


详情请见:

1.

2.

3.

4.

5.

6.

7.