打开网易新闻 查看精彩图片

导语

研究者们对由多个相互作用部分构成的复杂系统的理解和控制能力仍然有限。一个核心挑战在于,研究者们尚未明确如何才能最佳地描述并量化那些体现系统复杂性特征的多对多动态交互。为解决这一局限,本文提出了 “整合信息分解”(Integrated Information Decomposition,简称 ΦID)这一数学框架。ΦID 为拆解并描述复杂多变量系统的信息动力学提供了全面的分析工具。在理论层面,ΦID 揭示了此前未被研究的集体信息流模式;通过将信息传递、信息存储及动态复杂性等已知度量表述为这些模式的聚合体,ΦID 不仅提供了新的分析手段,还克服了这些度量在理论上的部分已知缺陷。在实证层面,本文通过计算模型以及来自 1000 多个生物、社会、物理及人工动态系统的实例,验证了理论结果的有效性。综上,ΦID 深化了研究者们对跨学科领域中广泛使用的复杂系统表征度量之行为模式的理解,并为动态复杂性研究提供了更精细的新型分析方法。

关键词:信息论,复杂性,动力系统,整合信息

郑鸿盛丨作者

赵思怡丨审校

打开网易新闻 查看精彩图片

论文题目: Toward a unified taxonomy of information dynamics via Integrated Information Decomposition 发表时间:2025年9月22日 论文地址:https://doi.org/10.1073/pnas.2423297122 发表期刊:PNAS

理解复杂系统的难题

从大脑神经网络、全球气候系统,到金融市场和社交网络,现代科学研究中最具吸引力的现象往往源自复杂系统。此类系统由大量相互作用的单元构成,单元层级遵循的规则虽然简单,但其整体却可能的涌现出截然不同的宏观行为。如何以严谨、可解释且可比较的方式刻画这种“整体复杂性”,一直是该领域长期未解的核心问题。

过去的研究尝试以单一的“标量指标”对复杂系统进行定量描述。例如:

  • 整合信息(Φ):用于评估系统整体动态是否超越个体成分的简单叠加;

  • 因果密度(Causal Density):用于度量系统内部因果交互的整体强度。

尽管这些指标具有明确的理论动机,但在实际应用中常面临诸多限制:不同系统或数据条件下得到的数值往往难以比较,解释一致性不足,甚至可能出现“负整合”这样的反常结果,使其作为通用复杂性度量的可靠性受到质疑。

与此同时,信息论的另一研究路径——转移熵(Transfer Entropy, TE)活跃信息存储(Active Information Storage, AIS)——能够有效描述信息在系统中的输入、输出与来源,但仍无法回答更本质的问题: 信息在系统内部究竟以怎样的结构被组织、以何种机制在不同单元间传播?换言之,现有方法能够刻画“信息流的大小”,却难以刻画“信息动力的形态与构成”。正是在此背景下,ΦID 框架被提出,旨在为复杂系统中的信息加工与因果结构提供更系统、更统一的理论描述。

从部分信息分解到整合信息分解

PID:信息分解研究的基础框架

在信息论的发展过程中,部分信息分解(Partial Information Decomposition, PID)曾是一个重要的概念性突破。该框架试图细化多个信息源对某一目标变量的贡献,并将这些贡献划分为三个基本成分:

  • 冗余信息(Redundant):由所有源共同提供的重叠部分;

  • 独有信息(Unique):仅由某一特定源提供的部分;

  • 协同信息(Synergistic):单独考察任何一个源都无法获得,只有多个源共同作用时才会出现的信息。

PID 的提出使研究者首次能够系统地区分“信息来自谁”以及“不同来源之间如何共同作用”。然而,PID 的适用范围主要限于多源—单目标的情形。现实系统——例如神经系统、生态系统或气候网络——往往同时存在多个信息源和多个受体,其动态结构远超单目标框架所能描述。在此情况下,PID 的表达能力就如同试图用二维地图呈现三维地貌,难以充分捕捉信息交互的真实结构。

ΦID:迈向信息动力学的系统化描述

整合信息分解(Integrated Information Decomposition, ΦID)可以视作对 PID 的时间维度与因果维度的扩展。与 PID 仅回答“信息来源是什么”不同,ΦID 更进一步,将信息视为随时间演化的结构性实体,关注其如何在系统内部被保留、复制、改变方向、组合或消失。换言之,ΦID 不仅刻画信息的“位置”,还描述其在系统中的“命运”。

在最简单的两成分相互作用系统中,PID 只能区分 4 类信息原子,而 ΦID 的时序与结构扩展使其能够识别出16 类信息原子,构成一个更为完整的“信息动力学晶格”(information lattice)。这一扩展不仅显著提升了信息分解的精细度,也为研究复杂系统中的信息加工机制提供了更加系统化和可解释的理论工具。

打开网易新闻 查看精彩图片

图1:从PID到ΦID的信息晶格结构,左图展示了传统PID的四个信息原子;右图则是ΦID的16格矩阵——每个格子代表一种信息形态从“过去”到“未来”的演化方式。 这就是作者提出的“信息动力学元素周期表”。

六种信息动力学模式

基于对 16 种信息原子的系统梳理,作者进一步总结出信息在复杂系统中的六类基本动态模式。这些模式刻画了信息如何在系统结构与时间维度上被保存、复制、传递、消除,以及如何在个体与整体层级之间产生因果作用。

首先,存储(Storage)描述信息在同一单元内部得以维持的过程,是系统保持内部状态记忆的基础。例如神经元或网络节点的自我记忆行为,即可视为典型的存储机制。与此相关的另一类机制是复制(Copy),即信息从一个单元被拷贝到另一个单元的过程。这类机制广泛存在于遗传复制、数据冗余或并行计算等场景中,是信息保持结构稳定性的关键途径。

相较于复制,转移(Transfer)则强调信息在不同单元之间的方向性传播,反映系统组件之间的输入—输出关系。例如神经系统中的信号传递,就属于典型的信息转移过程。与转移相对的是消除(Erasure),即冗余或无效信息被移除的过程,用以维持系统运作的有效性,例如噪声抑制或数据清理均为此类机制的实例。

在上述四类基本动态之外,作者还引入了两种跨层级的因果模式,用以解释系统整体与局部之间的相互影响。上行因果(Upward causation)指个体层级的状态或行为共同构成了整体的宏观属性,如群体中个体行为的聚合效应。与之相对的下行因果(Downward causation)则强调整体状态对个体未来行为的约束或调节作用,例如系统级别的调控机制会反作用于单个单元的状态变化。

这些模式像是信息流动的“六种生命形态”,共同构成了复杂系统的动态基因组。

打开网易新闻 查看精彩图片

图2:ΦID的六类信息动力学模式,每一条线连接着“过去的信息结构”与“未来的信息形态”。“上行”与“下行”因果的对称性,展现了复杂系统中整体与局部之间的双向信息流。

重新定义“整合信息”

“整合”并非单一标量,而是多类型信息过程的复合结构

ΦID 框架的一个核心贡献在于明确指出:传统整合信息指标(Φ)无法被视作描述系统整合程度的单一维度量。相反,所谓“整合”往往由多种性质不同的信息动力学机制共同构成,其内部结构具有高度异质性。为阐明这一点,研究者选取了三个简单但信息结构不同的逻辑系统——复制系统、XOR 系统以及奇偶保持系统——并展示尽管这三类系统在传统 Φ 指标下均取得相同的数值(Φ=1),其信息整合的成分来源却截然不同。

在复制系统中,整合信息主要体现为个体层级信息在时间维度上的保留与持续转移,即独有信息在过去与未来之间的直接映射(Un→Un)。相比之下,XOR 系统的整合来源于协同信息在时间演化过程中向独有信息的转化(Syn→Un),反映了该系统中多成分联合作用的关键性。第三种奇偶保持系统则表现为协同结构的持续维持,即协同信息在时间序列中保持自洽延续(Syn→Syn)。

这三类系统共同表明:即便在相同的 Φ 值下,系统内部的信息组织方式、因果结构以及动态机制可能完全不同。

因此,“整合”并不能仅通过标量大小加以理解,而需要在机制层面揭示其构成成分与转化关系。ΦID 提供的分解框架正是为了对这种内部多样性进行系统刻画,从而为复杂系统的整合结构提供比传统指标更具解释力的理论基础。

打开网易新闻 查看精彩图片

图4:三种逻辑系统的整合差异,三个系统的整体减部分的整合信息量(Whole-Minus-Sum Integrated Information Φ,ΦWMS)值相同,但信息动力学完全不同。ΦID的可视化让“整合”从一个模糊指标变成可分解的机制。

修正负整合的问题:ΦR 的提出

在对传统整合信息指标的系统分析中,作者注意到ΦWMS在某些系统中会产生负值的整合信息,这一现象令人困惑。ΦID 框架提供了明确的机制性解释:负整合并非意味着系统“缺乏整合”,而是源自冗余信息在分解过程中被重复计入(Red→Red),从而导致整体估计出现偏差。

基于这一认识,作者提出了修正版整合指标 ΦR。该指标通过在信息分解过程中对冗余项进行系统性校正,使整合信息的计算避免重复计数,从而确保所得值始终保持非负。与 ΦWMS 相比,ΦR不仅在数学结构上更加自洽,也更符合复杂系统研究中的基本直觉:系统的整合性不应表现为负值。

这一修正使整合信息的量化在理论和应用层面均更加稳健,为后续基于 ΦID 的信息动力学分析奠定了更一致和可解释的基础。

打开网易新闻 查看精彩图片

图5:ΦR修正后的表现,当噪声相关性增加时,ΦWMS下降为负值,而ΦR始终稳定为正。ΦR像是“纠偏后的指南针”,让整合信息重新指向真实的系统结构。

从模拟到实证:ΦID的应用

案例一:全脑模型中的整合动态

在基于人脑结构的动态均值场模型( the Dynamic Mean Field model, DMF)中,研究者模拟了不同脑区的交互。当全局耦合参数G≈2时,系统达到最高整合状态。 此时,传统ΦWMS出现负值,ΦR则呈现出清晰正峰。这一结果与脑影像研究一致—— 清醒意识状态下的大脑,的确处于最优信息整合区。

打开网易新闻 查看精彩图片

图6:图 A 展示了 ΦR / ΦWMS 的计算基础:一个由真实结构连接 + 脑区动力学 + 全脑耦合构成的仿真大脑;图 B显示全脑模型中ΦWMS与ΦR的比较,蓝线为传统ΦWMS,红线为修正ΦR。ΦR在G=2处达到峰值——此时的整合度最符合大脑的真实运行状态。

案例二:心率与呼吸的因果关系

在分析Fantasia心肺数据库时,研究者利用ΦID分解了呼吸与心率之间的转移熵。结果显示呼吸→心率方向的TE较高,但主要驱动力来自“协同→独有(Syn→Un)”的下行因果,同时存在小但相反方向的“独有→冗余(Un→Red)”效应。这说明传统转移熵仅看到“信息流”, 而ΦID揭示了“信息是以何种形式在流动”。

打开网易新闻 查看精彩图片

图7:心率与呼吸间的ΦID分解。转移熵(Transfer entropy)被拆解为其包含的 4 个 ΦID 信息原子,这些原子基于两个方向(心率到呼吸 [H2B] 及呼吸到心率 [B2H])进行计算。蓝色条代表呼吸→心率的下行协同效应(Syn→Un),红色条显示心率→呼吸的复制效应(Un→Red)。ΦID让心肺系统的信息协同关系第一次变得“可见”。

案例三:跨学科的1,053个系统分析

研究者们进一步对来自物理、生物、社会与人工系统的1,053个多变量时间序列进行ΦID分解。

结果令人震惊:活跃信息存储(AIS)与转移熵(TE)的正相关,实际上几乎完全由“信息复制(Un→Red)”驱动。当剔除这一成分后,两者相关性几乎消失——过去十年被广泛引用的“信息存储与转移耦合规律”,可能只是一个统计幻象。

打开网易新闻 查看精彩图片

图8:AIS与TE的关系被信息复制所驱动红色柱为原始相关,灰色柱为剔除信息复制后的结果。可见,ΦID让我们首次识别出“隐藏在统计相关背后的信息机制”。

未来展望:迈向信息科学的“第二次分解革命”

ΦID 的提出不仅扩展了信息动力学的分析工具,更为理解复杂系统提供了一种新的概念框架。该框架强调,复杂性并非源于随机性或混乱,而是体现为信息在不同层级之间的组织、转化与再生产方式。由此,ΦID 有望推动信息科学迈向“第二次分解革命”——从对静态信息量的度量转向对信息结构与动力模式的系统性解析。

未来研究方向主要体现在以下几个方面。首先,有必要进一步发展更具普适性的冗余函数,例如基于最小互信息(MMI)、共通因果结构(CCS)等定义,以增强 ΦID 在不同类型系统中的适用性。其次,将 ΦID 推广至非 Markov 系统、非平稳过程以及非高斯分布,仍是其理论扩展的关键挑战之一,这将使其能够覆盖更广泛的自然与人工系统。最后,ΦID 的潜在应用前景十分广阔,包括神经网络的可解释性分析、群体决策机制建模、生态系统中的信息流追踪、经济—社会系统的因果结构分析等领域。

正如作者所强调的那样:理解复杂系统的前提,是理解信息如何在系统内部产生、转化与传递。 ΦID 的框架为这一目标提供了新的理论基础,也为未来跨学科的信息动力学研究打开了更广阔的空间。

因果涌现读书会第五季

跨尺度、跨层次的涌现是复杂系统研究的关键问题,生命起源和意识起源这两座仰之弥高的大山是其代表。从2021年夏天至今,集智俱乐部已经陆续举办了四季「因果涌现」读书会,系统梳理了因果涌现理论的发展脉络,深入探讨了信息整合与信息分解的本质,并探索了在生物网络、脑网络、机器学习等跨学科领域的应用。此次将追踪因果涌现领域的前沿进展,展示集智社区成员的原创性工作,希望探讨因果涌现理论、复杂系统的低秩表示理论、本征微观态理论之间的相通之处,对复杂系统的涌现现象有更深刻的理解。读书会已完结,现在报名可加入社群并解锁回放视频权限。

详情请见:

1.

2.

3.

4.

5.

6.