Patterns：因果涌现2.0——如何区分四类复杂系统｜Erik Hoel|中观|复杂性|尺度|轨迹

导语

现代科学长期建立在一种信念之上：只要掌握了最底层的规律，我们就能够解释整个世界。然而，从天气系统到生命智能，从组织行为到人工智能，越来越多的复杂系统正在挑战这种直觉。它们似乎都在诉说同一个事实：最有效的解释，并不一定出现在最微观的层面。为什么有些宏观结构能够比微观细节拥有更强的因果力量？为什么退后一步，反而看得更清楚？2026年1月Erik Hoel发表于 Cell 子刊 Patterns 的一项研究进一步提出，一个系统究竟有多复杂，或许并不取决于它包含多少组成部分，而取决于最重要的因果关系分布在哪些尺度上。

关键词：涌现、复杂性、因果关系

郭瑞东丨作者

赵思怡丨审校

论文题目：Quantifying emergent complexity 论文链接：www.cell.com/patterns/fulltext/S2666-3899(25)00320-4 发表时间：2026年1月12日发表期刊：Patterns

你不需要理解晶体管如何开关，就能用手机读到这篇文章；气象学家也不必追踪每一滴水珠的运动轨迹，仍然可以判断明天是否会有暴雨。我们对世界的理解，很多时候并不是建立在最细微的事实之上，而是建立在某种更高层次、更可操作的描述之上。问题在于，为什么有些宏观“说法”，反而比微观“真相”更好用？

近年来复杂性科学中的因果涌现（Causal Emergence）理论，正是试图回答这个问题。它指出，在某些复杂系统中，当我们不再执着于最底层细节，而是退后一步，用更粗粒度的尺度观察系统时，反而可能获得更强的预测力和解释力。宏观描述并不只是微观事实的简化版本，在特定条件下，它本身就可能承载更清晰、更有效的因果关系。

这就引出了一个更深的“尺度悖论”：面对一个系统，比如大脑、公司、城市或生态网络，理论上总有无数种描述它的方式。我们可以从分子、神经元、个体行为、组织结构，直到文化和制度层面来理解它。可是，凭什么说“企业文化”比“某个员工今天敲了多少字”更能解释一家公司的变化？还原论认为，真正的原因只存在于最微观层面；相对主义则认为，不同尺度只是不同叙事，并无高下之分。但现实经验告诉我们，这两种说法都不够准确：有些尺度确实比另一些尺度更有解释力。

因果涌现的关键意义正在于此：它不只是说宏观描述“有用”，而是试图说明，在什么条件下，宏观状态能够比微观指标具有更强的因果预测力。2026年1月，Erik Hoel在Cell子刊Patterns发表论文《Quantifying emergent complexity》，进一步将这一问题推进到可量化层面：一个复杂系统的涌现程度，或许可以通过因果关系在不同尺度上的分布来衡量。换言之，这篇论文关心的不是简单地证明“宏观可以胜过微观”，而是追问：为什么有的系统会在某些尺度上突然变得更清晰、更可解释、更像一个真正的因果整体？

尺度悖论：为何有些尺度更具有解释力

复杂系统的一个核心特征，是同时存在于多个尺度之上（multiscale structure）。以计算机为例，最底层是晶体管，向上依次可以抽象为逻辑门、机器指令、程序模块，直到最终形成操作系统和人机交互界面。对于同一个系统，我们总是能够从不同层级对其进行描述。

问题在于，这些可能的描述方式数量极其庞大。即使一个只有8个状态的简单系统，其所有可能的状态划分方式（partition）也多达4140种，对应第8个贝尔数（Bell number，B8）。而随着系统规模增加，这一数量会以超指数速度增长，很快达到无法穷尽的程度。

这意味着，任何一个宏观——例如一家公司的兴衰、一座城市的交通拥堵，甚至一次金融危机——理论上都存在海量的解释路径。公司倒闭，可以追溯到每位员工的每一次决策；交通堵塞，可以分解为每辆汽车的每一次加速与刹车。这种由多尺度结构带来的海量解释空间，被称为解释过载（explanatory overload）。

然而，现实经验表明，并不是所有尺度都同样重要。研究一家公司的经营状况时，“组织文化”“部门协作”往往比记录每位员工每天敲击了多少次键盘更有解释力；理解大脑功能时，神经回路层面的描述通常也比单个离子的运动轨迹更有意义。换句话说，在众多可能的尺度中，往往只有少数几个层级真正抓住了系统运行的核心因果机制。Erik Hoel将这种现象称为尺度悖论（The Paradox of Scale）：系统明明由微观组成，但最有效的解释却未必出现在微观层面。

面对这一悖论，传统上主要存在两种极端立场。还原论（reductionism）认为，真正的因果关系只存在于最微观尺度，高层次描述不过是对底层机制的简化表象。然而，这种观点难以解释为何心理学、经济学乃至生态学，能够仅凭宏观变量就实现有效预测。与之相对，相对主义则认为不存在“特权尺度”，所有尺度的解释地位完全平等。但现实又清楚地表明，不同尺度的解释能力并不相同，有些尺度明显比另一些尺度更有效。

尺度悖论因此提出了一个更深刻的问题：在一个复杂系统中，究竟是什么决定了某个尺度能够成为最具因果解释力的“最佳描述层级”？

理论演进：从“什么是因果”到“如何量化因果”

尺度悖论背后，其实隐藏着一个更基础的问题：什么是因果关系？如果我们无法定义和量化因果，就无法比较不同尺度究竟谁更“重要”。

回溯人类对因果关系的探索，可追溯到18世纪英国启蒙哲学家大卫·休谟的规律性解释。大卫·休谟认为，所谓因果，不过是事件之间反复出现的相继模式：当某类事件总是在另一类事件之前发生时，我们便倾向于把前者视为原因、后者视为结果。从现代视角来看，休谟实际上将因果理解为一种稳定的统计相关性。

之后的多位哲学家不断试图超越单纯的相关性。例如，Ellery Eells 提出概率提升理论：如果事件 (c) 的发生提高了事件 (e) 出现的概率，那么 (c) 可以被视为 (e) 的原因。David Lewis则进一步提出著名的反事实理论：如果事件 (c) 已经发生，并且在一个假想世界中“若没有 (c)，便不会有 (e)”，那么 (c) 就是 (e) 的原因。

这些理论深化了我们对因果的理解，但它们仍然留下了一个关键难题：如何在复杂系统中比较不同尺度的因果效力？在一个复杂系统中，因果关系关系不是如太阳东升西落一样一成不变，也不是只发生在一个尺度上。我们需要一个方便计算的方法，来回答这样一个问题：

一个系统在某个特定尺度上，究竟具有多强的因果能力？

有效信息（Effective Information, EI）最初由 Giulio Tononi 和 Olaf Sporns 在神经科学的背景下引入，用于衡量大脑区域之间因果交互的强度。它后来在因果涌现理论中被独立地重新发现，又被称为因果特异性（causal specificity）。有效信息衡量的是，当我们可以自由地干预系统（设置其初始状态）时，我们能够从系统的输出（下一状态）中获取多少关于其输入（上一状态）的信息。

2013年，Erik Hoel 的PNAS论文[1]，基于有效信息，首次提出因果涌现理论。其核心观点是：在某些复杂系统中，宏观尺度的描述不仅能简化系统，还能比微观尺度提供更强的因果效力。

有效信息的定义，其创新之处在于对系统进行均匀干预（即对所有可能状态施加 do 操作，最大熵干预）后，考察下一时刻状态的互信息，据此量化“原因能多确定地导致结果”。Hoel 发现，在某些系统中，适当的粗粒化（coarse-graining）反而会提高有效信息。也就是说，当我们把若干微观状态合并为一个宏观状态之后，系统的因果结构有时会变得更清楚，而不是更模糊。这意味着宏观变量并不只是为了方便理解而人为创造的简化标签；在特定条件下，它们确实能够比微观变量提供更强的因果预测力。所谓因果涌现，正是指这种因果效力从微观层面转移并增强于宏观层面的现象。

图1：一个“神经元”系统，常规和圆形箭头分别表示组间和组内连接。(B) 每个宏观元素接收来自自身和其他宏观元素的输入。宏观层面的因果解释力强于微观层面。来自1

这也正是因果涌现对还原论的挑战。传统还原论认为，只有最底层的微观机制才具有真正的因果力，宏观描述只是方便叙事的表象。但因果涌现表明，多实现性（multiple realizability）——即多个微观状态对应同一个宏观状态——并不一定削弱解释力，反而可能发挥类似“因果纠错”的作用。它经由过滤掉微观噪声，从而让系统在宏观层面涌现出更强的因果结构。

不过，1.0版的因果涌现也存在局限：它通常只比较一条预设的微观→宏观路径（例如将 8 个状态压缩为 4，再压缩到2或1），并未系统探索所有可能的粗粒化方式。而Hoel最新提出的因果涌现 2.0（CE 2.0），不再只关注单一从微观到宏观的路径，而是把所有可能的状态划分方式纳入考察，形成一个由细到粗的尺度格（partition lattice）。在这个尺度格中，每一种划分都代表一种可能的观察尺度；CE 2.0要做的，就是评估每个尺度究竟为系统贡献了多少新的因果解释力。这样，因果涌现就从“宏观是否可能胜过微观”的问题，推进为“整个系统的因果结构如何分布在不同尺度上”的问题。

图2：不同从微观到宏观因果路径的案例

数学框架：如何找到系统真正的因果尺度？

在因果涌现2.0中，一个复杂系统任何时刻都处于某个明确的状态中。例如，一个简单开关只有“开”和“关”两种状态；两个开关组成的系统，则可能处于00、01、10、11四种状态中的任意一种。

系统随时间如何演化，则由一个转移概率矩阵（transition probability matrix, TPM）完全描述。这个矩阵记录了系统从当前状态转移到下一状态的概率。例如，系统处于状态00时，有90%的概率仍保持00，有10%的概率转移到10。转移概率矩阵因此可以被看作系统最底层、最精确的运行规则，也构成了因果涌现分析的“微观基准”。根据转移概率矩阵可知系统最底层的、最精确的运行规则。任何对系统的粗粒度描述（宏观尺度），都必须是通过对这个微观转移概率矩阵进行某种“概括”或“分组”得到。

任何更高层次的描述，都必须建立在这一微观规则之上。所谓宏观尺度，本质上就是对微观状态进行某种概括或分组。例如，对于状态集合 {A, B, C, D}，一个可能的分区是 {(A, B), (C, D)}，从观察者的角度看，原本四种微观状态被压缩成了两种宏观状态。问题在于，对于一个复杂系统，这样的分组方式并不是唯一的，而是可能存在海量方案。不同的分组，对应着不同的观察尺度，也对应着不同的宏观世界。

因果涌现1.0通常只沿着一条预先设定好的路径进行粗粒化；而在因果涌现2.0中，研究者不再预设哪个尺度最重要，而是遍历整个分区格（partition lattice）——也就是所有可能的状态划分方式所构成的层级结构。

对于每一种分区方式，研究者都会重新构建对应的宏观转移概率矩阵，并计算这一尺度上的因果效力。最终，系统中所有可能的尺度都会进入同一个“因果竞技场”，接受统一比较。

图3：系统的多尺度结构基于其状态的划分。子图分别展示了具有 2, 3, 4, 8 个状态的系统的分区格

了理解因果涌现2.0如何比较不同尺度，我们不妨从一个极简的报警器系统开始。

假设这个报警器由两个组件构成：传感器（Sensor，S）负责感知环境，警报铃（Bell，B）负责发出警报。每个组件都只有两种状态：开启（1）或关闭（0）。

因此，整个系统在任意时刻都可以用状态对 (S,B) 来表示，共有4种可能状态：

00: 传感器关，铃关（正常静默）
01: 传感器关，铃开（故障状态）
10: 传感器开，铃关（故障/延迟状态）
11: 传感器开，铃开（正常报警）

接下来，我们需要规定系统如何随时间演化。假设系统遵循一个简单规则：如果传感器开启，它最终会触发铃铛。如果传感器关闭，铃铛最终会关闭。真实系统并不总是完美运行，因此允许存在一些小概率的随机错误。

这种动态规则可以用转移概率矩阵表示。矩阵中的每一个元素，都表示系统从当前状态转移到下一状态的概率。

当前状态

→ 00

→ 10

→ 11

0.9

0.0

0.1

0.0

0.1

0.8

0.0

0.1

0.0

0.1

0.9

0.0

0.1

0.0

0.9

第一行 (00)表示：当系统当前处于状态00时，有90%的概率在下一时刻仍然保持00，但也有10%的概率由于误触发而转移到10。其余行的含义以此类推。这个转移概率矩阵就是警报系统的微观的特质。

有了系统的微观规则之后，观察者就可以尝试用不同方式对这些状态进行分组，从而构造不同的观察尺度。对于报警器系统，我们先考察三种具有代表性的分区方式：

1)微观尺度 (最精细分区)：πmicro中分区: {(00), (01), (10), (11)}，这是我们原始的、最详细的描述。我们可以看到所有状态，包括故障状态。

2)功能尺度：πfunctional中将状态分为两组 {(00, 01), (10, 11)}。这里，我们不再关心铃铛是否已经响起，而只关注系统最核心的功能变量——传感器是否被激活。因此，状态00（正常关闭）和01（故障响铃）被归入同一个宏观状态Off，因为二者都对应“传感器未被触发”；状态10（故障未响）和11（正常报警）则被归入宏观状态On，因为它们都表示“传感器已经触发”。

3)铃铛尺度：πbell根据铃铛是否在响来分组 {(00, 10), (01, 11)}。宏状态00和10对应铃不响；宏状态01和11对应铃响。这个分区很糟糕，因为它把原因（传感器状态）不同的状态混在一起。

然而，仅仅提出不同的分区还不够。接下来的问题是：如何公平地比较这些尺度谁更好？具体来说，研究者并不是被动地观察系统，而是主动对系统进行干预。所谓干预操作 do(c)，就是人为地把系统设置到状态 (c)。

对系统进行分区并遍历所有可能后，要做的是通过干预操作 do(c) 对应将系统置于状态 c，在报警器例子中，do(S=0, B=0) 或简写 do(00)，意味着我们手动将传感器和铃铛都关闭，然后观察下一时刻系统会变成什么状态。

这种干预与简单观察有本质区别。观察到系统处于00，可能是许多隐藏因素共同作用的结果；而干预则切断了所有指向00的因果路径，使我们能够纯粹地测量“00本身会导致什么”。

为了保证不同尺度之间的比较公平，研究者进一步规定：在每一个尺度上，所有状态都以相同概率被干预。例如，在微观尺度下：p(C=00) = p(C=01) = p(C=10) = p(C=11) = 1/4。我们进行无数次试验，其中1/4次我们设置系统为00，1/4次设为01，以此类推。在宏观尺度（例如功能尺度π_functional = {Off, On}）：p(C=Off) = p(C=On) = 1/2。我们一半的试验干预系统到Off的宏观状态，另一半干预到On的状态。

之后，Hoel定义了两个基本的因果原语，用来衡量一个尺度作为“因果机器”的质量。

第一个指标是确定性（Determinism）。衡量原因对结果的约束力，在上述警报器的例子中，因为大多数转移是高度确定的，通过计算每个原因c的条件熵H(E|c)，然后求平均会得到一个比较高的确定性值。

另一个指标是Degeneracy（退化性）。衡量结果的“特异性，如果退化性大于0，表示系统存在一定的简并性（例如，01和11都可能由不同的原因产生）

最终，Hoel将二者组合，定义了一个尺度的总体因果效力（Causal Power，CP）：CP=determinism+(1−degeneracy)−1，之后对每个区间划分 π，计算其 ΔCP：ΔCP(π)=max(0,CP(π)−π′ <πmaxcp(π′)< pan>

若ΔCP大于0，则对应划分π所在的尺度，相比所有更细的尺度的因果增益，保留所有 ΔCP > 0 的尺度，构成系统的涌现层级（emergence hierarchy），从而找到系统真正的“因果骨架”。

在上述的警报器例子中，功能尺度πfunctional的确定性非常高，接近1。因为从Off几乎总是到Off，从On几乎总是到On。退化性非常低，接近0。因为效应Off和On几乎只由它们自身引起，特异性很高。而最终的因果效力CP为~1 + (1 - ~0) - 1 = 1.0；而相比微观尺度，其ΔCP > 0，这个π_functional分区对应的尺度被保留在涌现层级中。它为我们理解系统提供了非冗余的、新增的因果解释力。而对于糟糕的尺度π_bell(按铃铛分组)，由于 ΔCP ≤ 0，这个尺度被剔除出涌现层级。它没有提供任何超越其祖先的新因果见解。

图4：在一个6状态系统的全部尺度集合中，计算特定尺度的因果效力CP的演示。从较小的组到较大的组沿着格向上移动遍历了所有粗粒化过程。左图的粗粒化，降低了因果效力（通过降低确定性），表明该尺度未能为系统的因果运作增加任何内容。右图是一个特别信息丰富的粗粒化，将六个状态分成适当的对，增加了确定性并降低了退化性。

图5：在8个状态的马尔可夫链中，微状态(4,5,6,7)具有完全相同的转移概率分布，将微状态(4,5,6,7)合并为单个宏观态能带来因果解释的增益，超过这个尺度后，进一步的粗粒化不再产生因果增益

小结上述过程，因果涌现2.0的计算方式分为4步，首先是通过do-操作和均匀干预，为所有尺度建立一个公平的因果力竞技场。之后组合确定性和退化性这两个“因果原语”来量化每个尺度作为因果机器的质量。

图6：在一个具有5个状态的小系统上的可视化使用该方法，b图显示子图A中那5个高亮的黑色节点，以及它们之间的连接关系。这构成了一个更小、更清晰的区分，节点的大小反映了其ΔCP值。c图对称化了图B旁边的垂直柱状图。可以把它想象成系统因果结构的“指纹”或“光谱”。

第三步的筛选通过 ΔCP 这个“过滤器”，识别出那些真正提供了因果增值的尺度。这些尺度不是对底层细节的简单总结，而是发现了新的、更高效的因果规律。最终呈现所有 ΔCP > 0 的尺度，这些尺度构成的涌现层级，就是该系统最本质的“因果骨架”。

对应报警器的案例，因果涌现2.0告诉我们，理解这个系统最关键的是抓住On/Off这个功能尺度，而不是纠缠于微观的故障细节或单纯的铃铛状态。这正是在工程上设计和控制此类系统所需要的“蓝图”。

分类体系：复杂系统究竟有几种“因果地形”？

通过 ΔCP 分布，Erik Hoel提出可将复杂系统分为四类，这也是该文最核心的发现。这四类分别是：

Bottom-heavy：底部主导。ΔCP 集中在微观，只有微观细节有实际因果作用，宏观概括无用。例如拼图时每一块拼图的位置和形状都至关重要，若只看“整体轮廓”或“颜色区块”（宏观）；无法完成拼图。例如做蛋糕，面粉、糖、泡打粉的比例差一点，成品可能完全失败——无法用“大概差不多”来替代。底部主导的系统，其所有微观状态无法塌缩到少数几个宏观状态中，
Top-heavy：顶部主导，大局即因果。这类系统只需关注宏观状态，细节无关紧要。例如面对红绿灯，只需知道“红灯停、绿灯行”，无需关心内部电路如何切换状态。天气预报说“明天有雨”这一宏观判断足以指导带伞决策，无需知道每一滴云中水分子的轨迹。在这些场景中，高层抽象完全主导行为，底层细节被“因果淹没”。
Mesoscale-peaked：中观尺度峰值。存在一个“恰到好处”的中间描述层级，既不过细也不过粗。例如团队管理中，只看宏观成败无法干预，若是看每个人每小时做了什么又太细，最高效的管理方式是“各小组任务进度”。这类常常是典型的复杂系统，例如城市导航问题，微观特征是每辆车的位置，宏观角度只能看“城市是不是堵车”，而中观指标，例如“早高峰时XX路段拥堵”才是导航App优化路线的关键尺度。之所以这样，是由于这些系统在中间层级展现出最强的因果解释力与干预有效性。
Balloon-like：气球型，单层激增，仅一尺度有效。这通常出现在人类设计的系统中。例如象棋中宏观特征是输赢，微观特征是每个棋子的行动，但描述与操控棋局最有效的是像连环马，双炮等人为设定的战术。在音乐中，单个音符（微观）或整首歌情绪（宏观）都不足以解释为何某段音乐“动人”；而识别出“II-V-I 和弦进行”这类特定结构，才能理解音乐如何阐述的情感（因果关系）。这里只有特定的某一层有效，因果力像气球一样，只在一个孤立尺度上“鼓起”。

图7依次描述了五个具有不同涌现结构的系统，其中最左边的为“顶部主导”：其涌现层级子格在顶部（宏观端）非常“肥厚”，节点大且多。其表现是一旦上升到主导的宏观尺度，因果规律（两个模块的互动）就变得非常清晰，而更精细的尺度（如模块内部）提供的因果增益很小。这就像国际政治中，理解国与国关系比理解各个国家间的市县互动更重要。从左往右的第二个子图，描述的是一个几乎确定的（由2个长度为4的循环组成）系统，其中所有状态都在宏观层面体现。

图7：五个复杂系统及其涌现层级示例

位于最中间的系统以及最右侧的，其涌现层级都是在中间最显著，其最强的因果力既不在最底层也不在最顶层，而是在一个中间的、特定的粗粒化水平上。这种系统通常经过精心设计或被进化优化过，其表现是在生物学中，解释生物体的运作机制，使用器官功能（中尺度）可能比用整个生物体（宏观）或细胞生化（微观）更有效。

从左到右第四个系统具有完全确定性且高度退化性。系统中许多不同的状态都会转移到同一个下一个状态。因为系统是退化的，粗粒化（合并状态）很容易使问题变得更糟，因为这会进一步混淆已经模糊的因果路径。因此，微观尺度本身可能就是最具因果力的尺度，或者存在一个非常特殊的粗粒化能缓解一些问题。这体现了退化性对因果涌现的抑制作用。

图8：对比左边顶部主导的，宏观状态2维时描述最准确的简单系统，其因果力集中于特定维度；而右边是中观尺度峰值，宏观维度3-4时描述效果最佳，其涌现的复杂度相比更高

临界性下，因果涌现最显著

找到系统的最佳尺度之后，一个更深的问题随之出现：什么样的系统，才是真正“复杂”的系统？

Hoel认为，仅仅存在因果涌现还不足以定义复杂性。一个系统可能只在某一个尺度上出现强烈的因果涌现（例如气球型系统），但这并不意味着它就具有丰富的多尺度结构。

此，论文进一步提出了一种新的涌现复杂性（emergent complexity）概念。按照这一框架，一个系统只有同时满足两个条件时，才称得上真正复杂：第一，因果贡献不能只集中在某一个尺度，而应该分布在多个尺度上；第二，在同一个尺度内部，不同的粗粒化方式也应该表现出显著差异。

为了研究这种复杂性何时出现，作者构建了一系列具有不同拓扑结构的网络，并将这些网络视为系统的状态转移图。网络中的节点代表系统状态，边则表示状态之间可能发生的转移。通过改变网络的生长规则，研究者生成了从树状网络到高度中心化网络的一系列结构。

其中，网络生成时使用了偏好依附模型。模型关键参数是 α，它控制着新节点连接已有节点的偏好强度。α = 1是经典的 Barabási-Albert (BA) 模型，生成的是传统意义上“无标度” 的网络，其度分布遵循幂律。α < 1：次线性偏好依附，生成树状、稀疏、分支状的结构。α > 1：超线性偏好依附，生成高度集中化的、“星形”的结构。

对于每个由不同α值生成的转移概率矩阵，研究者使用分支贪婪算法（因为网络较大，有40个状态，无法暴力计算）来估算其涌现层级，并计算确定性和退化性来度量因果效力。

随后，研究者对这些网络逐一计算其涌现层级，并进一步提出了两个新的指标来刻画系统的复杂性。

第一个指标是路径熵（path entropy）。它衡量的是：因果贡献在不同尺度之间分布得是否均匀。在一条微观到宏观的路径上，将ΔCP值归一化为一个概率分布，然后计算其熵 H(p)。如果所有尺度贡献均等，路径熵最大；如果只有一个尺度贡献，路径熵为0。如果一个系统是“字面无标度”的，就意味着没有一个层级（无论是微观、中观还是宏观）在因果贡献上占据主导地位。因果力量均匀地散布在所有尺度上。这对应着高的路径熵。图6中间是不同α值的网络下对应的路径熵。

第二个指标是行负熵（row negentropy）。它关注的是同一个尺度内部，不同观察方式之间是否存在显著差异。在同一个粗粒化层级（即分区格的同一行）内，不同分区方式之间的因果贡献（ΔCP）差异有多大。通过在一个特定层级1上，将所有分区的ΔCP值归一化，计算其熵S_1。如果该层级所有分区的贡献都一样，熵就高（对称性高，差异性小）。高的行负熵意味着，在同一个粗粒化水平上，存在多种不同的、有意义的“看法”，而且这些看法对系统因果的贡献大小很不相同。这表示系统在同一尺度上具有丰富的、非对称的因果结构。

图9左侧是不同α值的网络下对应的行负熵。将复杂性定义为路径熵和行负熵的乘积，可以看到图9最下方中间描述的无标度网络中，涌现的复杂性最高，这说明在一个高度复杂的系统，即文中定义的“字面意义上的无标度性”（Literal Scale-Freeness），其垂直方向没有主导尺度，因果贡献“雨露均沾”；而水平方向在每个尺度内部，都存在多种竞争性的因果描述，且重要性各异，结构多样化。而图9下半部分描述ΔCP分布随α的变化，分布从α<1的左偏（底部主导），过渡到α=1附近的相对平坦或中尺度凸起（复杂），再变为α>1的右偏（顶部主导）

图9：复杂性度量随偏好依附模型中的α变化

研究结果显示，当网络呈现经典的无标度结构——即连接度服从幂律分布时，系统的涌现复杂性达到最大。此时，因果贡献既没有集中在微观层面，也没有完全被宏观规律主导，而是相对均匀地分布在不同尺度之间。

为了描述这一现象，Hoel提出了一个新的概念：字面无标度性（literal scale-freeness）。

在传统复杂网络理论中，“无标度”描述的是网络拓扑结构：系统中不存在一个典型的连接规模，少数节点拥有大量连接，而大量节点只有少量连接，其度分布遵循幂律。而Hoel所说的“字面无标度”，描述的则不是连接结构，而是因果结构。如果一个系统在微观、中观和宏观等多个尺度上都具有相近的重要性，没有任何一个尺度占据绝对主导地位，那么这个系统就具有字面意义上的无标度性。换句话说，它不存在一个唯一的“最佳描述尺度”。

这一概念在传统复杂网络科学与因果涌现理论之间建立起了一座桥梁：前者关注网络连接如何分布，后者关注因果贡献如何分布；前者揭示系统的拓扑组织方式，后者则揭示系统的多尺度因果组织方式。

更有趣的是，经典的BA无标度网络长期以来就被认为与临界状态密切相关，临界状态以最优的信息处理、计算能力和适应性著称。与之相对的是，正是在这个临界区域，系统也展现出最丰富的多尺度因果结构。这表明，临界性不仅是关于拓扑的，更是关于因果的。一个处于临界状态的系统，其因果故事在任何单一的尺度上都讲不完，必须通过一个跨越所有尺度的、复杂的“因果档案”来完整理解。而临界性可能是实现最大因果复杂性和多功能性的通用原理。这为理解和工程化具有高度适应性和智能的系统提供了新的视角和工具。

一个处于“字面无标度”的临界系统，拥有最丰富的多尺度因果故事。它既不被微观噪音淹没，也不被宏观死板束缚，因此具有最强的适应性、信息处理能力和计算能力。这为理解生命、大脑和智能的本质提供了全新的数学语言。

精准工程涌现：涌现可以被设计出来吗？

因果涌现理论最激进的地方，或许并不在于它解释了为什么宏观能够胜过微观，而在于它暗示：涌现不仅可以被发现，还可以被设计。

事实上，Hoel将因果涌现2.0的工作称为工程化涌现（engineering emergence）。如果我们已经能够计算不同尺度上的因果贡献，那么原则上，我们也就能够反过来设计系统，使某个特定尺度成为系统最重要的因果层级。更进一步，通过引入特定的循环结构、置换关系或模块边界，研究者甚至可以让系统只在某一个指定尺度上产生显著的因果涌现。这种现象被称为精准工程涌现（Pinpoint Emergence）。

以高级编程语言举例，微观尺度（晶体管/机器码）对应 CPU指令序列和内存状态。这是系统最底层的、最精确的描述。中观尺度（编程语言结构）对应高级语言中的变量、循环、条件语句、函数调用。宏观尺度（软件功能）对应类的职责、模块的API、软件的总体功能。精准工程涌现的目标就是：设计一个系统，使得只有一个特定的尺度具有最高的因果解释力，而其他尺度都相形见绌。

实现方法，可以是通过编程语言中的封装，刻意创建一个“因果边界”，使得内部复杂的微观交互被隐藏，只暴露一个简洁的、具有强大因果力的宏观接口。例如软件设计者将微观状态的完整循环封装在一个类中，并只提供宏观层面作为交互方式，确保了只有对应接口出现的尺度是有效的因果尺度。

从因果涌现的视角来看，在复杂的软件系统中，“bug”可能源于错误的尺度选择（例如，直接操作底层内存而破坏了对象的不变量），而“优雅的设计”正是成功实现了“精准工程涌现”，使得系统的核心因果故事在一個精心挑选的高层抽象上变得清晰、强大且唯一。作为软件架构师，不仅需要实现特定功能，更要决定在哪个抽象层级上讲述系统的“主要故事”。

这种思想并不仅限于软件系统。在组织管理中，管理者同样需要决定：应该在哪个尺度上观察和干预组织行为。而作为企业管理者，你可以主动设计一个中观尺度的KPI（如“客户满意度的前导指标：客服首次响应时间”），使其因果力强于“每位客服的通话时长”（微观）和“季度总营收”（宏观），从而引导公司行为。

从尺度选择到主体性：因果涌现的哲学意义

因果涌现2.0最大的价值，并不仅仅在于提出了一套新的复杂系统分类方法，更重要的是，它将一个长期以来高度依赖直觉的问题——“应该在哪个尺度上理解一个系统”——转化为了一个可以被量化和计算的问题。

过去，我们往往凭经验选择观察尺度：经济学家关注GDP与通货膨胀，生物学家研究器官和功能模块，组织管理者关注部门协作与团队绩效。但因果涌现理论表明，不同系统确实存在不同的最佳描述尺度，而且这种尺度差异并非主观偏好，而是系统自身因果结构的客观属性。

从这个意义上说，因果涌现理论实际上提供了一种新的认知原则：面对复杂问题，我们既不应沉迷于微观细节，也不能满足于空洞的宏观叙事，而需要不断寻找系统真正发挥因果作用的那个层级。

而理解了因果涌现分布的不同分类，我们就可以据此主动设计自己的认知尺度。学习时别陷入微观细节（这个单词拼写错误），也别沉迷宏观鸡汤（“要努力”），找到中观尺度的知识模块（“这个理论的三个核心逻辑环”）。决策时识别当前问题属于哪种因果类型。修理一台底部主导的精密仪器，你必须看图纸；但管理一个顶部主导的团队，你只需调整宏观激励。与AI协作时要求AI提供其中观尺度的解释（“我基于哪些中间推理步骤得出这个结论”），而不是原始训练数据（微观）或最终答案（宏观）。

这种观点进一步挑战了传统哲学中的两个极端立场。一方面，它反驳了还原论。微观机制当然是真实的，但它们并不自动拥有最高的解释力。另一方面，它也不同于相对主义。并非所有尺度都同样有效，系统通常会自发涌现出某些具有更强因果力的特权层级。

Hoel将这种立场称为一种新的层级实在论（hierarchical realism）：微观世界是真实的，但并不全能；宏观结构具有独立的因果效力，但又并非脱离微观基础而存在。真正重要的问题，不是“哪个尺度更真实”，而是“哪个尺度在当前系统中拥有最大的因果贡献”。

这一观点甚至可能影响我们对于主体性和自由意志的理解。我们的自由意志和主体性（信念、欲望、决策）必须是构成我们大脑和身体的“涌现层级”中的一个有效且贡献显著的节点（即具有正ΔCP），若意识对应某一特定宏观尺度（如全局工作空间），则必须确保该尺度在脑中具有高 CP。在进行脑机接口，需要确保人类心理尺度不被底层电极信号“淹没”；如果技术设计不当，导致心理尺度在新的混合系统的涌现层级中消失（ΔCP=0），那就意味着人类失去了对接入电脑的那个人自身行为的因果控制权，即丧失了自主性。

类似的问题，同样出现在人与AI的互动中。当前 AI 系统多为底部主导，如大语言模型依赖 token 级细节，而人类认知则是中观尺度峰值，人机融合需对齐因果尺度，否则人类将“失语”（例如由于依赖AI而变得失去创造力与学习能力）。

总结来看，Erik Hoel的这篇论文，让对因果涌现的层级特征，从观察转向量化，再论证了涌现是可设计的属性。我们不仅能理解系统的复杂性，还能构建它。而在 AI与人类深度融合的时代，掌握“工程化涌现”的能力，或许正是守护人类自主性的关键。

参考文献

[1] Hoel, E. P., Albantakis, L., & Tononi, G. (2013). Quantifying causal emergence shows that macro can beat micro. Proceedings of the National Academy of Sciences, 110(49), 19790–19795. https://doi.org/10.1073/pnas.1314922110

因果涌现第七季——从理论到应用

在神经系统中意识的生成、城市交通的拥堵演化、全球产业系统的协同与失稳之中，始终潜藏着一条贯穿微观与宏观的因果脉络：个体行为本身或许简单，却能在尺度跃迁中孕育出高度组织化、难以还原的整体结构。复杂现象并非微观规则的线性叠加，而是源于多尺度动力学作用下逐步形成的因果组织。正是在这一背景下，因果涌现理论被提出，并在因果涌现 2.0、工程化涌现以及多尺度因果抽象等工作中推进，逐渐发展出一套融合动力学分析、信息论度量以及谱方法与人工智能工具的研究框架，从而将研究重心从“复杂性本身”转向“因果结构如何出现、如何被度量并在现实系统中发挥作用”。

为系统梳理因果涌现领域的最新进展，北京师范大学系统科学学院教授、集智俱乐部创始人张江老师领衔发起，组织对该主题感兴趣的研究者与探索者共同研读前沿文献、交流研究思路。读书会将于2026年2月22日起每周日上午（创建读书会暂定时间为10:00-22:00）线上开展，持续约10周，包含主讲分享与讨论交流，并提供会后视频回放，诚邀相关领域研究者及跨学科兴趣者参与。