聚焦超图与单纯复形:高阶交互未来研究路线图

Hypergraphs and simplicial complexes in focus: a roadmap for

future research in higher-order interactions

https://iopscience.iop.org/article/10.1088/2632-072X/ae3c4e/pdf

概述:

一、核心问题与研究动机

本文是一份跨学科研究路线图,旨在系统梳理高阶相互作用(higher-order interactions)建模的理论基础与未来方向。其核心动机源于一个关键认识:

传统图/网络仅能编码成对(两两),但现实世界中大量复杂系统(如脑网络、生态系统、社交群体、化学反应)的本质交互往往涉及三个或更多实体的协同作用。

因此,论文主张必须超越图论框架,发展以超图(hypergraphs)与单纯复形(simplicial complexes)为核心的"高阶网络"理论,以更准确地刻画复杂系统的结构与功能。

二、关键概念辨析:三类高阶表示框架

打开网易新闻 查看精彩图片

三、典型应用场景(为何高阶建模至关重要)

  1. 流行病学:群体聚集性接触(如会议、家庭)无法简化为成对接触,高阶结构影响传播阈值与动力学。
  2. 系统生物学:蛋白质常以多蛋白复合物形式协同工作,成对互作网络无法明确刻画三元及以上复合物的形成。
  3. 神经科学:胶质细胞对神经元间突触的调制、多脑区协同激活等过程本质上是高阶交互。
  4. 生态学与化学:物种间调控关系、酶催化多底物反应等均涉及三元或更高阶依赖。
  5. 社会科学:合著网络、社交事件、集体决策等场景中,群体互动逻辑超越二元关系。
四、五大核心研究方向(路线图主体)

论文基于2024年牛顿研究所"超图:理论与应用"卫星会议的跨学科研讨,提出以下优先发展领域:

1. 谱超图理论(Spectral Hypergraph Theory)

  • 目标:将谱图理论(特征值、拉普拉斯算子等)推广至超图
  • 价值:为高阶网络的结构分析、聚类、降维与动力学稳定性提供数学工具
  • 示例:化学空间的拉普拉斯谱可识别"闭合反应系统"等关键模体
2. 离散拓扑(Discrete Topology)
  • 目标:发展适用于离散高阶结构的代数拓扑方法(如同调、上同调、持久同调)
  • 价值:量化数据的"形状"特征(如空洞、连通分量),揭示传统方法无法捕捉的全局结构
  • 关联:支撑拓扑数据分析(TDA)在高阶网络中的应用
3. 高阶网络动力学(Higher-Order Network Dynamics)
  • 目标:建立多体相互作用下的动力学模型(如高阶同步、传播、博弈演化)
  • 价值:解释高阶结构如何涌现集体行为(如脑功能整合、社会共识形成)
  • 挑战:非线性耦合、多尺度耦合、结构-动力学反馈
4. 高阶机器学习(Higher-Order Machine Learning)
  • 目标:设计能直接处理超图/单纯复形输入的神经网络与表示学习算法
  • 价值:提升对群体关系、多模态关联、层次结构的建模能力
  • 前沿:拓扑深度学习(TDL)、单纯卷积、高阶图注意力
5. 高阶网络科学(Higher-Order Network Science)
  • 目标:构建面向实证数据的高阶网络构建、验证与应用方法论
  • 价值:推动高阶模型在脑科学、药物发现、社交分析、流行病预测等领域的落地
  • 关键:数据稀疏性处理、模型可解释性、跨尺度整合
五、理论挑战与跨学科机遇
  • 数学基础待完善:极值超图理论中的经典问题(如图兰型问题)仍未完全解决;谱理论、离散微分几何等工具需进一步适配高阶结构。
  • 框架融合需求:超图理论与拓扑数据分析历史上相对分离,亟需建立统一的语言与工具链。
  • 计算复杂性:高阶结构的组合爆炸特性对算法效率提出挑战。
  • 跨学科协同:纯数学、理论物理、计算机科学、网络科学与领域专家(如神经科学、生态学)的深度对话,是突破理论瓶颈与推动应用落地的关键。
六、历史脉络与学术传承
  • 超图概念最早由T. Gallai于1931年提出,作为图的推广;
  • Claude Berge的两部专著(1970年代)奠定现代超图理论基础;
  • 极值组合学(尤其是匈牙利学派)为早期发展提供核心问题与方法;
  • 当前研究正处于"从组合结构向拓扑-几何-动力学整合"的范式跃迁期。
七、路线图定位与读者导向
  • 目标读者:数学、物理、计算机、网络科学及复杂系统应用领域的研究者与学生
  • 写作风格:兼顾严谨性与可读性,纯数学章节(如谱理论、离散拓扑)与应用章节(如动力学、机器学习)相互呼应
  • 核心价值:为进入高阶网络研究提供系统性入口,为资深研究者指明交叉创新的前沿坐标
总结:本文的核心主张
高阶相互作用不是图模型的"补充",而是理解复杂系统本质所必需的范式升级。超图与单纯复形作为其数学载体,正处于理论深化与应用爆发的关键节点。本路线图通过梳理核心概念、应用场景、研究方向与跨学科路径,旨在推动形成统一的"高阶网络科学"范式,为下一代人工智能、复杂系统建模与基础数学发展提供新引擎。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

摘要:

高阶相互作用正日益被认识到对于理解复杂系统、网络以及开发下一代人工智能算法具有基础性意义。然而,对高阶相互作用进行建模要求我们超越仅能编码成对相互作用的图与网络,因而需要一种新理论。超图与单纯复形(亦称高阶网络)作为高阶复杂系统的自然数学表示,因此正受到越来越多的关注。高阶网络的数学已经提供了重要的见解,然而许多基础数学问题仍未解决;例如在谱图理论、离散拓扑和高阶网络动力学等领域。本路线图总结了在牛顿研究所“超图:理论与应用”卫星会议上,纯数学家、理论物理学家、计算机与网络科学家围绕这些主题所进行的科学讨论。我们综述了高阶网络研究的当前前沿现状,并为未来研究提出了一些发展轨迹,涵盖极值与谱超图理论、离散拓扑、高阶动力学、高阶机器学习,以及在脑科学与社会科学中的应用等领域。

1. 引言

网络是以图的形式表示的复杂交互系统,由代表系统组件的顶点与代表组件之间成对(两两)交互作用的边构成[1, 2]。这些网络的底层结构编码了交互网络中所蕴含的信息,并为理解现实世界复杂系统中网络结构与功能之间丰富的相互作用提供了全新的基础性洞察[1, 3]。在过去二十年中,研究已表明,网络为众多复杂系统提供了抽象的数学表示,这已被证明在多个领域具有基础性作用——包括电网和互联网等技术系统;复杂食物网和细胞内分子调控网络等生物系统;以及在线社交网络。然而,此类方法仅考虑系统组件及其成对交互作用。在许多重要情形中,所谓的高阶交互作用[4–7]同样至关重要,并能在刻画系统拓扑[8]与功能[9–11]方面发挥重要作用。目前,在复杂系统的表示中对这些高阶结构进行建模的兴趣日益浓厚:例如,将它们编码为可使用拓扑学方法分析的单纯复形,或更一般地,编码为超图。这两种方法均是成功且活跃的研究领域[7, 12–15]。

由于高阶网络考虑了多体相互作用,它们可用于表示任意规模的元素集合。例如,若我们要对流行病进行建模,可将个体建模为图或超图中的顶点,并在个体(成对或群体形式)发生接触时将它们连接。重要的是,由于基于图的表示仅能捕获二元关系,它们可能无法有效捕捉诸如涉及大量人群的社交事件等重要信息。另一个例子是,蛋白质通常通过在细胞内发生物理相互作用形成化学复合物来执行其功能。尽管蛋白质-蛋白质相互作用网络枚举了可能的成对相互作用,但它们无法明确刻画涉及三个或更多蛋白质的高阶复合物的形成。在这两种情况下,高阶交互作用——分别涉及传播事件或蛋白质复合物——都携带了在图表示中被遗漏的重要信息。其他重要应用还包括(除其他外)微生物群落[16]与脑功能[17]。高阶网络包括:提供编码两个或更多节点间交互作用的最通用组合框架的超图;充分考虑数据高阶拓扑的单纯复形;以及编码节点与边之间调控交互作用的三元交互网络(见图1)。单纯复形[7, 15, 18]提供了一种表示高阶交互作用的途径,使得代数拓扑中的强大工具能够应用于数据分析,其典型做法是将数据点之间的交互作用或相似性表示为单纯复形。因此,单纯复形在拓扑数据分析[8]中占据着重要地位。尽管在概念上具有明显的相似性,但历史上(就实际应用而言)超图理论与拓扑数据分析在很大程度上是相互分离的——尽管已存在一些显著的联系[19]。

打开网易新闻 查看精彩图片

然而,单纯复形可被视为一种特殊类型的超图,它由单纯形构成,这些单纯形表示其组成顶点之间的全对全交互作用,并且在其面(顶点的子集)的包含关系下保持封闭——这是超图定义中并不存在的一项约束。从拓扑/几何的角度很容易理解这一点:例如,我们不能拥有一个缺失边的三角形(即三个顶点之间的三元交互作用)。尽管存在这一限制,但近期研究已表明[20],若考虑加权单纯复形,实际上可以在不损失任何信息的前提下对任意超图数据进行编码。使用单纯复形来表示高阶交互作用的优势在于,它是编码高阶交互作用拓扑与几何结构的理想框架。得益于代数拓扑提供的强大工具,尤其是拓扑数据分析(TDA)与拓扑深度学习(TDL),单纯复形可用于刻画数据的拓扑结构,以及在其上展开的高阶动力学过程。

近年来,具有三元交互作用的网络已开始引起广泛关注[10, 21]。当一个或多个节点调节另外两个节点之间的交互作用时,就会发生三元交互作用。例如,在生态系统中,当一个物种调节另外两个物种之间的交互作用时;或在神经系统中,当一个胶质细胞调节另外两个神经元之间的突触信号时,就会出现这种情况。三元交互作用也可能出现在化学反应超图中,例如当一个节点(如酶)影响底物之间化学反应的速率时。从这些例子抽象来看,三元交互作用无法被重新表述为节点之间的超边,而具有三元交互作用的网络与超图之间的形式化映射只能通过将超图的概念扩展为因子图来实现(详见[22, 23])。因此,在这种情况下,为三元调控交互作用赋予不同的功能角色,可以显著丰富由这类高阶网络所产生的动力学行为。

目前,使用超图和高阶网络来分析现实世界复杂系统的结构与功能的兴趣日益浓厚[6, 9, 10, 24–27]。然而,尽管存在这种兴趣,超图和高阶网络的潜力尚未得到充分实现,因为解决紧迫理论问题所需的理论尚未完全发展成熟。事实上,数学家、理论物理学家、计算机科学家和网络科学家对这一跨学科主题的共同兴趣,为提出新的理论挑战以及开发从具有高阶交互作用的网络中提取相关信息的新框架提供了肥沃的土壤。

在2024年夏季于伦敦艾伦·图灵研究所举行的牛顿研究所卫星项目“超图:理论与应用”会议上,我们讨论了高阶网络领域的最新进展与开放前景。基于这些讨论,我们确定了纯数学与应用数学/理论物理学中的核心数学主题,我们认为这些主题对于在高阶交互作用背景下发展网络科学与机器学习工具至关重要,并在现实世界复杂系统的研究中具有广泛应用——从脑科学研究与药物发现,到社交网络、流行病传播与博弈论(见图2)。在下文中,我们将概述在该项目中讨论的一般主题,这些主题从纯数学问题到日益应用化的议题不等。这些主题包括:谱超图理论(第2节)、离散拓扑(第3节)、高阶网络动力学(第4节)、高阶机器学习(第5节)以及高阶网络科学(第6节)。

打开网易新闻 查看精彩图片

本路线图旨在为跨越学科界限的这一高度活跃的跨学科领域中的广大科学读者提供指引。我们采用了通俗易懂的写作风格,这将为已经在从事高阶网络研究或希望进入该领域的研究人员提供全面的参考。同时,不同章节从不同视角探讨主题并讨论结果。第2节和第3节呈现了现代纯数学领域最新进展的讨论,而第4至第6节则分别从应用数学/理论物理学、计算机科学与网络科学的视角,对这一高度活跃的研究领域提供了充分的概述。

2. 极值与谱超图理论

在考察超图的基础理论及其在建模高阶相互作用中的作用时,审视两个关键领域——极值超图理论与谱超图理论——是重要的,它们虽然抽象,却与现实世界的应用有着重要联系。例如,化学空间(即文献中曾报道过的所有化学物质与反应构成的系统)形成了一个巨大的超图,其中物质作为顶点,反应作为连接输入与输出集合的超边[28]。文献[13]中引入的拉普拉斯算子捕捉了该结构,其谱特性将为化学空间的结构带来更深入的洞察,例如通过识别特定的模体(如闭合的反应系统)。同样,合著网络可自然地被建模为超图(参见例如[29]),并且同样地,超图谱理论应能够提供类似于其对普通网络所能提供的结构洞察(参见[30, 31])。因此,这些领域不仅推进了超图的数学理解,而且对于解决网络科学与动力系统的问题也至关重要。

极值超图理论侧重于识别结构边界,例如在给定约束下顶点或超边数量的最大值或最小值。同时,谱超图理论将谱图理论中成熟的结果推广至超图,使其成为分析具有高阶相互作用的系统动力学以及解释复杂网络数据的重要工具。极值方法与谱方法之间的相互作用为未来的研究呈现了一个有前景的方向,并为理论进步与实际应用开辟了新的可能性。

图3给出了本节涵盖主题的概览。

打开网易新闻 查看精彩图片

2.1. 极值超图理论

尽管超图已发展成为一个广泛且国际化的研究领域,但其起源与早期发展深深植根于匈牙利的极值组合学。在文献[32]中,保罗·埃尔德什(Paul Erdős)写道:“据我所知,超图这一主题最早是T·加莱(T. Gallai)在1931年与我的交谈中提及的。他指出,超图应作为图的推广来研究。该主题真正焕发活力,是在贝热(Berge)的工作之后。”埃尔德什所指的克洛德·贝热(Claude Berge)的工作是两部著作[33, 34],它们为超图的研究奠定了基础。极值超图理论中的一些经典(且部分仍未解决)问题包括,例如图兰(Turán)于1941年提出的图兰四面体问题[35]。

另一个著名的问题是已有50年历史的埃尔德什匹配猜想(Erdős Matching Conjecture):如果一个n元集的k元子集族中不包含s+1个两两不相交的集合,那么该子集族的最大规模是多少?

此外,近年来,约瑟夫·巴洛格(József Balogh)、罗伯特·莫里斯(Robert Morris)和沃伊切赫·萨莫伊(Wojciech Samotij),以及独立地由大卫·萨克斯顿(David Saxton)和安德鲁·托马森(Andrew Thomason),在极值超图理论中做出了重大贡献,他们发展了超图容器法(hypergraph container method),作为一种对含有禁止子结构的有限对象数量进行定界的新工具[36–38]。该方法不仅增进了我们对极值问题的理解,也为探索超图开辟了新方向。

2.2. 谱超图理论

近年来,将超图工具应用于现实世界数据分析的兴趣日益浓厚。然而,尽管基于基础图论的严格概念,网络科学工具现已十分成熟,但为充分发挥超图潜力所需的理论工具与技术却尚未完全发展成熟。除了针对超图与单纯复形统计模型的活跃研究外,谱超图理论近期也备受关注。我们期望该领域的新进展将带来相较于简单图框架的根本性范式转变。

在图的语境下,谱理论指的是对给定图算子的特征值与特征向量的研究,例如与图相关联的邻接矩阵、基尔霍夫拉普拉斯矩阵和归一化拉普拉斯矩阵[39–42]。尽管并非总能通过谱来区分两个图,但谱能够揭示一些重要的图性质——例如其二分性、完全性与连通性。这对诸多应用具有重要意义,包括聚类、社区发现、图划分以及网络上的扩散过程[42–44]。此外,谱图理论中的关键问题还包括特征值界、谱聚类和谱刻画等,这些问题构成了数据分析与网络科学中许多现代应用技术的基石[45, 46]。

近年来,已提出了将谱图理论推广至超图及其分析的多种方案[47–55],其中部分已应用于网络科学与动力系统[56, 57],但许多重要问题仍是开放性的。例如,是否存在某种特定的推广形式更适合于现实世界数据的分析,或更适用于高阶动力学的研究?

将谱图理论扩展至超图的一个关键挑战在于,图算子存在多种推广方式。例如,对于图而言,节点的度是唯一确定的;而对于超图,度的概念则可能因考虑节点所属超边的数量,还是考虑这些超边的大小而有所不同。此外,在超图情形下,顶点间邻接的定义也可能有所不同。这种灵活性使得在构建经典图矩阵(如邻接矩阵或拉普拉斯矩阵)的超图对应形式时,存在多种不同的构造方法。

除了这些选择之外,使用矩阵与张量来表示超图之间存在根本区别。尽管张量能够完整表示超边,但它们也引入了显著的计算复杂性。另一方面,基于矩阵的表示方法——通过展平或投影超图结构——允许应用更成熟的基于矩阵的技术(例如参见[58, 59]),但代价是丢失了超图固有的一些结构信息。因此,一个重要的问题是:基于矩阵的方法凭借其计算简便性,能否捕获足够的超图结构以提供有意义的见解;还是说尽管基于张量的方法更为复杂,但对于充分探索高阶关系与动力学而言却是必要的。

这些选择——在不同的度与邻接概念之间,以及在矩阵与张量之间——为未来的研究提出了重要问题。

另一个值得探索的有趣方向是同谱超图的研究,这很重要,因为它揭示了哪些超图性质无法从其谱中推导出来。已有若干篇论文基于广为人知的超图表示[50, 60, 61]——邻接张量与邻接矩阵——提出了获取同谱一致超图的方法。将已知的同谱一致超图构造方法推广至非一致超图以及其他超图推广形式(如有向超图),是引人关注的开放性问题。

2.3. 融合极值与谱框架

有趣的是,在图中,谱性质与极值组合学之间存在着深刻的联系。例如,由Cvetković提出的惯性界[63],以及由Hoffman发展的比例界,建立了图的独立数与其特征值之间的关系。这两个界均可用于证明极值组合学中的一个重要结果(EKR定理)。

超图方法也被应用于组合设计领域,为解决长期存在的存在性问题提供了强有力的工具。组合设计是满足特定条件的有限集系统。超图方法于1985年进入该领域,在文献[64]中,Rödl利用概率方法找到了一个近似设计。在一项近期突破中,Keevash[65]通过使用随机代数构造,证明了对于几乎所有允许参数斯坦纳系统(Steiner systems)的存在性,从而解决了起源于19世纪的组合设计存在性长期猜想。Glock等人[66]的最新进展利用概率与组合方法,解决了任意r-一致超图F的F-设计的存在性问题,扩展了Keevash的工作。

尽管其中部分结果已被推广至超图(例如参见超图比例界的若干推广[67, 68]),但许多潜在的推广及其应用仍是开放性问题。超图结构的复杂性——其中存在邻接、度与特征值的多种定义——为将这些经典谱界扩展至超图情形带来了新挑战。应对这些挑战有望推动谱超图理论与极值组合学的发展。

若干方向显得尤为有前景。在极值方面,埃尔德什匹配猜想与超图的图兰问题等长期存在的问题仍是重大的开放性挑战。在谱方面,超图矩阵与张量数学理论的持续发展,正加深我们对它们在应用中作用的理解。已知的同谱构造仅限于一致超图,将其推广至非一致与有向情形将是一个有趣的未来研究方向。最后,极值方法与谱方法之间的相互作用才刚刚开始被理解:例如,将关联独立数或色数等不变量与特征值的经典特征值界推广至超图情形(并针对不同类型的超图算子),可能会催生出强大的新方法。这些例子共同展示了极值与谱超图理论交叉领域中丰富的开放性问题图景。

在3.2节中,我们还将阐明对(超)图谱的洞察如何能够补充拓扑方法(该方法仅需要特征值0),从而获得关于网络局部与全局性质的更丰富图景,并理解网络上耦合动力学的性质。

3.离散拓扑

离散拓扑与几何之间的相互作用为理解复杂系统提供了洞见,为理解数据的连通性与形状提供了一种结构化的方法。我们强调了代数拓扑与离散几何中的概念在解决纯数学与应用数学问题中的重要性。我们介绍了相关概念以及离散结构在现代数学中不断演变的作用,讨论了单纯复形与超图的同调与上同调方面的最新进展与开放前景,以及拉普拉斯算子谱性质与广义代数拓扑算子表征方面的重要近期进展。尽管本节更侧重于该领域的纯数学方面,但我们构建了讨论框架,重点突出关键的说明性应用。这两个主题更广泛的应用将在后续章节中讨论。特别是,上同调与代数拓扑算子的谱性质是定义高阶网络上的拓扑动力学(将在第4节讨论)与拓扑信号处理(将在第5节讨论)的关键,而同调对于制定持久同调算法以揭示具有重要基础意义的数据形状至关重要,这对于拓扑机器学习(见第5节)以及脑研究与网络神经科学(见第6节)具有根本重要性。

3.1. 单纯复形及其推广的同调与上同调

从数学上讲,同调理论通过构造一个平方为0的边界算子 ∂ 来工作,并由此构造出问题对象(此处为单纯复形)的同调群。这些群的维数(即贝蒂数)提供了高维空洞的数量,从而产生基本的拓扑不变量。在上同调理论中,人们还可以额外使用标量积来构造 ∂ 的对偶 δ 的伴随算子,并由此获得狄拉克[5]与拉普拉斯算子[69]。这些可用于定义更精细的不变量。特别是,拉普拉斯算子的谱提供了重要的几何不变量——例如,参见教材[70]。

打开网易新闻 查看精彩图片

另一个活跃的研究领域是多参数持久性[74],其中数据与单纯复形沿两个或更多参数进行过滤。该方法对于分析在多个尺度与密度上具有有意义结构的数据,以及功能性与随时间变化的数据特别有用。关于该领域及其应用的最新概述,见[75]。该方法可扩展至模糊度量与模糊单纯集,即距离仅为统计意义上的[76, 77],将其与Isomap或UMAP等最新数据分析方案相联系,并提供改进版本(IsUMap [78])。

对于超图,原则上仅可能存在部分理论,因为超图不一定包含超边的面;见[70]。另一种推广是有向图(有向图)的路径同调[79],其也可用于超图;见[80]。

3.2. 拉普拉斯算子及其谱性质

单纯复形的拉普拉斯算子在[69]中被引入,用于单纯复形上的霍奇型上同调理论。但拉普拉斯算子能告诉我们的远不止纯拓扑不变量,事实上,它们的谱编码了基本的几何不变量。在图论中,这一点已被系统性地利用;例如见[39, 42, 53]。实际上,不仅单个特征值(如最小非零特征值或最大特征值)编码了重要信息,而且所有特征值的分布也能揭示网络的定性性质,例如[30, 31, 81]。对于高阶单纯复形,拉普拉斯框架在[82]中得以发展。这可以进一步推广:如果我们考虑 k k-单纯形上的函数向量空间以及满足适当性质的转移算子,使得它们在(上)同调中作为(余)边界算子的平方为0,这就引出了层拉普拉斯算子(sheaf Laplacian)的概念;见[83]了解其在持久(上)同调中的应用。

一个自然的问题是,这是否也能转化为对超图有用的工具。已提出了不同的拉普拉斯算子;例如比较见[84]。对于最一般的理论,我们需要在超图上添加额外的结构。具体而言,我们假设每条超边 h 由两个(不一定互异)的顶点集 组成,类似于化学反应中的反应物(输入)与产物(输出)。在[13]中,此类超图被称为化学超图。人们随后可以构造一个拉普拉斯算子,用于评估输入与输出之间的差异,并量化通过超图的流,从而以完全类似于上述的方式发展谱理论,且特征值编码了底层超图的关键结构性质[13, 53]。

特别是,特征值控制了网络中扩散耦合混沌动力学的集体行为。Kaneko[85]发现了扩散耦合网络上混沌动力学同步的惊人现象,在[86]中推导了稳定性条件。稳定性取决于网络的凝聚性,而后者由耦合拉普拉斯算子的最小正特征值控制,而最大特征值控制周期2的振荡,如[87]所示。同步在许多应用中当然有趣且有用,但在许多系统中,存在着性质更丰富的集体动力学。文献[57, 88, 89]中观察到,此类动力学可由超图上混沌动力学的扩散耦合产生。此处,[13]中的超图拉普拉斯算子被用于将化学超图的输入活动与输出活动汇聚在一起。仍有待进一步探索由此类扩散耦合产生全局模式形成的潜力。除了[88]中已观察到的丰富模式外,还能以这种方式生成什么?所有这些现象背后的普遍原理是,各个组件处的局部强非线性混沌动力学通过网络上的线性算子(拉普拉斯算子)进行扩散耦合。该拉普拉斯算子的特征值编码了网络的几何性质,这些性质对于理解无法从个体动力学本身预测的集体现象的涌现至关重要。在此背景下,我们还可以考察狄拉克算子在连接不同维度单纯复形中动力学方面的模式生成潜力;例如见[5, 90]。这些代数拓扑算子在塑造单纯复形高阶动力学中的作用将在第4节进行广泛讨论。

单纯复形与超图的拓扑及谱理论目前构成了一个非常活跃的研究领域,其中既涌现出深刻的数学结构,也出现了机器学习中的新颖应用。例如,我们可以探讨过滤单纯复形中谱性质的持久性,以及它们揭示了关于底层数据集的何种信息。由此产生的持久特征值不仅恢复了持久同调中的条码图(barcode),还提供了额外的几何信息[91–93]。这种研究过滤复形的方法已被证明在图像数据上优于持久同调,尽管高效计算仍然是一个挑战[94]。

我们要预期在未来几年,这种广泛的研究活动将有助于建立超图与高阶网络谱性质的综合理论。这一新领域的许多问题仍是开放性的。例如,是否存在某种特定的算子(不限于上述概述的那些)更适合于现实世界数据的分析,或更适用于高阶动力学的研究?在缺乏对此问题的明确答案的情况下,我们能否提供指导方针,以指出在何种假设下应采用给定的谱算子?针对超图与单纯复形的谱算子的不同定义是正交的还是互补的?

  1. 高阶动力学

高阶网络提供了一个框架,用以揭示驱动高阶动力学的基本数学机制[9–11, 95],这对从大脑到气候的广泛复杂系统具有重要意义。在此,我们区分高阶节点动力学与高阶拓扑动力学[10],来讨论该领域的最新进展[9–11, 95]。后者将代数拓扑与非线性动力学理论相结合,相对于传统以节点为中心的网络动力学状态描述,需要一种更为根本的视角转变。具体而言,在高阶拓扑动力学中,动力学变量(也称为拓扑信号,见图4)不仅与节点相关联,还与边以及单纯复形的高维单纯形相关联。因此,虽然在以节点为中心的方法中,动力学既可以关联到超图也可以关联到单纯复形,但对于高阶拓扑动力学而言,单纯复形提供了一个强大的框架,用以揭示拓扑如何塑造动力学,以及动力学如何“学习”拓扑。在讨论了以节点为中心的高阶动力学与高阶拓扑动力学中的重要过程之后,我们将在本节结尾强调三元交互作用在决定高阶网络新动力学状态中的作用,这些状态无法通过考虑标准的高阶交互作用(如超边或单纯形)来解释。

打开网易新闻 查看精彩图片

由于篇幅限制,我们将无法在此概述包含p-自旋模型、组合优化问题(如K-SAT问题)以及Sachdev-Ye-Kitaev模型在内的经典与量子自旋模型的大量文献。对于有兴趣了解这些主题的读者,我们建议参考[96–98]。

4.1. 节点层面的高阶动力学

在传统的网络动力学领域,网络的动力学状态完全由与网络节点相关的动力学所捕获,并凭借节点之间存在的成对相互作用而演化。该框架在网络理论中得出了许多基础性结果,不仅凸显了网络结构与动力学之间的相互作用[99, 100],还揭示了通过考虑节点间不同耦合函数所涌现的丰富动力学行为[101]。事实上,如果在不同的网络结构上考虑相同的动力学,可以观察到临界现象相图中的范式转变,例如无标度网络中流行病阈值的消失[99, 100]。另一方面,通过保持底层网络结构固定并改变节点间的耦合函数,可以构建推广经典模型的模型,如著名的藏本模型[102]和非线性振子模型[103],这些模型展现出大量令人惊讶的动力学现象[104, 105]。

采用高阶网络的框架[4, 7, 9, 15],同时继续假设相关动力学仅编码在节点上,意味着需要考虑两个以上节点之间的多体高阶网络相互作用的影响。在此背景下,高阶动力学会产生令人惊讶的效应,如同步[7, 9, 106–108]和传染过程[109–111]中不连续的“爆炸性”相变,而相应的成对模型仅表现出连续的二阶相变。

将传染模型的讨论留至第6节,我们在此讨论针对节点信号所提出的高阶同步模型。这些模型包括考虑了与高阶相互作用相关的高阶耦合的藏本模型推广,导致了丰富的动力学现象,包括急剧同步转变[106, 107]、异宿动力学[112, 113]和混沌[114]。另一种针对泛型超图定义的高阶同步方法[57, 115],假设与高阶网络节点相关的振子是相同的,从而推广了耦合相同振子的经典成对方法[86]。有趣的是,一个重要的开放性研究问题是识别与高阶网络不同表示相关的动力学性质。这包括超图与单纯复形之间的对比[116],还包括高阶相互作用的方向性等方面[117, 118],这些方面可能是集群同步或更复杂动力学涌现所必需的[119]。

所有这些方法都假设高阶相互作用是给定的,并提出了节点层面高阶动力学的机制[9]。这一研究方向引起了广泛关注,还因为预测真实网络(如脑网络)中节点的动力学是一项重大的科学挑战。在此,我们提及在此背景下提出的两个主要研究问题。第一个问题是,是否有可能将高阶相互作用的作用与耦合函数选择的作用区分开来。由于耦合函数的选择可能已经为观察到的奇异动力学状态(如不连续转变[108])提供了解释,回答这个问题可能涉及对所研究物理系统本质的考量。第二个观察是,在缺乏高阶相互作用结构和耦合函数实际知识的情况下,对真实复杂系统动力学状态的观察可能导致由成对相互作用涌现的有效高阶行为[11]。事实上,人们发现,在线性化后,某些被考虑的高阶相互作用[106, 107]与成对相互作用是无法区分的,而成对相互作用的相位缩减可导致有效的高阶模型[89, 120]。寻求能够解决该理论这两个重要方面的综合理论框架,很可能成为这一活跃研究主题的核心议题。

另一类在节点层面发生的基本动力学过程是随机游走。近期已提出了在正则[121]或泛型超图[122]上随机游走的推广;节点间的转移概率可能依赖于超边的大小,从而决定了与在(加权)团投影网络上移动的随机游走不同的行为。这一观察带来了两个相关后果。首先,当使用随机游走来对节点进行排序时,考虑超图结构或网络结构时节点的重要性可能不同[122],例如,科学论文作者的h因子可能取决于合著者的数量。其次,随机游走可用于通过马尔可夫稳定性[123, 124]来检测社区,在这种情况下,超边大小对转移概率引入的偏差可能决定不同的社区结构。

4.2. 单纯复形与超图上的渗流

渗流是定义在网络上的一种基本临界现象,通常用于探测和评估从生物网络到复杂基础设施等各类复杂系统的鲁棒性[100, 125, 126]。渗流监测网络巨连通分量中节点的比例随节点或边被停用或从网络中移除的概率的变化情况。由于网络的巨连通分量确保了所需的连通性,以允许网络中不同节点之间的通信或维持从一个节点到网络中其他远处节点的扩散过程,观察到一个渗流簇可被视为研究网络上相关集体现象的最低先决条件。此外,渗流过程本身的性质适合研究来自不同随机过程或网络拆解策略的不同类型故障的影响。

鉴于渗流对简单网络具有极大的重要性,一个重要的研究问题是:复杂系统的高阶网络表示在多大程度上改变了渗流转变的性质以及关于底层复杂系统鲁棒性的结论。这是一个具有多重应用的非常活跃的研究领域:一方面,渗流过程与将在第6节讨论的传染和流行病传播过程密切相关;另一方面,渗流性质反映了所研究网络对节点、边(超边)或高阶单纯形随机故障的鲁棒性。

由于在成对网络中,渗流可能源于节点损伤或边损伤,我们将此过程与前一节(仅考虑节点动力学)分开讨论。正如我们将看到的,该研究领域还将为我们接下来要讨论的高阶拓扑动力学提供重要的引介。

我们区分高阶网络上的三种主要渗流动力学类型。第一种是超图上的渗流,其中我们可以损伤节点或超边,且如果一个节点受损,其在原始超图中的关联超边的节点数将减少一个。这也称为因子图渗流。这种类似渗流的动力学反映了一种常见情况,例如在社交媒体中,当一个节点停用后,社交群体并未解散,而是仅被重新定义为减少一个成员(停用成员)的群体。如果将超图表示为多层网络[21, 110](其中每一层仅包含给定基数的超边),则该渗流问题可通过进一步的组合动力学得到丰富。事实上,所得多层超图中编码的关联性可用于定义协同超图渗流现象,展现出三临界点和不连续转变[21],从而证明了超图的鲁棒性如何受到定义多层超图结构中相互依赖关系的组合规则的影响。此类类似渗流的动力学对于定义(k, q)-核渗流问题[127]也至关重要,并在社会动力学中具有重要影响[128]。

与上述超图渗流定义形成鲜明对比的是另一种模型定义,其中如果超边的一个节点变为非活跃状态,该超边会立即停用。例如在化学反应网络中,反应物的缺失会阻碍反应发生;或在供应网络中,供应的缺失会阻碍商品的生产。这种第二种超图渗流定义导致超图鲁棒性的显著降低,即更高的渗流阈值,其影响对于具有大基数超边的超图尤为严重,且其影响不仅对渗流强烈,对相应的(k, q)-核渗流问题也是如此[129, 130]。有趣的是,因子图渗流与超图渗流可在最近提出的存在锚节点情况下的超图渗流方法中结合[131]。在此设置中,锚节点对定义超边的活跃性至关重要,而非锚节点的损伤仅减少超边的基数。这在单层和多层超图上均导致了有趣的临界现象。

最后,还可以定义拓扑渗流,其特征为不同类型的渗流问题,定义单纯复形在拓扑损伤下的连通性[132]。所谓拓扑损伤,我们指不仅对节点和边造成损伤,还对单纯复形的高维单纯形(如三角形或四面体)造成损伤。拓扑渗流转变指示了随着受拓扑损伤影响的单纯形比例增加,k-连通巨分量何时消失。文献[132]表明,同一单纯复形可表现出多个拓扑渗流转变,其渗流阈值取决于所考虑单纯形的维度。例如,在同一单纯复形上,三角形渗流的阈值可能不同于边渗流。此外,更令人惊讶的是,转变的性质也可能取决于所考虑单纯形的维度。特别是,文献[132]提供了一个单纯复形的例子,其中三角形渗流属于Berezinskii-Kosterlitz-Thouless普适类,而边渗流则表现出指数临界行为。

4.3. 拓扑信号的同步与扩散

采用网络动力学的高阶方法意味着将动力学变量(也称为拓扑信号)不仅与节点相关联,还与单纯复形的边及高阶单纯形相关联(见图4)。高阶拓扑动力学这一新兴领域[10]将代数拓扑与非线性动力学相结合,揭示了拓扑信号的新动力学状态。该领域在复杂系统中具有广泛应用,并为大脑与气候研究开辟了新前景,并导致了支撑新一代人工智能算法的动力学过程。

尽管传统上网络动力学的表征一直以节点为中心的观点为主导,但拓扑信号[133]无处不在,包括细胞内的分子输运通量、大脑中的突触信号以及脑区之间的边信号[134]。有趣的是,诸如代表海洋电流[135]或给定高度风速的矢量场也可以投影到地球剖分的边上,并可作为拓扑信号(即上链)处理。

高阶拓扑动力学包括重要的集体现象,如由拓扑高阶藏本模型[25, 136]捕获的拓扑同步、全局拓扑同步[90, 137]以及拓扑扩散与随机游走[135, 138]。当定义在不同单纯形(例如边)上的拓扑信号通过共享节点和/或高阶结构(如共享三角形)进行局部耦合时,就会出现此类集体现象。在高阶拓扑扩散中,稳态是静态的,而在高阶拓扑同步中,人们观察到一种集体现象,其中所得动力学定位于单纯复形的空洞上。在这两种情况下,拓扑与高阶动力学都紧密相连。

拓扑同步导致了对高阶网络上同步状态的完全新解释,这证明了拓扑与动力学之间的强烈相互作用。特别是,高阶拓扑同步通过建立同步动力学的空间模式来“学习”拓扑,该模式并非弥散在单纯复形的所有单纯形上,而是定位于这些结构的n维空洞上。结果已在不同方向上得到推广,例如考虑有向、加权单纯复形[139]。这些连接高阶网络同步状态的新结果是理解大脑中拓扑与动力学相互作用最有前途的理论框架之一,并为研究开辟了新前景。特别是,一个核心问题是:同步动力学定位于这一个还是那一个空洞上,能否携带信息并与存储记忆的吸引子相关联。一个相关的问题是,是否有可能制定方法来控制和调制拓扑同步将在哪个可能的简并态上发生。

虽然拓扑高阶藏本模型的同步状态定位于空洞上,但一个重要的问题是是否可能观察到全局拓扑同步[90]。在这方面,已表明全局拓扑同步(即每个n维单纯形(边、三角形等)上的拓扑信号表现出相同行为的状态)仅可能发生在某些特定且非常规则的拓扑上。事实上,全局拓扑同步将定位于单纯复形的n维空洞上,类似于拓扑藏本模型所发生的情况。然而,要要求全局同步状态,我们需要考虑n维空洞“跨越整个结构”而非定位于少数单纯形的拓扑。我们可以观察到拓扑全局同步的主要拓扑示例是高维环面的方格剖分,在那里我们可以观察到每个维度的拓扑信号的全局拓扑同步。然而请注意,一般而言拓扑全局同步状态非常罕见,而且如果单纯复形未加权[137],它们也可能阻碍奇数维拓扑信号的同步。

4.4. 由拓扑狄拉克算子驱动的耦合拓扑信号动力学

到目前为止,我们仅讨论了给定维度的拓扑信号(边信号、三角形信号等)孤立地 taken 的动力学。然而,单纯复形与胞腔复形的动力学包含每个维度的拓扑信号的演化,这些信号可以以非平凡的方式相互耦合。拓扑狄拉克算子[5]是关键算子,它允许共存于同一单纯复形或胞腔复形上的不同维度拓扑信号之间进行串扰。拓扑狄拉克算子可被解释为拉普拉斯算子的“平方根”,它有效地充当导数的拓扑版本:在网络上,它对节点信号执行梯度运算并将其归属于边,同时对边信号执行散度运算并将其归属于网络的节点。拓扑狄拉克算子源于格点规范理论中定义的Kogut-Susskind[140]交错费米子,但直到最近才被提出[5]作为研究高阶网络上拓扑动力学的关键算子。拓扑狄拉克算子确实可用于定义高阶网络的拓扑狄拉克方程[5],这对于定义简单网络与高阶网络的质量[141]至关重要。此外,拓扑狄拉克算子对于研究耦合拓扑信号的拓扑同步至关重要,无论是在类拓扑藏本模型[142, 143]的框架下,还是在拓扑全局同步模型[144]的框架下。由于高阶网络的动力学编码在这些结构上定义的所有拓扑信号上,拓扑狄拉克算子可以为拓扑图灵与类狄拉克模式提供新见解,这些模式包括静态[145]与动力学模式形成[146]。在此背景下,人们观察到有趣的崭新现象。例如,在此背景下,对于相互作用的节点与边信号,两者均为抑制剂时可能出现图灵模式,而这种组合在网络节点上反应与扩散的物种情形下永远不可能产生模式。最后,正如我们将在机器学习部分看到的,拓扑狄拉克算子作为拓扑机器学习的基本代数拓扑算子正引起越来越多的关注。

4.5. 由三元相互作用驱动的动力学

三元相互作用是一类高阶相互作用,无法通过高阶网络节点之间的单纯形或超边来刻画。当两个或多个节点之间的相互作用受到网络中其他节点的调节或调制,从而显著影响高阶网络的动力学时,就会发生三元相互作用。自然系统中存在三元相互作用的证据是多方面的:在神经网络中,神经元之间的突触活动受到胶质细胞的正面或负面调制[147];在生态网络中,两个物种之间的竞争可能受到第三个物种存在的影响[148]。尽管三元相互作用在神经科学和生态学中已被广泛接受,但直到最近,它们才开始吸引数学家和理论物理学家的兴趣,用于在基础层面上研究高阶网络动力学。

近期研究[22, 149]表明,三元相互作用可导致三元渗流,并能解释网络或超图的巨连通分量随时间变化的情况,正如在脑网络或气候网络中所发生的那样。所提出的三元渗流模型假设调控相互作用可带符号(即具有正或负的作用),并表明在此情景下,渗流成为一个完整的动力学过程,其中巨连通分量的大小呈现出倍周期分岔及通向混沌的路径。该结果为功能连接强烈依赖于时间的真实系统(如脑网络)提供了启示。有趣的是,空间网络上的三元渗流[150]还能解释巨连通分量拓扑结构的变化。

三元相互作用正被越来越多地研究,以探究神经网络的性质,该方向的工作包括存在三元相互作用时的神经网络模型(如霍普菲尔德模型和联想记忆的一般模型[151, 152])以及神经介质模型[150],从而为理解脑网络的时空动力学性质提供了洞见。

除了能够刻画三元相互作用下动力学的模型外,近期还提出了一种基于TRIM算法实现的新信息论方法,用于推断三元相互作用[153]。该算法已应用于基因调控网络中三元相互作用的推断,但该方法也可推广至一般网络数据,如气候数据。

尽管超图、单纯复形与具有三元相互作用的网络通常是捕获高阶相互作用的首选组合结构,但由此引发的问题是:其他组合结构是否也与网络动力系统相关。这些可能的推广示例包括:用于高阶网络动力学的耦合细胞网络形式体系[118]、有向超图[117, 154](集群同步或更复杂动力学的涌现可能需要此类结构[119]),以及高阶相互作用的进一步多重集推广[155]。阐明此类新组合结构的组合性质提供了一个令人振奋的研究机遇;另见第2节。

5.高阶机器学习

高阶网络正处于机器学习与人工智能研究的前沿。该领域受到关注并具有重要相关性,主要源于两个重要考量。首先,人们认识到,超越现实复杂系统中相互作用的成对描述具有重要意义。其次,人们意识到拓扑信号无处不在,且在许多情境下,突破基于节点的高阶网络动力学描述至关重要。

在结构层面,AI算法可采用高阶网络的超图表示或单纯复形表示。高阶机器学习中的一个核心问题是:如何从与拓扑空间元素相关联的数据中提取信息。一方面,这通过拓扑数据分析(TDA)实现,其核心思想是将嵌套的拓扑空间与观测数据相关联,并从这些空间的性质中提取信息,从而捕获编码在高阶网络结构中的信息。另一方面,这通过拓扑信号处理(TSP)实现,其重点在于从定义于拓扑空间元素上的信号中提取信息。广义而言,信号是指从空间元素(无论是点、边、多边形等)到实数域的映射。信号的示例包括:定义在时空点上的势值、定义在图边上的流量数据,以及与用于表示三维物体表面几何的三角网格相关联的单纯复形面的颜色。

拓扑信号处理(TSP)的显著特征在于,用于从信号中提取信息的算子是专门针对信号所定义的域而定制的。特别是,TSP 工具可用于开发基于拓扑描述符构建的学习算法,从而导向拓扑深度学习(TDL)。在 TDL 中,学习既包括从定义在拓扑空间上的数据中学习,也包括学习待与观测数据相关联的空间结构。

5.1. 超图表示学习

高阶相互作用揭示了无法总是简化为成对关系的结构模式,但可以使用超图进行形式化表示[156]。由于它们在众多应用中无处不在,利用超图从其结构或可与超图元素相关联的数据中提取有意义信息的兴趣日益浓厚。基于超图的表示与机器学习的融合正成为一个密集的研究领域,因其具有巨大的潜力。超图表示学习(或称超图嵌入)旨在将超图嵌入到低维空间中,从而保留结构信息,以便利后续任务(如节点聚类)。关于使用超图进行机器学习的开创性工作(涵盖聚类、分类与嵌入)由文献[157]提出。关于超图学习的全面综述,见[158, 159]。近年来,在扩展图神经网络(GNNs)潜力的基础上,研究者提出了超图神经网络(HNNs)[160],并在多种应用中展现出显著成果,包括缺失代谢反应预测[161]、功能脑网络分类[162]、交通流预测[163]以及计算机视觉[164]。关于 HNNs 的最新综述见[165]。同时,人们也日益关注为经典优化问题(如图着色[166]、匹配[167, 168])以及超图划分[169]制定高效的超图求解器(关于该主题的最新综述,我们指引读者参考[170])。

基于超图的学习可以以不同方式进行,具体取决于超图结构是先验已知的还是必须从数据中推断的。此外,当给定超图时,我们可能拥有与其节点和超边相关联的标签(特征)。在此情况下,我们将超图称为定义域,并将存在于超图上的特征空间称为陪域(值域)。陪域通常是多维向量空间,但并非绝对,因为特征也可以是分类变量。当数据为数值时,超图信号被定义为从定义域到其陪域的映射。该框架的有趣之处在于,定义域的确定使得我们能够推导出用于分析定义在该定义域上的信号的工具,这些工具专为该定义域定制,且能够捕获定义域本身的性质。一个典型范例是图信号处理(GSP),其中图傅里叶变换(GFT)被定义为将定义在图节点上的信号投影到由图拉普拉斯矩阵的特征向量所张成的空间上[171]。然而,图仅是超图的一种极简单情形,只能编码成对关系。近年来,多项研究推广了该方法,以开发适用于捕获高阶关系(如单纯复形或胞腔复形)的拓扑空间的处理工具[133, 172–175]。

5.2. 拓扑数据分析(TDA)

TDA是一种利用代数拓扑概念来研究数据形状与结构的框架[8]。TDA中的关键工具之一是持久同调,它通过追踪不同尺度下连通分量、环路与空洞等拓扑特征的产生与消失,为数据提供多尺度表示[71]。TDA在分析高维、含噪及复杂数据集时尤为有用,而在这些场景下,传统统计或机器学习方法往往难以捕获底层的几何结构。

TDA中的一个基本概念是过滤(filtration),它是一系列嵌套的拓扑空间,描述了结构随尺度参数变化的演化过程。给定点云数据集,通常使用Vietoris-Rips或Čech复形[72],基于点之间的成对距离逐步连接各点来构建过滤。随着尺度参数增大,连通分量、环路和空洞等拓扑特征不断出现与消失,它们在多个尺度上的持续性以持久图或条码图的形式被记录下来。

TDA被广泛应用于多个领域,包括生物学(如蛋白质结构分析)、神经科学(如脑连接)以及机器学习(如用于分类的特征提取)[72]。TDA的核心思想是利用单纯复形从数据点构建拓扑空间,然后提取有意义的拓扑不变量。这些不变量为理解数据的形状与连通性提供了洞见。TDA的一个关键优势在于其跨不同数据类型的泛化能力以及对噪声的鲁棒性。与主要捕获成对关系的基于图的模型不同,TDA考虑了高阶结构,使其成为揭示数据集中复杂相互作用的有力工具。TDA的进展激发了拓扑机器学习中的新方法,其中持久图与拓扑特征被整合到神经网络架构中,用于分类、聚类和生成建模等任务[176]。

TDA的最新进展已将其应用扩展至定义在超图上的数据。超图通过允许边(超边)连接多个节点来推广图,自然地编码了复杂数据集中存在的高阶相互作用[177]。基于标准图的TDA技术通常难以捕获这些丰富的关系,因而需要针对超图拓扑分析的新框架。

持久同调自然地定义在数据的单纯复形表示上。然而,通过从超图结构(如团展开或其他高阶表示)构建单纯复形,持久同调可被适配应用于超图[178]。通过分析所得的持久图,研究人员可提取关于数据高阶拓扑的有意义洞见,从而改进聚类、异常检测与特征提取[179]。此外,基于由超图导出的下确界链复形与上确界链复形,已发展出持久嵌入(上)同调,用于刻画超图本身的内在拓扑,而非其关联的单纯复形[80, 180]。

基于超图的TDA应用包括材料科学[181–183](其中高阶相互作用涵盖了超越简单二体力的广泛耦合)、生物网络[184](包括基因相互作用研究)以及分子相互作用(如蛋白质-配体相互作用[180]),以及机器学习中的高维嵌入[185]。TDA与超图表示的融合为超越传统图结构理解复杂数据集提供了一条前景广阔的途径。

持久同调计算需求高,在实践中通常仅限于低阶同调类。若这构成过度简化,通常的做法是选取高阶关键单纯形的一个子集。为应对这一挑战,学界已将大量注意力投向基于拓扑狄拉克算子的量子算法研究[186–189],旨在克服经典持久同调算法的计算局限。然而需注意,这些算法的量子加速仅在全阶相互作用(单纯形、团)的完整信息已知时才能实现[190]。为应对该挑战,近期[191]已在物理上实现了一种通用可编程光量子处理器。该处理器可利用高斯玻色取样算法优先选择加权网络中高权重稠密子图的能力,来识别加权k-团并估计贝蒂数。因此,这种光量子计算方法为量子增强型TDA开辟了新前景。

5.3. 拓扑信号处理(TSP)

近年来,代数拓扑与机器学习相结合以重构拓扑信号,为信号处理开辟了全新的视角,催生了新兴的TSP领域[133, 172, 192],并推动了我们在下一段将讨论的拓扑深度学习(TDL)的进一步发展。该领域正引起越来越多的关注,因为拓扑信号在众多应用中具有广泛的重要性,尤其是脑科学研究[134]。

TSP的独特之处在于,它能够推导出捕获信号所定义空间内在性质的算子。从历史上看,首次深入探讨这一思想的重要框架是图信号处理(GSP),在该框架中,数据与图的顶点相关联,而成对信号之间的关系则由对应顶点之间是否存在边来编码[193]。在GSP中,一个关键算子是图傅里叶变换(GFT),其定义为将定义在所有顶点上的全部(标量)参数集合所对应的向量,投影到由图拉普拉斯矩阵的特征向量所张成的空间上。其基本思想是,如果信号在图上是平滑的——即它在每个簇内缓慢变化,尽管在不同簇之间可能任意变化——那么该信号的GFT近似是稀疏的。恢复信号的稀疏表示是一项关键特性,它使得仅通过观测部分数值子集即可实现整体信号的采样与重构[194]。GFT的存在也是研究作用于图上的滤波器性质的基础[193]。通常,滤波器被定义为一种局部化算子,用于聚合与邻近顶点相关联的数据,其作用是降低噪声影响,或相对于频谱的其他部分突出特定频段[195]。

在GSP中,信号通常仅与图的顶点(即单点集)相关联。然而,在许多应用中,数据与具有更高基数的集合相关联,例如:与节点对相关联的流量数据;或合著论文数量,其中每个数值对应于所有合著者构成的集合。一般而言,由此便可引出拓扑信号处理(TSP)的概念,即处理定义在拓扑空间上信号的方法。在这些情况下,数据之间的高阶关系可以使用单纯复形进行编码。将研究范围限定于结构更严谨的域(如单纯复形),使得能够以严谨的理论基础推导出明确定义的谱表示,并由此衍生出相应的采样理论与谱滤波器设计方法[133, 172, 196]。该框架也已扩展至胞腔复形[173–175]。

拓扑信号处理方法的一个核心方面是霍奇分解,它提供了一种严谨的信号处理途径:通过特定算子区分信号的不同分量,且这种区分方式能够反映信号所在空间的基本拓扑性质。这些方法的一个有趣应用是处理定义在一组点(即点云)上的矢量场。通过适当的三角剖分,可以构建点云的网格表示。随后,矢量场(即定义在图顶点上的一组向量)可被转换为定义在单纯复形各边上的一组标量值[133]。随后可对这些(流)信号进行滤波处理,借助霍奇分解突出例如旋度或散度分量,最终结果可重新映射回(滤波后的)矢量场,正如文献[133]所建议的那样。

如前所述,采用单纯复形或胞腔复形能够揭示诸多可被高效利用的性质,但缺乏超图表述所具备的完全通用性。近期的工作引入了一种基于张量的表示来处理定义在超图上的信号的更一般情形[197]。从融合了拓扑信号的超图数据中提取信息并进行学习,在深化我们对复杂系统动力学的理解方面具有巨大潜力[19]。然而有趣的是,文献[20]的作者证明,定义在超图上的信号可被等价转换为定义在加权单纯复形上的信号。该方法使得绕过无权单纯复形在表示高阶相互作用时的局限性成为可能。

TSP与霍奇分解的一个有趣应用是脑网络分析。文献[198]将霍奇分解应用于脑网络分析,通过将连接模式分解为梯度、旋度与调和流分量,有效捕捉了复杂的拓扑特征。借助基于Wasserstein距离的拓扑推断框架,该方法利用静息态fMRI数据,揭示了男女脑网络在拓扑组织上具有统计学显著性的差异。文献[199, 200]的进一步进展引入了一种基于持久同调的方法,该方法利用霍奇拉普拉斯算子检测并分析脑网络中的环状结构(拓扑环)。这些方法均通过数值模拟与静息态fMRI实验进行了验证。在相关研究方向上,文献[201]提出了一种抗噪声的脑电图(EEG)分析技术,该技术将持久同调与贝叶斯框架相融合,实现了对通常具有高噪声、非线性及非平稳特性的EEG信号的鲁棒分类。

5.4. 拓扑深度学习(TDL)

TDA的进展激发了拓扑机器学习中的新方法,其中持久图与拓扑特征被整合到神经网络架构中,用于分类、聚类和生成建模等任务[176]。当网络架构被设计为融入信号所在定义域的关键几何性质时,神经网络(NN)可能极其有效。卷积神经网络便是如此,当应用于定义在规则网格(如声音或图像)上的数据时,它利用了卷积算子的平移等变性。由此产生的架构显著减少了需训练的参数数量,并使学习过程更加鲁棒[202]。这一思想已被推广至数据定义在图或流形上的应用[203, 204]。近年来,深度神经网络已被推广至作用于高阶结构(如单纯复形)上的数据,从而催生了各种形式的单纯神经网络[205–207]——另见综述文献[208]。单纯神经网络与网络的霍奇表示已被应用于诸多领域,例如停电检测[209]以及智能电网中的虚假数据注入攻击[210]。

一个有趣的应用领域是生物数据建模。在该领域,基于图的学习面临的一个核心挑战是:如何仅利用有限的训练数据集对分子进行分类,甚至生成新型分子[211, 212]。消息传递神经网络的诸多进展正是为突破图神经网络(GNN)在Weisfeiler-Lehman图分类框架下表达能力有限的瓶颈而专门开发的[192, 213]。分子(尤其是此类对象)可被自然地建模为结构复杂的图,同时编码显式特征与隐式拓扑信息[214]。通过一种称为“提升”(lifting)的过程将高阶结构(如单纯复形或胞腔复形)引入分子图后,拓扑神经网络能够捕获并利用这些拓扑依赖关系,从而学习更具表达力的表示。霍奇理论亦被文献[216]用于分析生物分子结构。在此背景下,生物分子被建模为定义了边流的单纯复形,其中关联霍奇拉普拉斯算子的谱编码了结构性质,并为理解分子折叠与紧凑性提供了洞见。

在处理定义于不同阶子集(链)(如顶点、边与多边形)上的数据时,一个引人关注的挑战在于:这些特征是否应当并行处理,以及应如何处理。解决该问题的一个严谨途径是引入(离散)狄拉克算子[5]。文献[217]利用这一思想,将滤波器推导为狄拉克算子的多项式函数,由此催生了所谓的“单纯注意力神经网络”架构,该架构还包含一个作用于不同阶信号(上链)的注意力机制。

另一个有望对拓扑学习产生深远影响的数学框架是层理论(sheaf theory)[218]。文献[219]分析了层理论原理在信号处理中的应用。其中,与信号处理和学习尤为相关的结构是胞腔层(cellular sheaf)。当应用于定义在图上的数据时,胞腔层由与各顶点关联的向量空间,以及与图中各边关联的线性映射(称为限制映射)共同构成[220]。该定义可进一步推广至单纯复形等高阶结构,涵盖从边到三角形等的线性映射。在此类模型中,核心算子为层拉普拉斯算子,它推广了经典的霍奇拉普拉斯算子,并将限制映射纳入其中。

将层理论应用于机器学习的一个关键步骤是从数据中推断层拉普拉斯算子;文献[221]针对该问题提出了一种可能的解决方案。近期研究进一步拓展了该方向,实现了仅从数据中同时推断限制映射的结构与图拓扑[222]。基于层的模型亦与深度神经网络相结合,作为GNN的推广范式——例如文献[223]表明,层扩散模型具备诸多优良特性,能有效克服经典图扩散方程(及对应GNN模型)的局限,并在异配性(heterophilic)等场景下取得极具竞争力的性能。

6.高阶网络科学:从理论到应用

高阶相互作用代表了在实际场景中网络拓扑上动力学过程数学分析的下一个自然步骤[4]。采用超图、单纯复形及更一般的胞腔复形等高阶结构,能够以简约而富有表现力的方式,跨领域刻画由群体介导的机制。引入高阶动力学(第4节)深化了我们对涌现现象的理解,并揭示了成对模型中所不具备的行为:高阶相互作用能够重塑阈值、稳定性与系统响应,这对同步[106]、传染过程[109]及渗流[132]等均已产生经文献证实的影响。超越节点状态,定义于边与高维单纯形上的拓扑信号对复杂系统中的通量进行了编码,例如洋流或脑网络中的动态连通性。集体动力学的研究(第4.3节)——包括骤变或多稳态同步——在本质上可能迥异于基于节点的传统研究[25]。

在下文中,我们将围绕高阶建模正逐步改变研究议程的四大应用前沿展开讨论。在流行病传播中,群体暴露与非线性传播规则会改变有效传播率与相结构,这对模型推断与防控策略具有重要启示。在博弈论中,嵌入高阶结构中的多人交互揭示了仅靠二元互动无法实现的合作模式与相变。在社会网络分析中,高阶表示与隶属关系及群体数据天然契合,使得中心性、中尺度结构与模体分析能够与多层次网络结构保持一致。在脑科学研究中,有向高阶模体、边/面级信号与拓扑描述符将微观至中尺度的组织结构与功能动力学紧密联系起来。

网络科学最终依赖于实证数据,下一步在于协同设计实验,以便能够观测、量化高阶相互作用及其相关动力学,并将其融入模型构建之中[224]。这一视角确保高阶网络科学始终与数据紧密耦合,从而在各学科间建立起稳健的“理论–实验”反馈闭环。

6.1. 流行病传播

流行病传播是网络上的关键动力学过程,其中底层接触网络的拓扑结构在塑造疫情特征方面发挥着至关重要的作用。传统模型通常将接触简化为个体间的成对交互,却忽视了现实社会与生物系统中普遍存在的高阶交互现象,例如集体会议、共享环境或小群体内的并发传播[4]。这些高阶结构能够通过改变有效传播率[109, 225–228]、引入非线性效应以及影响爆发阈值,从根本上改变流行病传播动力学。然而值得注意的是,群体权重的异质性甚至可能为简单传染过程诱导出表观上的超线性特征,从而增加机制推断的复杂性[229]。借助单纯复形与超图等框架,将高阶相互作用纳入流行病模型,能够为传染过程提供更为真实的刻画[6, 230, 231]。

简单传染框架在流行病建模中被广泛应用。该框架假设,单次暴露即可导致感染者与易感者之间发生传染。然而,现实中的流行病动力学往往涉及复杂传染机制,即个体需暴露于多名感染者方可完成传播[232]。高阶网络为刻画流行病中的复杂传染机制提供了理想框架。

从理论视角来看,高阶相互作用可能导致暴露于感染接触的频率与感染风险之间呈现非线性关系,进而诱发新颖的临界现象[233],如不连续混合相变、超指数级传播及滞后效应[111],这些现象已部分获得实证研究的支持[234, 235]。面向防控的分析进一步揭示了多群体单纯复形SIS模型中的双稳态特性与特定参数域[236]。此外,底层高阶网络的结构对临界性质具有强烈影响,例如超度相关性[21, 237]以及超边重叠程度[227, 228, 238–240]。

从实证视角来看,文献[241]提供了实验证据,表明行为通常以“复杂传染”的形式传播,即需要多个强化源的共同作用,这正是高阶相互作用的典型特征。作者证明,基于经典路径长度定义的中心性度量与种子节点选择策略,往往难以准确识别对复杂传染传播最有效的网络特征。

超越无记忆的单病原体场景,单纯复形上的非马尔可夫高阶传染过程与病原体竞争机制会引入额外的分岔现象与动力学相[242, 243]。尽管高阶相互作用催生了丰富的动力学现象,且解析与数值研究已带来诸多深刻见解,但将高阶网络模型应用于真实世界的流行病防控仍面临挑战。将高阶网络模型应用于现实疫情的主要挑战之一,在于高阶接触网络数据的获取极为有限。如何从实证数据中有效区分简单传染与复杂传染仍是一个开放性问题,而这对选择最适配的流行病建模框架至关重要[244, 245]。

6.2. 博弈论

自创立以来,博弈论为n体策略互动提供了一个框架[246, 247]。当应用于结构化群体(主要在演化博弈论中)时,历史上的研究重点一直集中在网络上的成对博弈,这些博弈被广泛用于研究社会困境,如囚徒困境、猎鹿博弈和雪堆博弈[248–250]。这些模型强调了网络互惠在维持合作中的作用[251]。在此基础之上,成对网络上的群体博弈(尤其是公共品博弈)将分析扩展到了集体互动[252–254]。

与此同时,聚焦博弈论的研究探讨了广义多人情境中的均衡,但往往忽视了结构化群体的作用[255–257]。近年来,策略互动已使用单纯复形和超图等更高阶结构突破了成对动力学的限制进行建模[258–262]。在这些情境中,收益是在群体层面产生的,因此每条超边的大小和组成直接调节边际回报、阈值以及协同效应与折扣效应之间的平衡。重叠的群体成员身份将单个参与者参与的多个博弈耦合在一起,产生了跨群体反馈,并可能改变均衡选择与吸引域的大小。这些机制产生了在二元模型中缺失或罕见的现象,包括双稳态以及向合作的不连续跃迁,这些现象现已在更高阶社会困境中被观察到[263]。更高阶框架还允许不同的策略情境在同一群体中共存,例如通过为不同类型的超边分配不同的收益或规则,这为在单一模型中比较公共品、协调与反协调博弈提供了灵活的研究框架[262–264]。适应性更高阶博弈进一步揭示了在拓扑与策略协同演化下的稳定性特性[265],而更高阶情境也重塑了超越经典困境的互动,包括信号博弈[266]。

尽管取得了这些进展,一个将更高阶网络的灵活性与多人博弈的普适性相结合的统一框架仍然是一个尚未实现的目标。这样的框架将能够系统地探索社会、生物和经济系统中的策略互动,阐明群体结构、重叠与组成如何塑造策略行为与集体结果。

6.3. 社会网络分析与社会传染

传统的成对表示往往难以充分刻画驱动社会系统的机制,在社会系统中,互动是由群体、多向隶属关系或时间有序的路径产生的。更高阶模型沿两个互补的轴线捕捉这些特征。首先,基于群体的表示(超图、单纯复形)编码了行动者集合之间的互动,使得能够直接分析中观结构,如重叠群体、高阶模体及其在扩散与协调中的作用[260, 262, 267]。其次,基于路径的高阶(记忆)模型捕捉社会互动序列中的非马尔可夫依赖关系,这强烈影响扩散速度、可达性与可控性[224, 268, 269]。

一项核心任务是从数据中推断高阶结构。除了将群体投影为成对链接外,近期的工作利用带时间戳的单纯形来追踪开放三元组或k元组如何闭合为高阶互动,并以此制定了高阶链接预测基准(“单纯形闭合”)与学习任务[270]。该研究计划已产出实用的预测器,这些预测器偏好局部高阶特征而非长程信息,并已被扩展至特征感知情境,例如影响群体形成的高阶同质性[271, 272]。与此同时,中心性与中观结构已被推广至高阶情境:张量/非线性特征向量中心性量化了节点与超边的重要性[273, 274],而超图中的社区检测现在在植入模型(包括稀疏情形)下享有了一致性与恢复保证[275–277]。这些工具使得分析者能够在群体层面而非仅成对层面推理影响力、混合与角色。

社会传染提供了一个特别清晰的领域,在此高阶建模改变了结论。实证表明,许多行为需要多源强化(复杂传染),这更青睐于聚类或重叠的群体结构[241, 278],见图5。

打开网易新闻 查看精彩图片

单纯复形与超图上的高阶传染模型形式化了这些机制,并揭示了相对于成对扩散的定性转变,包括不连续转变、滞后效应以及全局级联所需的拓扑先决条件[109, 111, 228, 230, 231]。在方法学上,通过利用感染顺序模式与局部拓扑结构,从单次级联中区分简单传染与复杂传染是可行的,这为从数据到机制搭建了桥梁[244]。综上所述,这些结果表明,播种(种子节点选择)、靶向与评估策略应在高阶空间(超边、模体、路径)中进行设计,而非仅依赖节点级中心性或最短路径度量。

最后,由于网络科学依赖于数据,未来的进展将取决于协同设计的实验与平台,这些实验与平台需以足够的分辨率记录群体互动[279]与时序路径。这包括对在线社区进行数据化监测以及开展实地研究,以捕获明确的群体事件、标注的高阶关联以及具有时间分辨率的参与记录,从而实现对高阶暴露、强化及其对采纳行为因果影响的直接估计。

6.4. 脑网络

理解大脑功能需要捕捉超越二元元素的相互作用。认知与行为动力学通常源于神经元群或脑区群体的集体活动,实验与理论研究均已表明成对描述是不充分的。例如,对大鼠体感皮层记录的分析表明,同步群体放电只能通过包含三阶或四阶相互作用来解释,仅靠成对统计无法做到[280]。这一结果与Schneidman及其同事的开创性发现[281]形成对比,后者表明仅受成对相关性约束的最大熵模型已能捕获视网膜群体的大部分集体活动,暗示强集体态可能仅由弱成对相互作用产生。这两项研究共同凸显了神经元层面持续的争论:高阶模型是否真正必要,抑或一旦在合适尺度上考量,低阶相互作用便已足够。这种张力推动了当前旨在确定高阶依赖性何时不可化约的研究努力,并确立了研究微环路活动与中尺度组织的重要性。

两个互补的尺度尤为相关。在细胞与微环路层面,有向连接至关重要:突触将信号从突触前神经元传递至突触后神经元,而有向单纯复形等推广模型允许对具有唯一源和汇的神经元团进行建模。有向团已在新皮层模型中被识别,它们塑造了刺激-响应模式[185];在纹状体环路中,与疾病相关的退化会改变模体分布[282]与功能连接[283],这对帕金森病具有启示意义。另一个微观示例来自三元相互作用,它捕捉了诸如轴突-轴突突触或三联体突触处星形胶质细胞调控等调制性影响。基于三元渗流的建模方案[150, 284]展示了此类调控如何动态重构神经元连接并产生复杂的时空活动模式。

在脑区的中尺度层面,功能连接组通常被表示为加权图,但以边为中心及高阶表示提供了更丰富的视角。边时间序列与边功能连接揭示了重叠的中尺度组织与瞬间共波动[285, 286]。高阶连接组学与多元高阶时间序列方法提取了三元组或更大区域集合之间的真实相互作用,相较于成对基线,改善了任务解码、受试者识别与脑-行为关联[287]。近期工作进一步展示了同调结构与高阶模型如何超越并优于成对描述符,捕捉受试者身份与功能组织,并系统比较了跨任务与状态的高阶相互作用(HOI)度量[288, 289]。扰动研究表明,神经调控可重塑冗余-协同平衡与高阶网络可塑性[290]。

从数据中推断真实的高阶依赖性仍是方法学的前沿。尽管拓扑方法通常假设相互作用是给定的,信息论则提供了发现工具。偏熵分解及相关框架将互信息推广,以将相互作用分解为冗余、唯一与协同分量[291]。应用于fMRI、EEG与MEG的研究揭示了协同作用的稳健特征——仅存在于多脑区联合活动中的信息——这些特征与认知功能相关,并随衰老而衰退,转向冗余[292, 293]。此类度量展现出作为生物标志物的前景,可补充结构与功能连接分析。

拓扑数据分析(TDA)提供了互补的方法来检测与刻画高阶组织结构。人类连接组中已报道存在团拓扑与空洞结构[294],这支持了如下观点:大脑的计算过程依赖于密集连接的神经元集群与类环路通路。持久同调分析流程已被应用于不同状态(从精神分裂症到药物调控)下的脑网络研究,而同调支架则能提取出区分临床组与对照组的环路代表元[295–297]。新兴的临床应用凸显了该方法在手术规划与预后预测方面的潜力,例如在癫痫手术中,切除组织表现出独特的拓扑特征[298]。

最后,连接高阶动力学与脑数据的方法学进展——如边/面信号、狄拉克与单纯形同步以及高阶推断——为构建整合模型指明了一条路径,旨在将微观与中尺度组织同功能动力学相联系[10, 25, 142, 143]。这些努力彰显了结构、动力学、拓扑与信息学视角如何能够融合为脑功能的统一模型。未来的进展将取决于系统化测量计划(结合密集神经生理学记录、多模态成像与大规模队列)与高阶推断及拓扑信号处理的方法学突破。通过贯通这些层面,高阶框架不仅有望提供对脑组织更真实的刻画,还能为临床转化提供切实可行的洞见。

原文链接:https://iopscience.iop.org/article/10.1088/2632-072X/ae3c4e/pdf