Networks beyond pairwise interactions: structure and dynamics

超越成对相互作用的网络:结构与动力学

https://arxiv.org/pdf/2006.01764

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

许多生物、社会和技术系统的复杂性源于其单元之间相互作用的丰富性。在过去的几十年里,各种各样的复杂系统已被成功地描述为网络,其中相互作用的节点对通过连边连接。然而,在面对面的人类交流、化学反应和生态系统中,相互作用可以发生在三个或更多节点的群体中,而不能仅仅用简单的二元组来描述。直到最近,真实复杂系统的高阶架构很少受到关注。然而,越来越多的证据表明,将这些系统的高阶结构考虑在内,可以极大地增强我们的建模能力,并帮助我们理解和预测其涌现的动力学行为。在此,我们对超越成对相互作用的网络这一新兴领域进行了全面的概述。我们首先讨论了表示高阶相互作用的方法,并对用于描述高阶系统的不同框架进行了统一的阐述,突出了现有概念与表示之间的联系。我们回顾了旨在表征这些系统结构的度量方法,以及文献中提出的用于生成合成结构的模型,例如随机和增长的单纯复形、二部图和超图。然后,我们介绍并讨论了关于高阶动力学系统和动力学拓扑的快速增长的研究。我们重点关注当扩展到超越成对相互作用时,表征标志性动力学过程(如扩散、传播、同步和博弈)的新型涌现现象。我们阐明了高阶拓扑与动力学特性之间的关系,并以对实证应用的总结作为结论,为当前的建模和概念前沿提供了展望。

I. 引言

对复杂系统的任何实质性理解都必须依赖于系统层面的描述。考虑以下练习:拿一个生态系统,并将其分解成它的各个部分。无论我们在单个物种层面的知识有多么好或准确,我们对种群动态(例如,不同物种的丰度如何随时间变化)的理解充其量都将是微乎其微的。当我们试图从人脑的单个神经元出发来解释癫痫发作时,或者从个体人类心理学出发来解释病毒式谣言在社会中的传播时,情况也是如此。所有这些方法都失败了,因为它们遗漏了任何复杂系统的一个基本要素,即系统组件之间非线性相互作用的丰富模式。经过多年的还原论之后,科学界已经放弃了这样一种观念,即通过孤立地考虑系统的单元就可以简单地理解和预测复杂系统的集体行为[1],并且现在比以往任何时候都更加接受复杂性作为支配我们所居住的世界的原则之一的观念。在这一范式内,网络已成为复杂系统的参考建模工具[2]。网络是定义相互作用发生的物理或虚拟空间的地图。将竞争和合作关系添加到生态系统中,将突触连接添加到人脑中,并将人类互动添加到谣言传播中,我们在自然界中观察到的自组织模式和集体行为便很容易开始展现出来,显得不再那么晦涩。建立在早期数学、社会网络分析和生态学工作的基础上,千禧年之交的一小批突破性论文引起了科学界的兴趣,在过去二十年里引发了数千项研究成果,并导致了网络科学这一新的多学科领域的形成。这个新的研究群体已经将图论和统计力学的一种不寻常的混合发展成了一门繁荣的学科,其应用涵盖了从基础物理一直到社会科学的全部科学范围。其边界和潜在应用还有待完全实现[2]。尽管如此,范围和工具的丰富性已经使网络领域成为一门独立的学科,通常被称为一门自成一体的科学。网络科学的增长也得到了包含社会、技术和生物相互作用详细信息的大型数据集日益广泛的可用性的加强,这些数据集为网络模型和预测的经验验证提供了原始材料。对于对初步了解网络科学感兴趣的读者,我们推荐关于该主题的几篇早期综述论文[3–6]和教科书[7–10]。

随着对现实世界系统探索的深入,网络科学家正在认识到需要进一步表征和丰富网络描述所捕获的关系。然而,这产生了一个问题:网络最初被理解为节点的集合(代表系统的基本单元)和边的集合(描述这些单元对之间相互作用的存在)。然而,在现实世界系统中的应用要求能够描述相互作用的更多细节[11],例如:有向边用于描述消息的起源和目的地;边权重用于突出相互作用的强度;甚至边上的符号用于区分一条连边是否编码了两个单元之间的有益或有害相互作用。近年来,人们投入了大量精力来形式化和发展数学工具以分析时间网络,其中相互作用不是静态的,而是在时间维度上展开[12]。类似地,许多研究最近考虑了相互作用系统的情况,其中单元可以通过不同性质的连边连接,并且可以用多重网络或多层网络来有效表示[13]。

所有这些方面在许多情况下都有助于更好的网络表示,但是网络本身是否足以提供复杂系统的完整描述?

网络的根本局限在于它们仅能捕捉成对相互作用(pairwise interactions),而许多系统展现的是群体相互作用。事实上,在社会系统、生态学和生物学等诸多例子中,许多连接和关系并非发生在节点对之间,而是发生在节点群体层面上的集体行动。例如,在复杂的生态系统中,三个或更多物种通常会竞争食物和领地[14]。在其他情况下,第三个物种的存在会影响另外两个物种之间的相互作用,直接改变的是相互作用本身(连边),而不是所涉及的物种(节点)。同样地,诸如“同辈压力”(peer-pressure)之类的社会机制,其本质就超越了二元连接(dyadic connections)的概念。集体相互作用并非一个全新的概念,在某种程度上,它们已经出现在早期的网络研究中。例如,意见形成动力学中的多数规则模型(majority-rule model),或演化博弈论中的公共物品博弈(public goods game)。除了这些例子之外,近年来网络科学中最成功的研究方向之一——复杂传染(complex contagion),也自然地考虑了多个同时发生的相互作用[15]。然而,在所有这些情况下,这些应用都试图借用成对网络的语言来描述高阶相互作用,例如通过使用二部图(bipartite graphs)[16]。我们能否转而寻找能够明确且自然地描述群体相互作用的数学框架?

单纯复形(Simplicial complexes)和超图(hypergraphs)是提供此类描述的自然候选者。事实上,在过去的几年里,对这些表示方法的热情浪潮,已经彻底改变了我们看待和处理现实世界系统的视野与能力,这些系统往往具有超越简单二元连接的特征。高阶相互作用的重要性在很久以前就已被认识到[17–19],但这种重新焕发的兴趣,为我们带来了关于高阶表示的崭新且更为深刻的理解。现在毫无疑问,超越二元相互作用,是解释和预测以往无法描述的集体行为的基础。

本报告旨在对超越成对相互作用的复杂网络的结构与动力学的最新研究现状进行综述,并为该领域的关键未解问题提供参考与展望。连同本引言,本报告的组织结构如下: • 第一部分(第II至IV节)侧重于具有高阶相互作用的系统的结构。具体而言,第II节介绍了支撑高阶表示的数学框架。第III节描述了目前用于刻画多体相互作用系统结构的最常用度量与性质。最后,第IV节回顾了高阶系统的随机模型,以及它们如何被用于进行统计推断。 • 第二部分(第V至VIII节)侧重于具有高阶相互作用的系统的动力学。更具体地说,第V节讨论了高阶扩散模型。第VI节描述了振子模型与同步现象的推广。第VII节介绍了具有群体结构的社会系统中传播现象的最新模型。第VIII节报告了多个主体(agents)之间竞争与合作的模型。 • 最后,第IX节概述了高阶相互作用系统在现实世界中的应用。我们的最终结论与展望在第X节中呈现。

我们在本前言的最后作一补充说明。在网络分析中纳入高阶相互作用的想法非常简单。就此而言,超越成对相互作用看起来似乎并不比在图的边上附加权重或符号更难。然而在实践中,从成对关系转向更复杂的相互作用结构却是一个棘手的问题,它需要高度的复杂性与新颖的数学工具。这就解释了为什么与加权、带符号的网络,甚至时间网络和多层网络相比,复杂系统在这一方面的分析进展严重滞后。毕竟,经典物理学早已知晓这一点:尽管两体问题存在闭式解,但给定位置和动量来求解 n n 个相互作用物体的运动轨迹,至今仍是一个未解之谜!

II. 网络的高阶表示

A. 高阶相互作用的基本表示

  1. 低阶与高阶表示

打开网易新闻 查看精彩图片

区分低阶和高阶相互作用有两个原因。首先,它突出了图论描述(塑造了近几十年来复杂系统的研究)与最近(重新)提出的基于真实群体相互作用的描述之间的差异。其次,它使我们能够清晰地构建这些描述之间的联系、它们的各种重叠和相互映射。最后,我们的定义明确排除了系统组件之间其他类型的高阶依赖关系,例如由多层网络中的多种连边类型 [13, 20-23],或由带时间戳的相互作用数据中的非马尔可夫路径 [12, 24] 所定义的依赖关系。虽然这些不在本综述的范围内,但感兴趣的读者可以在上述提到的参考文献中找到关于这些主题的广泛讨论。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

  1. 基于图的表示

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

很容易看出,当相互作用被描述为二部图时,我们玩具模型中的全部信息都被保留了。事实上,这种表示非常通用,确实可以很好地模仿大多数相互作用结构。然而,与其他多层图公式 [13, 20] 不同的是,在二部图中,原始系统的节点不再直接相互相互作用。相反,它们的关系总是由相互作用层介导的,而该层的性质与节点层本身不同。这意味着在二部表示上定义的任何度量或动态过程都需要考虑到这种额外的复杂性。解决这个问题的常用变通方法是考虑通过将二部图投影到两个层之一上而获得的单部网络(unipartite networks)。

每个相互作用随后变成了属于该相互作用的节点之间的一个全连接子图,以与简单图情况相同的方式丢失了群体结构。此外,通常不可能将定义在二部图上的标准图算子(例如拉普拉斯算子)中包含的信息转换为对应于单部投影的算子 [50, 51]。

模体(Motifs)允许提取关于相互作用属性的额外信息。它们是给定网络或一类相似起源网络中——通常很小的——重复出现的子图 [52]。模体被定义为顶点之间特定的边(1-相互作用)模式,这些模式在网络中表现为统计显著的(图 1E)。它们被视为网络功能的结构特征。也就是说,不同的模体可以对应并反映不同的功能,或者同一功能的不同优化解 [53]。典型地,在网络中观察到各种模体的经统计验证的频率(z-分数)被收集到一个模体谱(motif profile)中,随后可用于例如区分不同的网络 [54],例如不同状态下的脑功能网络 [55, 56] 或不同演化程度的生物网络 [27, 53, 57]。模体在社会 [58] 和时间 [59, 60] 系统的研究中也发现了广泛应用。模体构成了系统二部表示的一种细化,因为除了类似于二部图的群体划分外,它们允许指定节点参与的相互作用模式。这样做的缺点是,待研究的潜在模体数量随着涉及节点数量的增加呈指数级增长。不幸的是,这使得它们作为大型图和/或模体的描述工具变得相当笨重。例如,旨在通过基于模体的约束来量化网络随机性的生成模型 [61] 已被证明变得非常难以管理,甚至难以采样,特别是对于2阶以上的相互作用 [62]。

打开网易新闻 查看精彩图片

  1. 显式高阶表示

打开网易新闻 查看精彩图片

单纯形描述非常强大,因为它们配备了许多良好的数学工具。事实上,在单纯复形上为任意维度定义拉普拉斯算子(Laplacian operators)是直截了当的 [67, 68],它们既可以逼近正则流形,也可以逼近高度不规则的结构 [69, 70],并且它们自然地配备了将不同维度的单纯形串联在一起的边界算子(boundary operators)。至关重要的是,这些算子根据单纯复形的圈(cycles)、空腔(cavities)和高阶拓扑孔洞(higher-order topological holes)来描述其拓扑和形状 [71],并且自然地与组合拉普拉斯算子相关 [68]。在接下来的章节中,我们将更详细地描述这些性质中的许多,因为它们代表了目前可用的一些最强大的工具,并且是拓扑数据分析(topological data analysis)近期进展的基础 [72–74]。

虽然单纯复形克服了其他低维表示遇到的一些问题,但它们仍然受到所有子面存在性要求的相当大限制。在某些情况下,这种约束过于严格。例如,在研究社会系统时,能够描述群体中的相互作用是很重要的。在这种情况下,我们可以使用单纯复形,因为假设群体相互作用也隐含了底层的成对相互作用是相当安全的(图 1J)。成对相互作用与群体相互作用的相对重要性随后可以编码在单纯形的权重中。

然而,在其他情况下,包含约束可能不那么容易证明是合理的:假设例如我们正在研究科学论文中的合作,我们观察到一篇由三位作者撰写的论文,而相应的作者对之间却没有合作;或者基因通路恰好需要三个基因来执行一项功能,但子群本身并不负责任何功能。显然,能够描述这些情况也将是有用的(图 1K)。

打开网易新闻 查看精彩图片

B. 表示之间的关系和联系

自然,当讨论同一相互作用系统的不同表示时,会出现许多问题:两种不同的表示之间有多少重叠?是否可能以规范的方式将一种映射到另一种?在表示之间转换时,什么样的信息被保留(以及丢失)?例如,似乎显而易见的是,仅由1维单纯形(边)组成的单纯复形应该与图是同一回事,对吧?

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

在另一个极端,单纯复形的面表示在存储的单纯形数量方面是最简约的。复形 K K 的一个面(facet)是不包含在 K K 中任何其他单纯形中的单纯形。在哈斯图中,面对应于不包含在任何其他节点中的节点。在图 2B 中,它们被标示为带有橙色轮廓的单纯形。在这个意义上,面类似于图中的极大团(maximal cliques),并且就像极大团一样,复形的面列表唯一地标识了它。这也是一种压缩描述,因为它隐含了所有子单纯形的存在而无需显式列出它们。事实上,面表示是伪装下的有向二部图,其中面构成一层,顶点构成另一层,有向边代表节点在面中的包含关系。它也可以很容易地从哈斯图中恢复,只需保留顶点层和出度为零的单纯形(即其上方没有任何东西)。随后,与面表示相关的这个二部图也可以作为超图进行研究,其中面成员资格定义了超边(图 2C)。请注意,反之通常是错误的:二部图(或超图)仅在没有任何连接到面节点(超边)的顶点节点集是连接到另一个面节点(超边)的另一组节点的子集时,才会产生面表示中的单纯复形;简而言之,面的入射节点集需要尊重面的非包含性质,或者等价地,没有超边可以被包含在另一个超边中。

III. 度量

在上一节中,我们讨论了描述和表示高阶相互作用的各种方式与层级。在本节中,我们将重点关注可观测量和度量,这些工具可用于在系统描述的各个层级上表征和量化高阶相互作用系统的结构性质。特别地,在涉及团、超边、集合或单纯形的情形下,许多为普通图开发的常见概念已被推广至其高阶对应形式。我们将首先讨论如何借助矩阵或张量来描述相互作用。随后,我们将展示基于图的标准度量是如何被推广的,以及利用它们可以提取出哪些见解。

A. 高阶系统的矩阵表示

  1. 关联矩阵

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

在表征高阶系统(HORs)的各种属性时,关联矩阵非常有用。例如,图或高阶系统中节点 i i 的度可以定义为关联矩阵第 i i 行元素的总和。在(简单)图中,关联矩阵的列总和总是 2,因为所描述的关系总是发生在图的两个节点之间。然而,在超图(单纯复形)中,矩阵的行可以有两个以上的非零元素,因为每条超边(单纯形)可以描述两个以上顶点之间的相互作用。关联矩阵列元素的总和定义了系统超边(单纯形)的大小序列。这两个局部度量,即节点的度和超边的大小,是人们可以用来研究高阶系统(HORs)属性的首批度量。

  1. 邻接矩阵

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

B. 行走、路径和中心性度量

网络中心性是与节点相关的度量,用于量化一个节点在网络中的“中心”程度。一个节点被视为具有中心性的方式有很多种:例如,如果它连接到许多其他节点,它可以被认为是中心的(度中心性);或者是相对于它与网络其余部分的连通性而言(基于路径的中心性、特征向量中心性)。在下文中,我们将回顾一些最常见的中心性度量及其向高阶的可能推广。

  1. 度中心性

最简单的中心性度量是顶点的度,它统计有多少其他顶点与其相连。度可以很容易地根据 III B 节中定义的任何邻接矩阵定义为:

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

  1. 路径和基于路径的中心性

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

  1. 特征向量中心性

在某些应用中,量化一个节点对整个网络的影响力很重要,而不是其相对于可能路径的中心性。特征向量中心性最初由 Bonacich [103] 在社会学背景下引入,试图使用迭代定义来捕捉这种效应。事实上,节点的特征向量中心性取决于其邻居的中心性 [104]。在图的情况下,它可以写为

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

C. 三元闭包与聚类系数

在网络分析中,超越与节点相关度量的一个关键概念是三元闭包(triadic closure)。这是一个源自社会学 [111] 的概念,它认为两个人之间强烈的社会联系只有在它是三角形的一部分时才会发生。换句话说,我最亲密的朋友是那些我与其拥有共同朋友的人。在图结构中,三元闭包表示为被第三条边闭合的长度为 2 的 2-路径(2-paths)。由边直接连接的相邻节点对所占的比例定义了节点的聚类系数。聚类系数是一个重要的网络度量,它提供了关于节点邻域密度的信息。该系数也可以作为被边闭合的 2-路径(即属于三角形)的总百分比在全局范围内进行计算。

这个概念不能很好地推广到二部图,因为三角形——像其他任何奇环一样——在二部图中不存在。然而,全局聚类系数可以通过其单模投影(one-mode projections)来定义,即二部图中作为 6-环一部分的 4-路径的数量 [112, 113]。

其他试图将聚类系数的概念推广到成对关系之外的尝试,主要集中在保持其与三元闭包概念的紧密联系上。一种可能性是根据节点在高阶系统(HOrS)中可能具有的新邻域定义来定义局部聚类系数 [114]。例如,在单纯复形中,邻域也可以在极大单纯形层面定义,并且不仅可以为节点定义,也可以为高阶单纯形定义 [99]。

打开网易新闻 查看精彩图片

D. 单纯同调

使用单纯复形作为高阶数据集表示的主要原因之一,是一种以独特方式研究高阶系统(HOrS)拓扑的新代数工具集:单纯同调(simplicial homology)。同调是一个代数拓扑概念,它使我们能够研究不同维度尺度下单纯复形的结构。

在引入同调之前,我们需要在单纯复形上定义一个代数结构。这需要为复形中的每个单纯形强加一个定向(orientation),形式化为顶点的排序。定向可以任意选择,就像在网络中选择节点标签一样,它仅是为了连贯地执行计算所必需的。定向是顶点排序上的一个等价类,如果两个排序相差一个偶置换,则它们是等价的 [66, 117]。定向问题在 0-单纯形中不存在,因为节点没有定向,它仅在我们处理高阶图时才会出现。为了简单起见,且不失去一般性,我们选择由顶点标签排序诱导的定向。

  1. 边界算子与同调群

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

  1. 演化的单纯复形

同调是代数中一个有着百年历史的概念,也是数学中研究和分类形状的关键工具之一 [117]。最近,这一概念已被扩展到加权和增长的单纯复形 [118]。

受 90 年代形状理论 [119] 的启发,在 21 世纪初,全球不同的研究小组发明了持续同调(persistent homology)[72, 120, 121],从而诞生了拓扑数据分析(Topological Data Analysis)领域 [73]。持续同调是一种计算增长的单纯复形的同调并追踪其同调特征如何沿着过滤(filtration)演化的方法 [122]。过滤是一串单纯复形序列,它们为正在研究的数据空间提供 progressively 更精细的近似。在过滤中探索的多个尺度下,某些同调特征的持续性(persistence)与它们对数据空间的相关性有关,通常的假设是更持久的特征更重要,尽管对同调特征持续性的确切解释关键取决于过滤是如何构建的(例如见 [123])。在过去 20 年里,该领域得到了极大发展,并且针对单纯复形在过滤过程中也可能丢失单纯形的情况(之字形同调,zig-zag homology [124]),或者当单纯复形的增长可以通过多个参数来描述的情况(多参数持续同调,multi-persistent homology [125]),引入了追踪同调特征的新方法。感兴趣的读者可以在 [126] 和 [127] 中找到关于持续同调理论和实践的良好介绍。现实数据集中很大一部分关于高阶系统(HOrSs)的工作需要某种版本的持续同调。在第九节(section IX)中,我们提供了一些其使用的例子。

  1. 单纯复形中形状的其他度量

同调的所有变体(持续性、之字形、多参数)都是根据关键介观特征对结构进行分类的强大工具。然而,重要的是要注意,它依赖于用于计算同调的系数域 F F 的选择。此外,同调不变量通常不是详尽的,因为它们属于同调等价类,因此它们压缩掉了一些信息。这植根于拓扑性质对变形的不变性,经典的例子是马克杯和甜甜圈之间的拓扑等价。事实上,目前还没有完整的拓扑分类已知,人们可以找到单纯复形在拓扑上与 3-球面(4 维空间中的球面)同调不可区分但根本不是球面的例子 [128]。尽管如此,同调不变量为数据空间中存在的动力学提供了独特的见解,并且如上所述已发现广泛应用(相关例子见第九节 Sec. IX)。

除了完整的同调描述外,其他不变量也已在应用中使用 [129, 130]。两个常用的是欧拉示性数(Euler characteristic)和拉普拉斯谱熵(Laplacian spectral entropy)。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

E. 高阶拉普拉斯算子

拉普拉斯算子是一个在关系数据信息处理中起关键作用的算子,并且与微分几何中的拉普拉斯算子有相似之处。与邻接矩阵类似,将拉普拉斯算子推广到高阶系统(HOrSs)并没有唯一的方法。然而,由于网络可以被视为更大的 HOrSs 家族的一个特殊子集,图拉普拉斯算子是属于更一般的霍奇拉普拉斯算子(Hodge Laplacians)家族的一个特例。这里构建高阶拉普拉斯算子(无论是针对超图还是单纯复形)的直觉是,在图拉普拉斯算子中由节点扮演的角色,在高阶中由连边、三角形、四面体及更高维的对应物来扮演。

类比于图中的标准构造,引入高阶拉普拉斯算子的一个直接方法是根据 III A 节中介绍的邻接矩阵之一来定义拉普拉斯矩阵 L L。因此我们可以写出:

其中 A A 是选定的邻接矩阵, D D 是对角线上为节点度序列的对角矩阵 [135, 136]。然而,这种方法产生的矩阵 L L等价于与邻接矩阵 A A 相关联的加权图的拉普拉斯算子 [137]。

图拉普拉斯算子可以解释为离散拉普拉斯算子的一个特例,该算子表示定义在图顶点上的函数的梯度流的通量密度。对于超图和单纯复形,由于其

打开网易新闻 查看精彩图片

这种与连续算子的理论联系开启了使用该张量的谱来研究高阶系统(HOrS)扩散性质的可能性。例如,近年来,许多作者为特定的扩散过程定义了超图上的拉普拉斯算子 [76–78, 140]。另一个高阶拉普拉斯算子是在具有节点间高阶相互作用的系统中振子同步的背景下设计的,并在参考文献 [141] 中引入,将在 VI A 节讨论。在以下小节中,我们将为超图和单纯复形上的拉普拉斯算子提供明确的定义。而在 V 节中,我们将详细讨论它们的数学性质及其与扩散的联系。

  1. 超图拉普拉斯算子

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

  1. 组合拉普拉斯算子

对于一般单纯复形,可以通过两个矩阵为每个维度 k k 定义一个高阶拉普拉斯算子,这两个矩阵分别编码了维度 k k中上邻接和下邻接的作用:

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

IV. 模型

高阶系统(HOrSs)的模型旨在重现、解释和预测那些最好用涉及系统两个或更多元素相互作用来描述的系统结构。为了允许其输出具有可变性,这些模型通常被指定为随机规则的集合,即作为随机过程。因此,它们定义了高阶系统集合上的隐式或显式分布。在下文中,我们将回顾许多此类高阶系统的模型。

为了更好地描绘模型之间的相似性和差异性,我们根据所使用的随机过程类型将它们组织成两大类。在第一小节(IV A 节)中,我们回顾平衡态模型(equilibrium models),其定义为高阶系统上的静态分布。在第二小节(IV B 节)中,我们回顾非平衡态模型(out-of-equilibrium models),其给出为高阶系统上的分布序列。尽管这种分离在形式上并不完美(序列有时会收敛到平衡分布),但这些模型在实践中往往截然不同,这使得这种分类很自然。我们的选择也是基于这样一个事实的驱动,即这些模型背后的哲学在某种程度上是格格不入的 [142]。一方面,平衡态模型通常简单且易于分析;它们通常利用独立性假设,这导致高阶系统上的分布可以用解析方式写出。因此,它们非常适合进行统计推断,并作为在高阶系统上发生的动力学过程的基质。另一方面,非平衡态模型尽管规范简单,但通常会导致复杂的结果;这使得它们非常适合解释真实系统的定性属性如何从简单规则中涌现。然而,我们注意到,这种分类有时可能是表面的,特别是当平衡态和增长的模型公式之间存在形式对应关系时 [143]。

在这两个主要标题下,我们还根据模型所表达的表示形式对模型进行了组织(概述见 II 节)。我们发现这种分离很有用,因为不同的文献线索在历史上倾向于单一的表示形式,使得以相同表示形式给出的模型往往既基于相似的假设,又具有相似的建模目标。同时,我们认识到,从严格的数学角度来看,由于高阶系统表示之间存在形式对应关系 [102],表示形式的选择再次显得表面化。因此,只要存在形式等价性,我们就加以强调。

在最后的一个说明中,我们通过专注于将高阶相互作用作为“一等公民”出现的模型,限制了本综述的范围。因此,我们排除了那些碰巧作为副产品生成高阶相互作用的网络模型,例如网络中非平凡聚类 [144–146] 或团(cliques)[147, 148] 的模型。

A. 平衡态模型

  1. 二部模型

我们首先从二部配置模型(bipartite configuration model, bipartite CM)开始回顾平衡态模型。它或许是二部网络表示中描述的最著名的平衡态模型示例。二部 CM 生成高阶系统(HOrSs),其中相互作用的大小和每个元素的相互作用数量都可以被控制,从而允许人们研究这些量对高阶结构的影响。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

二部配置模型提供了一个范式示例,说明如何使用 HOrSs 模型通过一种称为“零模型建模(null modeling)”的技术来检验假设。零模型建模背后的总体思想是生成最大随机的 HOrSs,其具有少数固定属性与观察到的实证系统相匹配。如果人们观察到某些其他不相关的属性在随机系综中被系统地重现,那么这些属性在某种意义上是由固定属性“解释”的。因此,零模型建模有助于在实证研究中识别 HOrSs 属性之间的联系。

在二部 CM 的背景下,固定属性是两个节点集的度序列。例如,通过将这种技术应用于物种共现的二部网络,已经表明“每个物种的位点数量”和“每个位点的物种数量”决定了结构,以至于人们无法断定自然组装规则是否驱动了网络形成 [150, 151]。使用相同的方法,对于植物和传粉者物种的二部网络也得出了类似的结论 [155]。二部配置模型的一个变体也被证明可以重现基于 Stackoverflow 知识库构建的问题和标签网络的大部分属性,再次表明度可以“解释”许多网络属性 [160]。然而,我们注意到,稍微改变模型可能会极大地改变网络显著性分析的结论 [85, 149]——人们应该仔细考虑建模假设。

二部配置模型(bipartite CM)是一组更为通用的随机模型的特例,这组模型被称为指数随机图模型(Exponential Random Graphs Model, ERGM),或 logit 模型 [161]。这些模型旨在生成网络,在其中人们可以控制任意小子图(模体,motifs)的相对频率。正如我们在第二节(Sec. II)中所见,这些模体可以用来显式地编码高阶相互作用——事实上,我们在下面的 IV A 2 节中讨论了为此显式目的而使用模体的 ERGM 版本。然而,目前我们只关注那些在二部网络框架内添加模体的 ERGM 版本。换句话说,我们要关注的是那些利用两个节点集来编码高阶相互作用,但也使用二部模体来生成高阶系统(HOrSs)上更丰富分布的 ERGM。

打开网易新闻 查看精彩图片

人们最终意识到,从 ERGM 中采样(无论是在二部还是单部网络背景下)可能极具挑战性,这是由于简并问题(degeneracy problem)[170, 171],即模型仅对空网络和全连接网络赋予高权重。这一认识促使针对特定 ERGM 规范开发了微妙的受物理学启发的采样方法 [172],以及针对单部模型的全新规范 [162]。针对二部模型也提出了类似于新规范的方案 [173, 174],从而导致了推断的改进。

打开网易新闻 查看精彩图片

上述两组模型——二部配置模型(bipartite CMs)和指数随机图模型(ERGMs)——重现了局部特征,如节点的邻居数量或短环的数量。另一组平衡态模型则专注于重现其介观尺度特征(mesoscale features)[182]。这些模型控制网络中涉及许多(但非全部)节点的大型连接模式的频率和组织 [183]。例子包括不相交的节点社区、异配混合组(disassortatively mixing groups)[184],以及核心与边缘的分离 [185]。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

  1. 模体模型

基于模体的模型被公式化为任意小图集合(如三角形、短环或团)的组装规则。它们可以被视为高阶模型,因为它们是从非严格成对的关系构建系统的,尽管这些模型最终被定义为经典网络上的分布。基于模体的模型有着丰富的历史,可追溯到网络科学的早期 [205],其前驱是社会学的研究 [206, 207] 和统计学 [163]。

打开网易新闻 查看精彩图片

通用 ERGM 的主要推断应用与二部 ERGM 相同:零模型建模,以及从局部调查构建整个网络描述 [175]。至少还有一种 ERGM 特定于单部网络的应用:量化模型的显著性。这里的想法是固定所有小模体的分布,并将较大模体的数量与系综中的预期模体计数进行比较 [52, 57]。这种方法识别出在图中代表性不足或过度代表的模体,依据是我们对较小连接模式的预期。该方法曾被用来论证某些小模体是决定被建模系统功能的“显著子单元” [52]。

另一类带有模体的网络模型来自关于簇状网络上发生的传播过程的物理学文献。这些模型往往非常灵活,并能重现真实系统的不少结构特征。它们首先且主要用于研究结构变化如何影响在这些网络上展开的动力学过程的结果。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

  1. 随机集合模型

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

虽然上述所有随机交互图模型中的集合本身是随机的,但集合内部并不是随机的——所有节点都是连接的并形成一个团(clique)。其他的交集图模型包含了这一过程中存在噪声的可能性 [231],因此在形式上等同于上述节点-组模型的噪声版本 [222]。例如,一个模型将节点分配给一个或多个大小不一的团,并且两个节点仅在投影中以取决于共享团数量的概率连接 [232]。一种更奇特的构造是将节点以概率 分配给团,这些概率是随机 Beta 过程(stochastic beta process)的结果 [233]。

正如我们要提到的,在数学文献中,随机交集图因其结构属性而被研究 [225]。但它们也在流行病学文献中找到了推断应用,作为具有高阶交互系统的模型 [234]。在统计学文献中,它们已被应用于将团覆盖模型(clique-cover models)拟合到真实网络中 [233],这与用于拟合带有模体(motifs)的网络模型的覆盖模型的精神是一致的 [216]。

我们顺便指出,一些重叠社区(overlapping communities)模型导出的形式体系与这里提到的随机集合模型非常接近。然而,由于人们很少将重叠社区视为高阶交互——一个典型的社区太大,无法归类为编码一种“交互”——我们将不在此处对它们进行综述。感兴趣的读者可以参考 Xie 等人 [235] 的综述,以了解带有重叠社区的网络模型概况。

  1. 超图模型

许多高阶系统(HOrSs)的平衡态模型通过将它们编码在超图中,更直接地纳入了多体交互。关于随机超图的大部分工作来自数学文献,在那里它们被作为随机图论中经典模型的直接且自然的推广而被引入。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

。。。。。。。。。

原文链接:https://arxiv.org/pdf/2006.01764