ENTROPY AS A TOPOLOGICAL OPERAD DERIVATION

作为拓扑运算导数的熵

https://arxiv.org/pdf/2107.09581

打开网易新闻 查看精彩图片

摘要

我们揭示了信息论、代数和拓扑学之间一个微小的联系——即香农熵与拓扑单形Operad的导子之间的对应关系。本文首先简要回顾Operad及其表示的基本概念,并以拓扑单形和实数轴为主要示例。接着,我们在范畴论框架下给出了Operad导子的一般性定义,该导子以Operad上的阿贝尔双模为取值。主要结论表明:香农熵定义了拓扑单形Operad的一个导子,并且该Operad的每一个导子都存在某一点,在该点上它由香农熵的常数倍给出。我们证明这一结论与Faddeev于1956年提出的著名熵刻画定理以及Leinster近期提出的变体形式相容,且本质上高度依赖于这些结果。

1. 引言
在本文中,我们阐述信息论、代数和拓扑学之间一个简洁的联系。为引出核心思想,考虑函数 d : [ 0 , 1 ] → R ,其定义为:

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

尽管 d 不是线性的,但这可能会促使人们思考:在何种设定下香农熵本身能成为一个导子?下面我们将通过展示香农熵与拓扑单形Operad的导子之间的对应关系来描述这样一个设定。

1.1 研究动机.近期研究表明,信息论与代数拓扑的交汇处是一片沃土。2015年,Baudot和Bennequin在[BB15]中引入了信息上同调的工具,他们构造了一个特定的上链复形,其中熵代表1次中的唯一上圈。同年,Elbaz-Vincent和Gangl从代数的角度研究熵,并指出所谓的1次信息函数"行为非常类似于某些导子"[EVG15]。再往前推几年,2011年,Baez、Fritz和Leinster在[BFL11]中给出了熵的一个范畴论刻画,该成果近期由Parzygnat在[Par20]中推广到了量子领域。在准备2011年那项成果时,Baez在非正式文章[Bae11]中评论说,在某种Operad语境下,熵的行为似乎类似于一个导子——我们将在下文中验证并明确阐述这一观察结果。上同调的思想在Mainiero近期的工作中也有所探索,他发现熵出现在与量子态相关的特定上链复形的欧拉示性数中[Mai19]。综上所述,人们会感觉到熵的行为在某种程度上类似于"某个量的微分",其中涉及一个类似(上)边界算子的 d d。本文也遵循这一思路。值得注意的是,一旦几个简单的定义准备就绪,相关的数学推导就变得相当直接。即便如此,我们仍认为这一联系值得分享,哪怕仅仅是为了让人们得以窥见熵的另一个代数和拓扑面向。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

这个等式(等式(2))暗示了熵可能是一个导子,尽管其右侧第一项中明显缺少一个“ q ”。作为进一步的引子,Baez在非正式文章[Bae11]中探讨了等式(2)的一种代数解释,文中提醒读者,香农熵是概率分布配分函数关于玻尔兹曼常数(视为形式参数)的导数。在该文中,等式(2)通过短短几行推导便由此计算得出。这促使人们去寻找一个Operad导子的一般框架,使得等式(2)成为其中的一个实例。这正是我们下面要阐述的内容。

第3章回顾了Operad及其表示的定义。我们将重温拓扑单形的集合如何如[Lei21]那样具备Operad结构,以及实数集 R 如何导出它的一个表示。在第4章中,我们定义了任意Operad O 上的阿贝尔双模 M ,以及取值于 M M的 O 的导子的概念。在这些定义的基础上,等式(2)将在命题1中得到推广,而主要结论也将随之迅速得出。

定理.香农熵定义了拓扑单形Operad的一个导子,并且该Operad的每一个导子都存在某一点,在该点上它由香农熵的常数倍给出。

3. 背景:Operad 及其表示

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

一般来说,将一个 m 元运算与一个 n n元运算进行复合有 n n种方式,且复合后的运算的元数总是 m + n − 1 。这种复合还应满足一些合理的结合律和单位元公理。所有这样的运算及其复合方式构成的集合就称为一个 operad。这个概念起源于范畴论 [Lam69],并已在代数拓扑和同伦论中得到广泛应用 [May72, BV73, LV12, Val12, Sta04],同时在物理学中也有应用 [Mar96, MSS02]。Operad 可以在任何对称幺半范畴中定义。为便于下文阐述,我们假设所有范畴 C 都是具体的(即每个对象都有其底层的集合),这样我们就可以引用给定 C 中对象的元素。实际上,我们心中需要牢记的主要例子是拓扑空间范畴。

打开网易新闻 查看精彩图片

尽管定义形式看起来有些繁琐,但其概念本身是简单的。例如,图 2 展示了第 (i) 项中列出的结合律要求。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

这种同时复合的过程由图 3 右侧的树形图说明。正如群通过考虑其表示而变得生动具体,当每个抽象的 n n元运算被映射到某个特定对象上的具体 n n元运算时,Operad 也同样变得鲜活起来。这种指派传统上被称为 Operad 的代数,但我们更倾向于使用更具描述性的名称:表示。

定义 2.设 O 是在集合范畴中的 Operad。 O 的一个表示,或称为 O -表示,是一个集合 X 连同函数

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

4. 单形 Operad 的导子

有了这些基本定义,当前的目标是定义一个从拓扑 Operad Δ Δ出发的映射 d d,它满足莱布尼茨法则的适当版本,

打开网易新闻 查看精彩图片

等式 (4) 中展示的结合律要求——以及其背后的直观——与图 2 所示的定义 operad 的结合律要求完全类似。这里唯一的区别在于,三个运算中可能有一个来自双模而非 operad 本身。以下是我们需要牢记的主要例子。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

作为结语,定理 1 中 Faddeev 对熵的刻画可以像 [Lei21](定理 12.3.1)那样,用范畴论和 Operad 的语言重新表述。我们在此略去了这部分语言,但诚邀读者在 Leinster 著作的第 12 章中探索完整的范畴论故事。

原文链接:https://arxiv.org/pdf/2107.09581