主动推理系统中的控制流
摘要
生物系统在面对环境复杂性和有限自由能资源的情况下,必须具备一种能够根据具体情境激活或部署可用感知和行动资源的控制系统。本文展示了当系统被描述为执行由自由能原理驱动的主动推断(因此可以被视为贝叶斯预测误差最小化器)时,其控制系统始终可以表示为张量网络(TN)。我们展示了如何在量子拓扑神经网络的通用框架内实现TN作为控制系统,并讨论了这些结果对多尺度生物系统建模的启示。
关键词 贝叶斯力学;动态吸引子;自由能原理;量子参考框架;无尺度模型;拓扑量子场论
1 引言
生物提供了复杂的多层次控制策略的显著例子,这些策略在多个尺度上指导适应性功能。同时,它们由通常被视为遵循简单规则的物理对象组成;这两种观点如何以严谨的方式统一起来?主动推断框架通过提供一个完全通用、无尺度的形式框架来回答这个问题,用于以认知术语描述物理系统之间的相互作用。它基于自由能原理(FEP),最初在神经科学中引入 [1, 2, 3, 4, 5],然后被扩展到一般生物系统 [6, 7, 8, 9],最后扩展到所有自组织系统 [10, 11, 12, 13]。FEP指出,任何与环境交互足够弱以维持其时间可识别性的系统 1)具有一个马尔可夫毯(MB),将内部状态与环境状态分隔开来 [14, 15, 16, 17, 18],并且 2)随着时间的推移,以渐近最小化在其MB上测量的变分自由能(VFE)的方式行为。等效地,FEP指出,任何具有其密度动力学的非平衡稳态(NESS)解(因此具有MB)的系统将采取行动以维持其状态在其NESS附近。任何符合FEP的系统都可以被描述为始终参与主动推断:一个循环过程,其中系统观察其环境,更新其关于未来行为的概率“贝叶斯信念”(即后验或条件概率密度),并对其环境采取行动以测试其预测并获得额外信息。此类系统的内部动力学可以被描述为反转其环境的生成模型(GM),该模型提供对其行动在其MB上的后果的预测。
作为一个完全通用的原理,FEP适用于所有物理系统,而不仅仅是行为上有趣的、可能是认知的系统,如生物体或自主机器人 [10]。直观地说,当行为复杂、情境适当且在面对变化的环境条件时具有鲁棒性时,行为是有趣的——对外部观察者以及我们可以假设的系统本身都是有意义的。Friston等人 [13] 将有趣的系统描述为“奇怪的粒子”,其内部(即认知)状态仅通过感知到的环境响应受到其行动的影响;这样的系统必须“向环境提问”以获得答案 [19]。这样的系统,即使是细菌和其他基础生物 [20, 21, 22, 23],也有多种观察和作用于其环境的方式,并以情境敏感的方式部署这些资源。在运筹学语言中,它们表现出情境意识,即对行动情境的意识 [24],并部署注意力系统来管理维持这种意识的信息、热力学和代谢成本 [12, 22]。情境意识依赖于短期和长期记忆,或者更技术性地,依赖于精确[贝叶斯]信念存在的时间段,有时称为GM的时间深度或范围 [20, 21]。因此,通过从细胞尺度 [25] 向上检查记忆系统的容量和控制,可以对行为复杂性设置上限。从微生物垫到人类社会的生物系统采用刺激记忆 [22],因此在体现、嵌入、能动、扩展和情感(4EA)认知文献的意义上具有“扩展的心灵” [27, 28]。这样的记忆必须是可读写的;因此,任何使用它们的系统都必须具有专门的、特定于记忆的感知-行动能力。
任何具有多种感知-行动(或刺激-反应)能力的系统都需要一个控制系统,该系统能够实现情境引导的感知和行动,并避免同时连续部署所有可用的感知-行动能力。这种自我组织涉及从系统GM所考虑的所有合理策略中选择特定行动方案——即策略。在主动推断框架中,系统的内部状态——因此其GM——可以被解读为编码关于其感觉状态原因的后验概率密度(即贝叶斯信念),包括其自身的行动。这导致了规划和控制作为推断的概念 [29, 30, 31],随之而来的行动选择由最可能的策略给出。例如,在大肠杆菌(E. coli)中,不同代谢操纵子基因调控网络(GRNs)之间的相互抑制允许仅在环境中检测到目标碳源(例如糖)时表达特定的碳源代谢途径 [32]。通过趋化性控制觅食行为采用了类似的、在这种情况下是双稳态的机制 [33]。这种机制在多细胞形态发生中也很活跃,例如在涡虫的头尾形态决定中 [34]。在人类大脑中,竞争性视觉处理流之间的相互抑制在双眼竞争(在左右眼呈现的不同场景之间切换)或对模糊图形(如Necker立方体)的解释变化中显而易见 [35, 36];类似的竞争效应在其他感觉通路中也被观察到 [37]。它还表征了背侧和腹侧注意力系统之间的竞争性交互,分别实现自上而下和自下而上的感觉资源定位 [38]。在更大尺度上,它在全球工作空间模型中被调用,其中传入的信息流必须竞争,每个都抑制其他信息流,以“进入意识” [39, 40]。相互抑制创建了一个能量屏障,实现切换的控制系统必须消耗自由能资源来克服;控制器不仅必须“开启”首选系统,还必须“关闭”抑制。所需的自由能消耗反过来诱导滞后效应,从而在时间范围内产生非线性、赢家通吃的“开关”行为。每当两种感知-行动能力在功能上不兼容或同时部署成本过高时,这种屏障及其时间后果在更复杂的控制系统中持续存在。
从理论的自由能原理(FEP)角度来看,感知-行动能力的切换可以被视为选择一个由生成模型(GM)支持的合理策略或计划。从技术上讲,策略或计划的概率分布可以从在可能结果的后验预测密度下预期的自由能泛函中计算出来,如下面§2.1所述。实现切换过程的控制系统可以被认为使用GM来预测或分配每个感知-行动能力(即策略)的概率分布,作为情境的函数 [41, 42]。我们可以认为GM生成关于行动后果的概率“信念”,这里的“信念”只是一个数学描述的结构,例如经典条件概率密度或具有指定振幅的量子态。因此,“规划”或“控制”总是可以被视为推断——再次在计算的基本意义上——通过变分消息传递或“信念传播”在(正常风格)因子图上实现:一个节点对应于概率分布因子的图,无向边对应于消息传递通道。因子图可以与消息传递方案结合,消息通常对应于所讨论因子的充分统计量,以提供诸如边际密度等函数的高效计算 [43, 44]。因此,可以在FEP下将控制形式化为推断控制,这意味着控制可以用因子图上的消息传递来描述。当GM在离散状态上时,这意味着控制可以用张量算子来描述。
几乎所有在离散状态空间GM下的规划模拟都使用因子图形式。关键在于,因子图的结构体现了GM的结构,实际上,任何系统在其MB上表示数据(即其明显原因)的方式;即它“在自然的关节处雕刻”,分为状态、对象和分类特征。在(经典)FEP下,构成因子图节点的因子对应于物理学家或统计学家用于实现变分贝叶斯(又名近似贝叶斯)推断的平均场近似中的状态空间因子分解 [45]。有关技术细节,请参见 [46],有关大脑的应用,请参见 [47],有关选定应用的列表,请参见补充信息表1。
我们在本文中展示了,此类系统中的控制流总是可以正式描述为张量网络,即将某些整体张量(即高维矩阵)算子分解为多个组件张量算子,这些算子在共享自由度上成对收缩 [48]。特别是,我们展示了允许构建TN的分解条件与允许在MB上识别不同、相互条件独立(在量子术语中,退相干)的数据集的条件完全相同,因此允许识别环境中的不同“对象”或“特征”。这种等价性允许TN的拓扑结构——其中许多在TN形式在其他领域的应用中已被很好地表征 [48]——被用作主动推断系统中控制结构的分类;包括细胞、生物体和多生物体社区。特别是,它允许对以下问题采取原则性方法:认知系统是否以及在多大程度上可以对其环境施加分解或部分整体结构。此类结构自然引入了局部性的概念,因此引入了几何学。时空本身的几何已被描述为特定的TN——多尺度纠缠重整化 ansatz(MERA)[49, 50, 51]——这表明能够观察时空(即能够实现时空内部表示)的系统中的控制流与作为物理构造的时空的深层结构之间存在深刻联系。
我们首先在§2中分析了主动推理的三种不同表示中的控制流问题。首先,我们在§2.1中采用FEP的经典统计公式[10, 11]来描述控制流,将其视为在计算状态流形上的动力学吸引子之间实现离散的概率转换。然后,我们在§2.2中以量子信息论的术语重新表述物理相互作用;在这种表述中[12],GM的组成部分可以被视为不同的量子参考框架(QRFs)[52, 53],并由Barwise-Seligman分类器的层次网络表示[54],如[55, 56, 57, 58]中所发展。控制流随后实现QRFs之间的离散转换。第三步,在§2.3中,采用了[59]中发展的分类器层次与拓扑量子场论(TQFTs)之间的映射。在这里,控制流由TQFT实现,转换幅度由路径积分给出。这些表示中的第二和第三种提供了内在(或“量子”)上下文效应的正式特征,这些特征与[60, 61]中的束理论上下文处理和[62, 63]的默认上下文性(CbD)方法一致;另见[57]和[59, §7.2]中的讨论。其基本主题是,上下文性是由于在所有可能的观察中不存在任何全局可定义(最大连接)的条件概率分布而产生的(参见例如[64],从更一般的物理学角度进行回顾)。在我们早期的分析[57]基础上,我们讨论了为什么预期主动推理系统通常会表现出这种上下文效应的原因。
然后,我们在§3中发展了控制流的完全一般张量表示,并证明了当且仅当满足识别环境中不同特征或对象所需的可分离性(或条件统计独立性)条件时,该张量可以分解为TN。我们展示了TN架构如何允许控制流的分类,并给出了两个说明性示例。我们在§4中讨论了几种已建立的TN与人工神经网络(ANN)架构之间的关系,以及这些关系如何推广到拓扑量子神经网络[59, 65],其中标准深度学习(DL)架构是其经典极限[66]。我们在§5中转向这些结果对生物学的意义,并讨论了TN架构如何与被建模系统的观察能力相关,特别是在检测空间局部性和 mereology 方面的能力。我们考虑了如何根据TN架构对已知的控制路径进行分类,以及如何在实验设计中使用控制流的TN表示。最后,我们展望了这些基于FEP的工具如何进一步整合物理学和生命科学。
2控制问题的正式描述
2.1吸引子画面
在[13]的术语中,细胞被称为“奇异粒子”——它们的信号转导通路监测(环境状态的组成部分),但不直接监测它们对环境的作用(即它们自身的主动状态)。因此,任何行动的后果只能通过环境的反应来推断。在这种情况下,因果关系总是不确定的:环境对细胞的任何作用——细胞检测到的环境状态变化——是否是细胞过去采取的行动的因果后果,无法通过细胞可获得的数据来确定。因此,每一次行动都会增加VFE,而每一次观察(可能)会减少VFE。细胞的GM(生成模型)的任务似乎是在平均意义上最小化增加,同时最大化减少。
FEP所提供的贝叶斯力学暗示了一种(经典的)热力学;事实上,FEP可以被解读为一种受限的最大熵或校准原则[71, 72](Sakthivadivel 2022, Sakthivadivel 2022)。这是因为推理(即自我证据化)涉及信念更新,而信念更新通过Jarzynski等式[73, 74, 75]产生热力学成本。这种成本为代谢维持所需的热力学自由能提供了一个下限。例如,细胞对其环境的行动——如趋化性运动——主要是由获取热力学自由能的需求驱动的。因此,细胞的GM不能通过最小化行动来最小化VFE[76];相反,它必须成功预测哪些行动将补充其自由能供应。由于行动在能量上是昂贵的,这需要权衡短期成本与长期目标。正如[41]所示,在不同时间尺度上起作用的选择压力有利于发展出以情境依赖方式控制低级行动的元处理器;这些通常通过分层GM[77]实现。这种元级控制提供了情境中风险敏感行动的概率模型。
尽管这些系统可以被描述为调节自由能寻求的行动,但它们也调节信息寻求的行动,即好奇心驱动的探索[78, 79, 80]。这是因为VFE为复杂度减去准确性提供了一个上界[81]。因此,任何行动条件下的预期自由能(EFE)可以根据预期复杂度和预期不准确性进行评分。预期复杂度是“风险”,对应于产生热力学成本的信念更新程度;这导致了风险敏感控制(例如,向光性)。预期不准确性对应于“模糊性”,导致认知行为(例如,在路灯下寻找丢失的钥匙)[42]。
当考虑情境依赖的控制时,NESS的邻域解析为一个由局部最小值组成的网络,这些局部最小值对应于由能量屏障分隔的固定感知-行动循环,控制系统必须克服这些能量屏障才能在循环之间切换。例如,在细胞中,这种能量屏障包括激活一条通路同时去激活另一条通路所需的能量,这可能包括磷酸化的能量成本、其他化学修饰、额外的基因表达等。不同的通路对之间可以预期会有不同高度的能量屏障,生成一个地形复杂的自由能景观,在长时间平均下粗粒化为NESS的邻域,即维持异稳态[68, 69, 82]。
如前所述,我们可以将可控的感知-行动循环视为因子图上的节点,边缘对应于控制流的通路,而转移概率标记边缘,与循环之间的能量屏障成反比。这使得可以将元级控制(即分层)的GM表示为消息传递系统,如[47]中所述。存在非常高能量屏障的情况下,这种GM可能变得实际上是单向的,正如在形态发生期间细胞分化过程中信号转导通路和GRN之间的情境依赖开关所见。生物学上的例子包括对涡虫生物电模式记忆的修改,这可以创造出最终会重新塑形回正常的替代物种头部形状[83],或者产生永久性的双头蠕虫,它们会永久性地再生为双头[84]。
2.2 量子参考框架的视角
细胞的信息处理传统上被视为完全经典的,即通过大分子的因果网络实现,每个大分子通过局部动力学过程进行经典状态转换,这些过程在条件上独立于网络其他部分的状态。尽管蛋白质和其他大分子的“量子”性质被广泛认可,但量子效应重要的尺度仍然存在争议,简单的单分子退相干模型预测退相干时间为阿秒(10^-18秒)或更短[85, 86]:比分子信息处理中涉及的过程的时间尺度低几个数量级[87]。尽管已经证明了量子相干在分子内信息处理中的功能作用,但分子间相干性仍然在实验上难以捉摸[88, 89, 90, 91]。
然而,原核细胞和真核细胞的自由能预算比支持分子尺度上完全经典信息处理所需的自由能小几个数量级,这表明细胞利用量子相干作为计算资源[92]。关于大脑中更大范围的组织尺度相干的间接证据也已被报道[93]。在量子信息论的术语中重新表述FEP,使其能够描述不能忽略长程相干性和量子计算的情况。
如果满足以下两个条件,系统 X
X的测量可以被视为是序列的:
时间分离:测量根据内部时间量子参考框架(QRF)在时间上是分开的。
结果记录:测量结果被记录到内存中,以确保在时间上具有可比性。
在[59]中,我们展示了序列测量总是可以由以下两种模式之一表示。使用紧凑的符号:
图(6)和图(7)中描述的操作序列明确提出了关于如何实现控制以及如何检测驱动控制流变化的上下文变化的问题。在转向§3讨论这些问题之前,我们回顾了量子参考框架(QRF)的路径积分表示,并展示了相同的表示如何捕捉由QRF标识的任何系统X的行为,同时讨论了多观察者和量子上下文性的问题。
2.3 拓扑量子场论的视角
其中,x0是初始状态,p(x(t)|x0)是路径x(t)在给定x0条件下的条件概率。
量子理论通过一种有效的方式将上述表达式推广,即,用相关希尔伯特空间(Hilbert space)上的自同构来替换Ω[x(t)],用给定初始状态x0下x(t)的振幅来替换p(x(t)|x0)。对于某个有限维希尔伯特空间H,所有此类自同构的流形是H上的一个协边类(cobordism),按照定义,这也是H上的一个拓扑量子场论(Topological Quantum Field Theory, TQFT)[102]。
我们在[59]中证明,对B的任何扇区X的任何连续测量都会诱导出一个作用在X上的TQFT,这里X被视为与B相关的N维边界希尔伯特空间Hqi上的投影。特别是,形式为图(6)的测量序列可以映射到协边类上,即映射到两个指定边界之间的映射流形上,其形式为:
在LOCC协议中,一个通道被认为是“经典”的,而另一个被认为是“量子”的;然而,这种说法掩盖了一个事实,即两个通道都是物理的。正如[104]中所指出的,所有支持经典通信的媒介都是物理的,并且与这些媒介的相互作用总是局部的测量或准备。因此,LOCC协议中的两个通道在物理上是等价的——两者都是由B实现的TQFT——尽管它们在传统语义上是不同的。
图(12)显然也可以表示系统中任意两个功能组件之间的外部中介通信,例如细胞内的宏分子路径或大脑中的功能网络。我们在[98]中展示了,每当Q1和Q2由不同的——技术上称为可分离或相互退相干的——“观察者”或“系统”部署时,它们无法交换,即交换子[Q1, Q2] = Q1Q2 − Q2Q1 ≥ h/2,其中h再次是普朗克常数。如[57]中所示,使用CCCD表示的定理3.4表明,QRFs的非交换性诱导了量子上下文性,即测量结果依赖于表征测量上下文的“非局域隐变量”[105, 106, 107]。在当前的上下文中,这些隐变量表征了HB对B的作用,影响了A在A-B相互作用每个周期中接下来将观察到的内容。
如[63]所示,这种上下文依赖原则上可以通过实现对上下文的足够测量来经典地捕捉。然而,这些测量必须能够访问B的所有部分。MB的存在阻止了这种访问;在当前设置中,A只能通过B访问B。测量的有限能量成本,以及随之而来的对热力学部门F的需求,阻止了任何有限物理系统对B的所有部分进行测量。因此,我们可以预期物理系统,包括所有生物系统,只会采用局部上下文依赖的控制来在相互非交换的(集合)QRFs之间切换。QRF切换实现的上下文切换如何诱导进化、发育和学习在[22]中被引入。一些具体的上下文切换将在§5中讨论。
3 控制流的张量网络表示
3.1张量网络与全息对偶
纠缠和量子误差校正,这两个在量子信息理论中发展起来的概念,已被证明在揭示量子引力中具有基础性作用[108]。这一考虑的起源是Bekenstein和Hawking[109, 110, 111, 112]的发现,即如果黑洞的熵与其视界面积成正比,且与牛顿引力常数G的倒数相关,那么热力学第二定律可以在黑洞的引力场中得以保持。这种熵是最大的,正如第二定律本身所暗示的那样,为相同大小的区域内物质的可能配置提供了一个上限[113, 114]。
然而,由熵计数的局部自由度的缩放并不随体积增加,这促使了全息猜想的提出[115],暗示了信息只能在边界世界中检索,而体世界仅是表面上的。AdS/CFT实现了全息猜想,假设了渐近AdS空间中的引力与AdS空间空间无限远处的量子场论之间的对偶性[116]。Ryu和Takayanagi(RT)通过赋予对偶性字面意义,提出边界区域的纠缠满足与黑洞熵相同的定律,用包围所研究体区域的极值表面积取代了黑洞视界的面积。
在边界上,理论可以通过指定特定的共形场论(CFT)来识别,而在体中,几何可以与量子系统的特定纠缠结构相关联。例如,与AdS空间相关的CFT的基态就是如此:RT面积表面增加的速度比边界的体积慢。当边界处于有限温度的热平衡状态时,体几何对应于黑洞的几何,其视界与边界平行,其大小随温度增加。RT表面则被限制在边界和黑洞视界之间,在较高温度下接近边界并增加其熵。这些考虑表明,时空结构与量子纠缠之间存在微妙的联系,因此量子引力理论必须是根本上的全息的,其状态满足某些体几何的RT公式。
体引力与边界上的量子理论之间存在精确对应关系,这可能与局域性存在潜在的不一致性。这在文献中已通过局域重构理论进行了讨论[117, 118, 119]:体中的变量(例如体自旋)可以从边界瞬时控制,但需要同时访问边界的大部分区域:局域性和光速上限在此理论中并不严格成立。然而,局域观察者被限制在边界的小区域内,仍然满足局域性和信息交换速度的上限,这种方式让人联想到量子信息理论中的量子误差校正码(QECC):信息以冗余方式存储,使得当部分信息被破坏时,仍然可以重构信息。因此,体中的局域性是实现体与边界之间对偶性的编码映射的QECC特性。另一方面,这些特性与RT密切相关,RT为QECC的出现提供了必要的纠缠资源。
RT公式和QECC是不同类模型所满足的特性,其中包括张量网络(TNs)[120]。这些模型最初在凝聚态物理中被引入,作为强关联系统的变分波函数[121, 122]。TNs是多体波函数,可以通过组合少量体的量子态(即张量)来导出。TNs的一个原型是例如爱因斯坦-波多尔斯基-罗森(EPR)纠缠的量子比特对:在纠缠基中,测量的量子比特处于某种纠缠纯态,并且可以与剩余的量子比特组合,增加复杂性:复杂的量子纠缠可以通过仅纠缠少量量子比特来导出[123]。
特别值得注意的是多尺度纠缠重整化假设(MERA)[124],它在重构时空结构方面具有重要意义。通过考虑其纠缠熵可以由其图形几何控制,张量网络(TNs)可以自然地与全息对偶相关联。一些具有RT纠缠熵和QEEC特性的TNs版本,通过使用稳定子码[125, 126]和大键维度的随机张量[127]构建而成。每个节点具有随机张量的TNs可以被视为受网络拓扑限制的随机态。
正如随机态几乎具有最大纠缠一样,随机张量网络通过RT公式表现出几乎最大的纠缠,提供了一个具有有趣性质的广泛状态族,以探索全息对偶。此外,对于随机张量网络,RT公式在不一定具有双曲几何的通用空间中成立,这促使全息对偶超越AdS,扩展到量子引力中更一般的配置。然而,至少在三维情况下,随机张量网络已通过Regge微积分[128]与引力作用相关联。
另一方面,由于几何作为纠缠结构的规范而出现,人们可能会认为爱因斯坦方程也应与纠缠动力学相关联。对于边界上CFT基态附近的小扰动,已从RT公式导出了线性化的爱因斯坦方程[129, 130]。实际上,共形对称性使得能量动量与纠缠熵之间存在关系,从而使得极值表面的面积可以与边界上的能量动量分布相关联——这等价于线性化的爱因斯坦方程。
另一方面,边界上的动力学表现出混沌行为,单粒子算符演化为多粒子算符[131]。在阶梯算符的交换子增长中恢复的最大混沌行为,被编码在时间顺序外的相关函数(OTOC)中,其特征是随时间和温度呈指数增长。例如,具有这些性质的模型是Sachdev-Ye-Kitaev模型,该模型开发用于描述凝聚态物理学中的某些系统,如无能隙自旋流体[132, 133, 134]。另一方面,算符的混沌行为也与QEEC相关:边界上的混沌动力学实例化了保护量子信息的QECC,这些信息高效地隐藏(并受到保护)在视界之后。然而,这也引发了许多问题,涉及通过非局域测量从边界最终能否访问视界后的信息,撞击奇点的局部自由度的命运,以及体因果结构与视界上平滑几何之间的关系。
3.2一般结果
我们可以进而证明一个普遍的结果:
由于任何相互交换的QRF集合都可以表示为单个QRF [57, 59],因此任何仅部署相互交换QRF的系统都表现出平凡的控制流。
由于任何相互交换的QRF集合都可以表示为单个QRF [57, 59],因此任何仅部署相互交换QRF的系统都表现出平凡的控制流。
仅部署单个QRF的系统“无论上下文如何都做同样的事情”,因此在此使用的意义上不符合“有趣”的资格。如上所述,任何有限物理系统都无法通过单个QRF测量其边界的整个状态,因此无法同时测量并作用于其整个上下文。如上所述,任何按顺序部署多个QRF的系统都无法避免由于HB作用导致的不可观察效应而产生的上下文性,即Qi对Qj测量的状态的作用。
换句话说,任何“有趣”系统的每个动作至少会暂时增加其边界的VFE(体积自由能)。
因此,考虑一个部署多个不同QRF Q1, Q2, . . . Qn的系统A,其中n ≤ N = dim(HAB)。A中的经典控制流可以表示为一个矩阵CF = [Pij],其中Pij是控制转换Qi → Qj的概率。如前所述,任何这样的转换都有能量成本,必须通过来自F的自由能源源来支付。
矩阵CF是一个2-张量。定理2指出,这个张量可以分解为一个张量网络(TN)。我们证明如下:
许多标准的张量网络模型,例如MERA,假设在网络感兴趣区域的远端边界条件,即在最底层算符的数量上。识别这些渐近边界条件会产生一个循环系统。
定理2及其推论提供了一种自然的、形式化的方法,通过其控制架构对系统进行分类。在高层次上,两个特征区分了具有不同架构的系统:
- **层次深度**:表示架构支持的“虚拟机”层数[135]。这些层之间的接口实现粗粒化,从更高层次的表示中移除所有维度,从而移除所有信息,这些信息被从更低层次的算符中收缩出去。
- **收缩的数量和位置**:这些收缩产生幺正算符,从而在更低层次的算符之间建立纠缠。自然极限是MERA,其中每一对更低层次的算符在每个层次上都被纠缠[48]。
反过来,控制流架构指定了B上可区分区域的“布局”结构,从而指定了环境中可检测特征/对象的结构。B上的局域性需要一个层次化的张量网络;可检测的纠缠需要一个类似MERA的张量网络。局域性是可检测特征/对象似乎具有嵌套分解组件的必要条件。任何用于几何空间(因此也是时空)的QRF必须是层次化的,如果要在空间中检测到纠缠,则必须是MERA。特别是,如果使用空间分离系统之间的相干性作为计算或通信资源是可检测的,则需要MERA。
为了说明通过层次级别对系统进行分类,考虑图(13)中所示的十步循环张量网络:
其中红色、蓝色和绿色分别表示张量收缩的不同层次“层”。我们训练了人工神经网络(ANNs)来执行这些张量网络,作为表1中所示的状态转换序列。第一个序列(数据集1)是图(13)中所示的十步循环;第二个序列(数据集2)将图(14)中的粗粒化状态转换叠加到这个十步循环上。在数据集2中,使用一个两比特标签来区分“低层”和粗粒化的“高层”循环。图2展示了一个从随机生成的初始状态开始的示例状态转换;红色在绿色上的比特模式在每个状态转换周期中有效地“上升”一步。
我们训练了两个ANN,每个ANN执行表1中所示的控制循环之一。如图3所示,每个网络由三层组成,输入层、隐藏层和输出层的大小分别为[10, 50, 10]和[10, 200, 10]。隐藏层的单元使用修正线性单元(ReLU)非线性激活函数,输出层的神经元使用双曲正切激活函数。网络以前馈方式连接,其中一层中的一个神经元连接到下一层的每个神经元。由于ANN作为开关状态控制器,我们使用了一种训练方案,类似于一类分类[136],其中训练数据是网络唯一学习生成的数据。通过这种方式,网络学习过拟合训练数据,任何不在指定状态编码范围内的输入都会被丢弃。因此,网络不会偏离已学习的模式。在训练了3,000个随机生成的10位输入后,网络在两种控制模式下都达到了100%的准确率。
在更现实的有噪声输入数据情况下,其中二进制状态可能会翻转,双向联想记忆(BAM)是一种可行的替代方案,它是一个最小的两层非线性反馈网络[137]。其架构如图4所示。该BAM网络学习在表1中的初始状态和最终状态之间建立关联,其性能与前馈网络相似。
4 使用TQNN实现控制流
张量网络可以自然地与拓扑量子神经网络(TQNNs)之间的物理标量积的矩阵元相关联。物理标量积确实编码了TQFT的动力学,因为它们满足TQFT的约束,即曲率的平坦性和规范不变性。因此,与标量积相关的矩阵元可以被视为自旋网络状态的演化矩阵元,这些自旋网络状态跨越了TQNNs的希尔伯特空间。
4.1 作为TQNNs分类器的张量网络
一个显著的例子是由BF理论[138]提供的,这是一类在数学物理文献中被特别深入研究的TQFT,它能够表达粒子物理、引力和凝聚态物理的有效理论,并且为量子信息、量子计算、机器学习(ML)和神经科学的模型实现提供了一个通用框架。这些理论定义在某个内部规范群G的连接A的主丛M上,其代数为g,根据作用在d维流形Md上的作用:
在量子层面,满足Gauß约束的动力学希尔伯特空间的态可以通过圆柱函数Cyl来表示,这些函数支持在图Γ上,Γ是线段γi的并集,其端点在节点n处相交,并且与连接A的和乐群(holonomies)——群G的元素——Hγi[A]分配给γi,以及与节点n分配的交织算符(invariant tensor product of representations)vn。
自旋网络之间的函子演化由投影算符[140]确保,该算符在状态之间的物理标量积中实现了曲率约束,即:
4.2 TQNNs和TNs的几何重整化流
我们在第4.1节中总结的TQNNs的数学结构描绘了“处于平衡”的系统,其中TQFTs表征了一种拓扑稳定性,这种稳定性渗透到相关的跃迁振幅中。然而,考虑随机噪声如何干扰TQFTs所确保的拓扑序,并研究“非平衡”物理在分析所研究系统演化中的作用也是值得的。
非平衡动力学通过考虑理论基本场的热流演化来实例化,相对于热时间τ。典型的朗之万方程,补充了随机噪声,通过其收敛到理论的运动方程,提供了代表特定系统的场配置向平衡的弛豫[141]。一般来说,给定一些场φσ,其经典运动方程根据变分原理δS/δφσ从欧几里得流形M上的作用S导出,相关的朗之万方程为:
其中ησ是一个随机噪声项。平衡理论由运动方程δS/δφσ = 0的对称性表征,这些对称性在瞬态阶段被破坏[142];这些对称性与平衡理论一致,并且在BF理论的情况下,实际上是由平衡理论生成的。
几何热流的一个原型由Hamilton引入,随后由Perelman用于证明Poincaré猜想,称为Ricci流。这里,引力场gµν是基本配置空间场,而漂移项是真空中的爱因斯坦运动方程,确实通过要求Ricci张量的分量消失来表示,即Rµν = 0。Ricci流为:
从Ricci流的角度来看,讨论的一个重要副产品是,平衡轨迹对应于重整化群(RG)流的轨迹。热时间τ扮演尺度参数的角色,它在一个维度上识别出体,该维度处于非平衡状态。边界在τ的渐近过程中,即在红外区域中恢复,并且根据定义处于平衡状态,因此是对称的。
对于我们在第4.1节中介绍的用于实现TQNNs和TNs的特定类TQFTs,即BF理论,几何RG流获得了特定的表达式,作为引力Ricci流的TQFT等价物[143]。
4.3 作为ML主要模型架构泛化的TNs
TNs的使用是ML社区中一个新兴的主题。两者的结合显得相当直接。TN结构可以被视为一个ML模型,其中参数被适当调整以学习数据集的分类。然而,正如参考文献[144]所提到的,机器学习反过来也可以帮助确定一个近似数据集的TN分解。此外,TNs还被用于压缩ANN架构的层,以及其他各种用途。张量网络越来越受欢迎,因为它们是表示和操作高维数据的强大工具,例如在图像和视频分类任务中,数据被表示为高维张量。高效、灵活且易于使用,使它们成为许多AI应用的首选。此外,除了用于表示数据外,TNs还可以通过利用多个算子来处理数据。这一特性使它们成为处理ML应用中数据的有效技术。
众所周知,TNs特别适合表示量子多体态,其中希尔伯特空间的维度在粒子数量上是指数增长的。相应的ML方法包括:
- 将数据提升到指数级更高的空间;
- 将任何线性分类器应用于非线性空间;
- 使用TNs压缩权重。
模型的输出是类的分离,这在线性空间中不是线性可分的。特别是,决策函数是权重张量W与特征映射张量Φ的重叠,如图5所示。权重张量W可以通过图6中的分解来近似。
正则化和优化是通过低阶张量的构造性积来构建的,而权重压缩是通过使用矩阵乘积态(MPS)分解来执行的。如果我们把深度神经网络看作是线性判别器(逻辑回归函数)的分段组合,那么TN框架就表现为ML文献中主要模型架构的泛化,例如支持向量机、核模型和深度神经网络。
关于张量理论在传统ML中应用的文献正在迅速增长。简要回顾始于Stoudenmire和Schwab[146]的开创性论文,该论文展示了如何将优化TN的算法适应于监督学习任务,通过使用MPS(张量列车)来参数化非线性核学习模型。Novikov、Trofimov和Oseledets[147]展示了如何将指数级大的参数张量表示为称为张量列车(TT)的因子化格式,从而获得模型的正则化。van Glasser、Pancotti和Cirac[148]通过引入“广义张量网络架构”的概念,探索了TNs与概率图模型之间的联系。参考文献[149]设计了一个生成模型,即一个传统的机器学习模型,它从数据中学习联合概率分布,并根据该分布生成样本,通过使用MPS。参考文献[150]利用自回归MPS构建了一个无监督学习模型,展示了与标准传统模型相当的性能,超越了概念验证。最后,参考文献[151]分析了不同阶多项式对不同架构监督学习性能的贡献。
5 对生物控制系统的影响
无尺度生物学要求量子行为与经典行为之间的平滑过渡。典型的代谢、信号转导和基因调控途径的表示完全是经典的,尽管其中许多步骤涉及电子转移或其他机制,这些机制被认为需要量子理论的描述[87, 152]。如前所述,自由能预算的考虑表明,原核细胞和真核细胞都使用量子相干性作为计算资源[92]。哺乳动物大脑中长程纠缠的涌现实证证据表明,大规模网络也可能使用量子相干性作为资源[93]。因此,控制流模型必须支持生物系统中量子计算的可能性。包含幺正组件的分层张量网络(例如MERA类型的模型)提供了这种能力。
在原核生物中,控制流的主要任务是通过代谢物驱动的基因调控来适应可用资源[153],并在条件有利时启动DNA复制和细胞分裂。因此,我们可以预期这些生物体中存在浅层分层的有效经典控制转换。然而,真核生物的特点是细胞内分区和整个细胞尺度的形态自由度。我们之前已经证明,FEP(自由能原理)将诱导“神经形态”的形态——即分离输入和输出并启用扇入/扇出计算架构的形态——在任何具有形态自由度的系统中[154]。可以预期,这样的系统在细胞水平上具有深层的控制层次结构,层次结构与形态结构相关,例如在神经元等形态复杂的细胞中,以及在所有尺度的多细胞集合中[155]。除了管理代谢和复制外,这些系统还必须实现对环境的主动探索、与其他系统的通信,以及——对于认知至关重要的——书写和读取stigmergic记忆。因此,我们可以预期这些系统会实现时空和特定类型对象(例如同种个体和适合记录stigmergic记忆的基质)的QRFs。这些QRFs依赖于对称性,因此依赖于编码(或可编码)信息的冗余性;换句话说,它们依赖于纠错码的可用性[25, 156]。物理学家已经广泛研究了通过TNs将时空实现为量子纠错码的问题;参见[157]的综述和[98]中使用当前形式的详细分析。生物体使用时空作为纠错码的现象——例如,哺乳动物的背侧视觉处理实现物体的平移和旋转不变性[158, 159]——在现象学上是很好理解的,但神经实现的细节仍有待阐明。
随着控制网络的复杂性和层次深度的增加,QRFs的非交换性导致的上下文敏感性和上下文效应可以预期会增加。具有高扇入/扇出到多用途蛋白质或第二信使(如Ca2+)的“蝴蝶结”网络越来越被认为是高等真核细胞中普遍存在的[160]。这种网络通常具有图(3)中所示的CCCD的一般形式。通常,这种网络通过信息压缩(例如,向共享第二信使发展,如基于[Ca2+]的相互作用[161, 162])作为提高效率的机制而进化。蝴蝶结引入了必须通过上下文解决的语义歧义。每个传入信号都有其自身的语义,但相关上下文可能取决于边界条件,这些条件可能极其难以(如果不是不可能)预先确定(参见例如[163, 164]中对该问题的历史和语义深度的总体讨论)。如[22]中所指出的,如果对于一组固定的观察{oi},条件概率分布P(oi|x)和P(oi|y)是明确定义的,但联合分布P(oi|x ∨ y)不是[106],则上下文变化x → y在语义上是存在问题的。当x和y的QRFs不交换时,就会发生这种情况[57, 定理7.1]。如图(3)所示,这种上下文切换问题会影响使用VAE(变分自编码器)的深度学习[165];参见例如[166]中对抗菌肽的应用。一般来说,图(3)的结构可以作为区分包含可共同部署与不可共同部署QRFs的信号转导网络的便捷基准[57]。
有趣的是,即使在人类语言使用的尺度上,也报告了由于非交换性导致的“量子”上下文效应。“冰雪女王”实验[167]在不同上下文中使用诸如“善良”、“邪恶”或“美丽”等术语的截然不同且相互矛盾的含义来挑战受试者,并使用CbD(上下文依赖)形式[62, 63]检测到统计上显著的上下文效应。这些效应无法通过语言歧义、误读等来解释。这种语言驱动的上下文性在心理语言学和分布式语义学的背景下得到了探讨[168],该研究结合了CbD和束理论[60, 61]方法,系统地研究了语义歧义如何在诸如“时间差不多了”、“她有时间在手上赢得比赛”、“West以皇后开局”等陈述中产生意义/感觉差异。
虽然“语言”的概念迄今为止主要以隐喻的方式应用于细胞、组织甚至无脊椎动物,但我们可以推测,理解上下文依赖性与语义歧义之间相互作用的语言学方法可能对生物学普遍有用。例如,免疫细胞(如T细胞)由其前体细胞“编程”或“训练”,以特定方式响应局部细胞信号和环境条件。意外的上下文变化可能会引发功能失调(在生物体尺度上)的反应,包括慢性疾病[169];这些可以被视为传入信号的“实际”语义与免疫系统“语言”预期的语义之间差异的结果。这种可能的“语言”上下文性的建议似乎与[170]的假设一致,即免疫系统是一个认知(活的)系统,实现了其独特的语言-语法系统,这可能容易受到与[168]中讨论的类似沟通障碍的影响。类似的上下文效应在微生物系统中也有观察到[171];这里,从大肠杆菌中乳糖-葡萄糖干扰信号传导产生的实验得出的经典概率差异只能通过非经典概率来解释。我们注意到,术语“类量子”[172]经常用于描述这些效应;然而,它们的正式结构正是量子理论所给出的。
我们预计,进一步研究量子生物学将沿着本文提出的思路,揭示人类/哺乳动物生理学和认知能力的重要视角。例如,正如§2.1中简要提到的,稳态调节可以被视为一种过程,该过程根据成本和收益调节身体的生理条件,同时动态分配资源以提高生物体在其内部环境中的整体适应性。实现稳态和预期机制的是产生自主神经、激素和免疫预测的内脏运动皮质区域,从而导致内感受性推断[68, 69, 70, 82, 173, 174, 176, 177]。人类和哺乳动物的这种推断过程可能利用预测编码来通过从细胞到器官水平的系统层次结构实现稳态-稳态,进而将内感受性与外感受性和本体感受过程连接起来[82, 173, 177, 178, 179]。其基本原则来自于稳态如何通过利用某种超越稳态维持所需错误信号的框架来提供对潜在意外的保护(本质上是通过最小化内部状态轨迹的自由能来对抗意外,如§2.1中所讨论的)。该过程的净效应与[175]的良好调节器定理一致,表明对给定系统的调节需要该系统的内部模型。另一个视角是强调集成、复杂、稳态-内感受性皮质系统的预测性质,该系统能够支持包括记忆和情绪在内的一系列心理现象[177](参见[82])。因此,认知条件如抑郁症和自闭症被描述为稳态-内感受性推断的异常,从而由于预测误差的异常同化和失调(可能是连接问题)而损害预测编码机制,可能成为许多已知认知条件的根本原因[82, 173, 178]。
我们预计,这种完全通用且上下文敏感的控制流模型对于理解形态发生将非常重要,形态发生不仅仅是一个前馈涌现系统,而是一个高度上下文敏感的误差最小化过程[23]。具体而言,胚胎发育、器官再生和变态过程中细胞的集体智能能够在广泛的扰动下创建和修复特定的复杂结构[180]。基因组的变化、细胞数量的变化或初始配置的变化通常可以被克服:被切成两半的胚胎会产生正常的双胞胎,被截肢的蝾螈肢体会重新长回正常,涡虫的碎片会产生完美的小蠕虫[181]。细胞集体即使在剧烈干预下也能达到正确目标形态的能力,需要理解它们如何通过上下文敏感的控制流在解剖形态空间[182]、生理和转录空间[156, 183]等问题空间中导航。理解非常规集体智能使用的导航策略不仅有助于理解在快速时间尺度上的创造性问题解决(例如,调节基因以适应完全新颖的压力源[184],而无需进化适应),还可能对预测和管理合成生物体的目标和行为库有影响[185]。
6 结论
我们在这里展示了主动推理系统中定义控制流的问题,并提供了该问题的三种形式化表示。我们证明了在这样的系统中,控制流总是可以通过张量网络来表示,提供了说明性示例,并展示了如何使用拓扑量子神经网络的一般形式来实现控制流的一般模型。这些结果提供了一个通用形式,用于在任何尺度上表征主动推理系统中的上下文依赖性,从宏分子途径到多生物体社区。它们表明,当应用于一般生物系统时,语言交流的概念不仅仅是隐喻性的,而是一个恰当且富有成效的互动动力学描述。
我们将这些结果视为进一步整合物理学、生物学和认知科学的正式模型、概念和语言的又一步。这种整合并不是还原性的。相反,它允许我们使用自然组织和计算复杂性的度量来对系统进行分类,并理解简单系统之间的相互作用如何实现它们所组成的大型系统的更复杂行为。
原文链接:https://arxiv.org/pdf/2303.01514
热门跟贴