The hippocampus as a small-world cognitive map

海马体作为小世界认知地图

https://www.biorxiv.org/content/10.64898/2026.02.07.704615v1.full.pdf

打开网易新闻 查看精彩图片

摘要
当一只小鼠察觉到鹰的阴影时,它可能只有几秒钟的时间来决定逃往何处,然而最安全的避难所往往既不可见也不在附近。为了生存,它必须足够快速地搜索其认知地图,以便在众多可能性中做出选择,同时又必须足够准确,以避免沿途的死路与危险。但"安全"的含义会在数分钟至数天的时间尺度上发生变化,因为路径、避难所和威胁都在不断改变,因此认知地图必须不仅能在空间维度上被搜索,也必须在时间维度上被搜索。这凸显了一个核心设计问题:认知地图必须保留精细的局部结构以支持可靠的行为,同时又必须保持全局可搜索性,以便在空间和时间上高效地找到遥远而有用的解决方案。海马体被认为支持此类地图,其群体活动表征世界状态及其转换——然而,这些表征如何在保持局部忠实性的同时实现高效的全局搜索,目前尚不清楚。在此,我们使用一种新颖的几何正则化自编码器,对小鼠在学习记忆引导导航任务过程中数千个海马CA1神经元的纵向钙成像数据进行建模。我们发现,海马群体编码通过在不同尺度上运作的互补机制,同时实现了局部忠实性与全局可搜索性,从而在神经表征空间中形成了小世界网络结构:具有强烈的局部聚类特性,以及一组稀疏的长程捷径,使得快速访问遥远状态成为可能。在群体水平上,神经表征相对于过往经验呈现出螺旋式(旋转加漂移)动力学,构建出新的地图,既保留了空间与时间上邻近位置的信息,又能与早期表征保持可区分性。在细胞水平上,具有协调的多野点活动、跨越遥远表征的神经元,在可能状态的空间中构建了稀疏的长程捷径。在静止期间的同步群体事件中,解码出的活动常常跳跃至空间、时间及任务条件上的遥远状态,表明这些捷径在离线处理过程中被调用。这种功能组织形式对神经科学与人工智能均具有启示意义,有助于阐明海马表征如何针对智能系统所面临的一项根本性挑战进行优化:即在准确的世界内部模型中进行高效搜索。

1 引言

智能体(从觅食的啮齿动物到国际象棋大师)面临的一个根本挑战是如何搜索世界的内部模型以指导行为。考虑一只处于迷宫般洞穴网络中的大鼠。为了找回数周前储存的食物,它必须利用记忆在隧道、出口和腔室之间导航,而无需实际检查每个分支。或者考虑一个人在规划穿过陌生城市的路线,在迈出一步之前就在心理上模拟转弯和地标。这种心理导航的能力,即在内部世界模型中高效搜索而不是通过详尽的物理探索 [1–3] 的能力,可以说是区分复杂认知与简单反应行为的关键。

认知地图的概念,即一种捕捉环境关系结构的内部表征,为理解如何实现这种心理导航提供了一个概念框架 [1]。一个有效的认知地图必须满足两个基本要求。首先,它必须准确地表征环境的结构,保留状态之间的关系,以便心理遍历反映现实世界的转换。其次,为了使心理导航有用,地图必须支持高效搜索,随着环境规模和复杂性的增长,这种搜索能良好地扩展。如果没有这种效率,心理模拟在根本上不会比物理探索更快。

海马体为寻找此类组织原则提供了一个自然的位置。长期以来,它被认为与支持认知地图的神经基质有关 [4]。位置细胞(即在特定空间位置选择性发放的神经元)的里程碑式发现,为内部地图的神经编码提供了第一个具体证据 [5]。后续工作揭示,海马体不仅编码空间位置,还编码各种各样的经验:时间间隔 [6]、社会身份 [7, 8]、概念类别 [9, 10] 以及任务相关的抽象变量 [11–13]。这些发现支持了将海马体视为编码通用认知地图的更广泛概念 [14]。

然而,一个关键问题仍然存在:这张地图是如何组织的,以支持既准确又高效的心理导航?将单个神经元活动映射到预选变量(如位置)[5, 15] 的基础工作确立了海马体编码了什么,但未说明群体编码是如何组织以支持计算的。关注单个神经元仅提供了对集体编码的部分视角 [16]。为了对集体编码建模,研究人员转向了非线性降维技术,如 UMAP [17] 和 isomap [18],这些技术产生神经数据的低维嵌入,其中嵌入坐标旨在反映与编码变量相关的群体活动的系统性变化。然而,这些嵌入通常缺乏表征表征结构所需的几何保真度:嵌入中的微小位移可能对应于预测神经活动的巨大、不规则变化 [19, 20],使得难以定量研究地图的组织及其如何支持导航。

在此,我们通过使用 Γ-自编码器(Γ-AE)来解决这个问题,这是一种新颖的技术,利用微分几何构建流形模型,在潜在嵌入坐标与神经群体活动之间映射时更忠实地保留距离、角度和方向 [20]。我们将此方法应用于纵向钙成像数据,这些数据来自在学习记忆引导导航任务 [13] 的小鼠中跨越数周追踪的数千个海马 CA1 神经元。

我们发现,海马认知地图在表征空间中具有小世界网络结构 [21],结合了密集的局部邻域与一组有限的连接遥远状态的长程“虫洞”链接。我们将这种组织归因于群体编码的两个互补特征。首先,螺旋表征动力学,其中群体活动在状态空间中系统性地旋转同时在经验中漂移,保持局部连续性,同时使来自不同天的表征可区分。其次,广义状态场,其中协调的多野点活动在原本遥远的邻域中重复出现,创建了稀疏的长程捷径。总之,这些机制表明了一种组织原则,通过该原则,海马表征可以支持通过准确的内部世界模型进行高效搜索。

2 海马认知地图的定量模型流形

为研究小鼠海马的集体表征,我们使用了一项近期发表研究 [13] 中的海马 CA1 神经元钙成像数据。简言之,研究追踪了 11 只小鼠在学习导航虚拟现实迷宫过程中(图 1A),数千个表达钙指示剂 GCaMP6f 的神经元在多天内的活动。该迷宫由环形线性轨道组成,包含三个区域:指示区、近端奖励区 1(R1)和远端奖励区 2(R2)。在试验之间,使用 2 秒的黑暗传送期来重置轨道。对于每次试验,随机选择两种指示标记之一,该标记决定了小鼠需要舔舐以获得水奖励的位置(双选项线索 - 延迟 - 选择任务,2ACDC)(图 1B)。错误舔舐不会受到惩罚。小鼠通常在数百次试验中于 6-15 天内学会该任务。对于所有动物,均植入颅窗以成像背侧海马 CA1 神经元的神经活动(图 1C,左),并且每个神经元的活动在多天之间进行配准,从而实现跨时间的纵向活动追踪(图 1C,右)。

打开网易新闻 查看精彩图片

我们使用每只动物所有天数的这些数据,将认知地图建模为一个低维几何流形。每个包含 N 个神经元激活的图像帧定义了群体活动 N 维空间中的一个点,其第 i 个坐标是神经元 i 的测量活动(图 1D)。我们使用一种新颖的几何正则化自编码器(Γ-AE)[20] 对这些数据进行建模,该编码器在神经元活动的高维空间中直接构建低维几何流形(图 1E,见方法)。在此框架中,潜在变量定义了流形的坐标系,因此沿潜在维度的变化对应于数据空间中沿流形的移动。通过显式地保留局部距离、角度和方向,Γ-AE 生成了一个定量且可解释的群体活动地图(图 1F–H,见方法)。

3 位置、任务信念与试验次数的涌现变量

为检验认知地图模型与虚拟迷宫之间的对应关系,我们在图 2 中绘制了代表性小鼠的神经活动在 Γ-AE 学习到的三维潜在空间上的投影(见方法)。为识别海马所编码的显著变量,我们绘制了第 8 天所有帧的嵌入点,并按不同的轨道标记着色。为清晰起见,我们在图 2A 中将近端试验设为不透明,在图 2B 中将远端试验设为不透明。我们观察到,在局部范围内,沿潜在空间某一方向变化的数据对应于小鼠在轨道上的位置。我们发现,认知地图模型以正确组织迷宫标记序列和两种任务条件下拓扑结构的方式,沿轨道排列神经发放模式。此外,我们观察到,在每一点上,对应于两条轨道的数据在从指示区延伸至 R2 区的整个学习过程中,沿第二个方向分离(所有动物最后一天的嵌入见图 7)。

打开网易新闻 查看精彩图片

有趣的是,我们还观察到一些试验,其中认知地图模型起始于与一种任务条件相关的轨迹,但随后切换到与第二种任务条件相关的轨迹(图 2C)。此类切换常发生在错误试验(在错误的奖励区舔舐)或小鼠注意力不集中(奔跑但不舔舐)时。流形上的这种路径切换伴随错误的舔舐行为,提供了证据表明小鼠对其所处任务条件感到困惑。总体而言,这些结果表明,流形上的每条路径对应于小鼠认为自身所处的任务条件,而这些轨迹之间的分离——即潜在空间坐标中的第二个局部方向——表征了小鼠认为轨道各部分属于各任务条件的程度(任务信念)。

为识别海马编码的另一个变量,我们绘制了第 7 天和第 8 天的嵌入向量,并观察到所有轨道标记及轨道拓扑在两天之间高度对齐(图 2D),从而在很大程度上保留了位置和任务条件的前两个维度。通过旋转观察角度并按第 7 天和第 8 天各自试验的前半段与后半段对点进行着色(图 2E),我们观察到数据始终沿第三个几何轴随试验次数变化,且这种变化在天内和天间均保持一致。通过绘制所有天数的所有点并按试验次数着色,我们观察到沿这第三个几何轴存在一致且连续的梯度,该梯度持续贯穿整整一周(图 2F)。通过绘制所有点并改为按任务标记着色,我们额外观察到,近端任务条件(图 2G,不透明)与远端任务条件(图 2H,不透明)的数据在试验过程中仍沿任务信念方向保持分离,该方向可被解码并与独特的神经活动模式相关联。总体而言,这些分析表明,我们模型潜在空间中的特定点对应于轨道位置、任务信念和试验次数(时间)的心理状态。这一结构与先前工作一致,即海马群体活动可表现出解耦的编码,其跨任务变量的成分近似正交,且与当前漂移大致正交的维度上可保留与情境相关的结构 [22, 23]。重要的是,通过保留局部距离、角度和方向,我们的潜在空间捕捉并揭示了所学表征空间中流形上不同编码变量之间的定量关系。

虽然我们的认知地图模型包含三个局部方向,但小鼠所经历的心理状态绝大多数存在于两种不同的任务条件上(近端,如图 2A、G 所示;远端,如图 2B、H 所示,而非介于两者之间,如图 2C 部分所示),每种条件主要占据一个由位置和试验次数(时间)参数化的二维曲面。因此,为便于分析,我们将小鼠在认知地图上的经验模型定义为两个曲面,这两个曲面通过根据离散的位置(3 厘米)和时间(20 次试验)区间对嵌入潜在空间中的数据点坐标取平均而形成(图 2I,见方法)。该表征使我们能够将迷宫坐标随时间定量投影到这些曲面上(图 2I 中的网格线)。

4 涌现的流形旋转与漂移相对于独特的过往经验对新表征进行情境化

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

为了对神经活动空间中流形的这种一致全局旋转提供直观理解,我们考虑与一次试验中一种任务条件相关的神经发放模式,这对应于神经元空间中的一个环(图 3C)。如果我们考虑三个独立神经元 a、b、c 的虚拟发放模式,以及它们作为沿轨道位置函数的活动,纯旋转将导致发放模式向轨道上更早的位置平移。换句话说,集体发放模式将简单地向后移动,使得相同的发放模式代表轨道更下游的位置(即后移 [backshift] [24, 25])。因此,纯旋转不会产生超出该试验期间经历的任何新发放模式。因此,不同试验沿经验流形的垂直移动必然源于新的发放模式,这些模式区别于用于代表早期试验的模式。我们将随时间变化的神经元活动模式中的这两种变化与通常所说的表征漂移(representational drift)[26–29] 联系起来。在此,我们将活动变化中与位置对齐的分量指定为纯旋转,而剩余的正交分量指定为纯漂移(图 3D,左上)。旋转和漂移共同产生了跨越经验的表征螺旋式推进。纯漂移可能源于多种来源,包括:位置野(place field)形状的变化、位置野的形成或移除,以及不同的平移速率(图 3D,左下)。我们发现,在单个神经元记录中观察到了所有这些来源,并且它们被解码的模型活动所捕捉(图 3D,右侧,更多示例见图 10,单个神经元分解见图 6)。旋转和漂移同时存在这一事实意味着,来自前几次试验中相邻位置的信息被保留在(旋转中),同时也区别于(漂移)当前表征,从而允许过往经验为当前表征提供明确的情境。这种编码让人想起之前在海马 CA1 神经元中观察到的后继表征(successor representations)[30, 31],但将其推广到了群体编码,因此我们将其称为广义浓缩表征(generalized condensed representation, GCR)。直观地讲,GCR 意味着一个状态与其在任务空间中局部邻域的“压缩”印记一起被表征。

打开网易新闻 查看精彩图片

5 海马认知地图的小世界架构

那么,群体编码是如何从单个神经元的活动模式中涌现出来的呢?为了获得直观理解,我们在潜在空间中绘制了单个神经元的模型活动模式。当我们观察单个神经元(例如细胞 2034)在分箱前的活动时,我们发现它可以在潜在空间的多个区域活跃(图 4A,左)。我们使用等值面来表示模型对神经元活动水平的预测,如图 4A 右所示。对其他神经元进行的类似分析也显示了潜在空间中多个局部活动区域,且不同神经元的这些区域可能有所不同(图 4B,左)。这一框架将位置野(place fields,即神经元在参数化物理空间的空间坐标中具有局部活动)的概念推广到了广义状态场(generalized state fields, GSFs,见方法),即神经元在参数化认知地图的潜在空间中具有局部活动以及该活动的统计学显著局部最大值(GSF 峰值,见方法)。我们还发现,许多细胞表现出多个活动区域(图 4B,右上),这些区域涵盖了潜在空间体积的各种部分(图 4B,右下)。由此呈现出的图景是,一种编码源于多个神经元的发放,这些神经元在潜在空间内具有局部重叠的活跃区域。当经验流形穿过潜在空间内的特定坐标时,集体编码由在该坐标处活跃的所有神经元组成。

打开网易新闻 查看精彩图片

有趣的是,我们发现当多个神经元在一个潜在空间坐标处活跃时,它们在不同的潜在空间坐标处也活跃的概率在统计学上高于随机水平(图 4C,左),这表明神经编码可能具有由神经元共发放(co-firing)导致的额外结构。具体而言,我们考虑潜在空间中所有 GSF 的峰值,逐一查询它们(图 4C,左红),识别与 K = 200 个最近邻 GSF 峰值相关的神经元(图 4C,左青),并观察这些神经元的剩余 GSF 峰值是否在统计学上显著地聚集(图 4C,左绿)或未聚集(图 4C,左黑)(见方法)。总体而言,我们观察到,在查询邻域内具有峰值的许多神经元,在潜在空间的其他地方也具有显著聚集的共激活峰值,并且这些共激活峰值可能距离查询点很远(图 4C,右)。这一分析提供了证据,表明集体编码包含额外的结构,即代表一个潜在空间坐标的神经元中,有统计学显著的子集在不同的且遥远的潜在空间坐标处也集体活跃,这些坐标有时对应于非常不同的空间位置,并且相隔许多天。被视为潜在空间邻域上的图时,这种强烈的局部聚类与一组稀疏的长程链接的结合,产生了所学表征空间的小世界组织(small-world organization)[21](图 4C,右;见方法)。

为了检验长程链接是否不仅存在于认知地图的模型中,而且是否存在于物理空间和时间的遥远区域之间,我们回到实验数据,以确定是否有统计学显著数量的神经元在轨道上的多个位置共发放。众所周知,单个神经元在一天内可以在多个位置发放(图 4D,见方法)。基于我们的模型预测(图 4C),我们假设在特定查询位置共发放的神经元,并非在位置和天数上随机发放(图 4E,假设 1),而是会在特定的轨道位置甚至可能是其他天数系统地共发放(图 4E,假设 2)。确实,对于在一个特定查询位置发放的神经元,我们观察到其中统计学显著的子集也在不同的区域和不同的天数发放(图 4F,见方法,这些神经元在单次试验中的原始未过滤活动见图 11)。我们使用每个位置和天数区间作为查询重复此分析,并计算包含统计学显著数量共发放神经元的区间。我们绘制了一个跨越所有位置、任务条件和天数的区间图,其中边存在于每个查询区间与其他具有显著数量共发放神经元的区间之间,发现图中大约 1% 的链接与长程连接相关(图 4G,左)。我们在所有动物的图中都识别出了此类链接,并进一步发现,使用相同程序对较小数量的神经元子样本进行处理时,无法捕捉到绝大多数这些长程连接(图 12)。因此,与模型预测一致,我们发现在多个且遥远的位置存在显著的神经元非局部共活动。这种连接图谱让人联想到,并且在特征上显著符合,一个小世界网络(图 4G,右,所有 11 只动物 p < 0.001 ,见方法)。

6 通过准确高效的地图实现有效导航

这种小世界网络连接性为大脑调节神经编码以强调认知地图的不同特征(短程与长程连接)提供了途径。从一个状态到另一个状态进行心理导航的一个可能特征是,后一个状态与一个活动模式相关联,该模式与前一个状态的活动模式密切相关。采用组合方法,我们使用其他状态模式的非负加权和来重构特定状态的活动模式,并使用权重作为状态间关系强度的度量。具体而言,对于我们在潜在空间曲面上的位置和试验区间,我们将该点解码为神经元活动模式,并使用其他位置和先前试验区间的解码活动模式作为基来重构该模式(图 5A)。在此框架内,我们发现当观察神经元的不同子集时,不同的状态可能变得密切相关。

打开网易新闻 查看精彩图片

当使用所有神经元时,我们发现最强的权重开始集中在同一试验区间要重构的点周围,并对于较早的试验向轨道上更远的位置移动(图 5B,左)。对试验区间求和权重并通过重构每个位置重复此过程,我们发现对于任何特定的要重构的位置,绝大多数权重(浅蓝色点)位于该位置的正前方和正后方(图 5B,右上),且具有显著的前向偏斜(图 5B,右下)。这种对未来状态的偏斜让人想起后继表征(successor representation, SR,SR 群体几何的简单示例见图 13),即智能体不仅存储关于其当前状态的信息,还存储对轨道更下游未来状态的期望。在我们的分析中,这种期望通过广义浓缩表征(图 3)从先前描述的流形旋转和漂移的螺旋动力学中集体涌现,该表征浓缩了与过去状态相关的集体神经发放模式的信息,这些信息可以代表超越简单物理变量的更一般信息。

相反,当我们使用包含更多 GSF 峰值的神经元子集进行重构时,我们发现最强的权重不再从要重构的点局部且连续地延伸,而是以大的簇状分布,在位置和试验区间上存在离散跳跃(图 5C,左)。通过重构同一试验区间的的所有位置并对试验求和权重来重复此分析,我们确实发现当前位置正前方和正后方的局部权重少得多,而在遥远位置以簇状分布的权重多得多(图 5C,右)。因此,通过观察不同的神经元子集,不同的状态可能变得密切相关,这可能使大脑能够在认知地图架构中准确局部表征和高效长程搜索的模式之间动态调节。

确实,我们发现证据表明小鼠在任务期间暂停时利用了这种不同的模式,这通常与记忆巩固和规划而非主动任务解决相关 [32]。具体而言,我们观察称为同步钙事件(synchronized calcium events, SCE)的活动模式,这些事件发生在小鼠静止(速度 = 0)且不舔舐时。研究表明,使用钙成像记录的 SCE 与电生理测量的锐波涟漪(sharp wave ripples, SWR)[33, 34] 显著共现,SWR 是与巩固和规划相关的快速顺序神经元发放模式 [32]。为解码这些 SCE 是否包含先前经历的位置和任务条件的某些成分,我们再次以组合方式将每个 SCE 重构为与每个位置和天数区间相关的神经元活动模式的非负加权和(图 5D),并仅保留在置换检验下具有统计学显著性的权重(见方法)。类似于经验曲面上的局部重构(图 5B),我们发现一些 SCE 解码到靠近动物实际位置和天数的附近状态(图 5E,红框)(黑框)。这些具有局部解码状态的 SCE 类似于 SWR 中经常观察到的顺序重激活模式 [32]。类似于经验曲面上的非局部重构(图 5C),我们也观察到 SCE 从同一天动物的位置远程且不连续地解码(图 5F),类似于最近发现的超扩散 SWR [35, 36]。最后,我们还观察到 SCE 在位置、任务条件上完全远程解码,且跨越数天(图 5G, H),这与最近的发现一致,即离线系综重激活可以链接相隔数天形成的记忆 [37]。

最后,我们寻找额外证据证明这些 SCE 正在利用认知地图的小世界连接性(图 4)。这种利用的一个可能特征是,每个 SCE 的显著解码区间沿认知地图小世界网络的边彼此连接的频率高于随机水平,表明 SCE 与地图之间存在显著对齐。为测量每个 SCE 的这种对齐,我们计算 SCE 重叠分数,作为显著解码的 SCE 区间(图 5I,左,红框)与小世界图上距这些显著区间一个连接的区间(图 5I,左,紫框)之间的相关性。对于包含四个或更多显著解码权重的 SCE,我们发现所有动物的实证测量重叠分数均显著高于置换检验下的水平(图 5I,右,见方法)。因此,认知地图的架构不仅支持可被不同神经元子集访问的局部准确表征和高效搜索,而且我们提供的证据表明,这两种模式均在离线处理期间的 SCE 中被使用并利用小世界架构。

7 讨论

在本研究中,我们使用 Γ-AE [20] 获得了一个低维且几何忠实的海马 CA1 群体活动认知地图模型,跨越数周的学习过程 [13],从而捕捉了任务状态在群体活动空间中是如何定量关联的。我们发现这张地图具有小世界组织 [21, 38]:强烈的局部聚类保留了精细结构,而一小部分非局部桥梁提供了原本遥远状态之间的捷径访问。关键在于,这种小世界结构不在解剖学连接中,而在表征的功能空间中:即群体活动状态如何相互关联。我们将局部成分归因于跨经验的螺旋式(旋转加漂移)表征动力学,将长程成分归因于由铺满认知地图的广义状态场捕捉到的协调多野点结构。与静止相关的同步群体事件解码到遥远状态,这些状态的位置与该桥梁结构对齐,将表征拓扑与离线群体动力学联系起来。下面我们将讨论这两种机制及其意义。

7.1 来自螺旋群体动力学的局部结构

认知地图的密集局部邻域源于螺旋群体动力学。跨经验地,群体流形相对于过往经验以连贯的低维方式旋转,耦合了跨试验的邻近状态,使得每个状态携带关于其在任务空间中局部邻域的结构化信息。在单细胞水平上,单个神经元表现出广泛的经验依赖性变化,包括位置野后移、偏斜、漂移和可靠性的变化 [22, 24–27, 39–47]。我们的框架为这种多样性提供了群体水平的视角:异质的单神经元变化集体揭示了连贯的低维结构,这是从任何单个细胞难以推断的。

这种结构化耦合自然地连接到预测地图思想,如后继表征(SR),其中每个状态被表示为一个向量,编码在当前行为策略下相对于外部环境的预期未来状态占用 [30, 31]。SR 提供了一个强大的框架来理解海马表征如何支持灵活规划,最近的工作表明,类 SR 结构可以从生物学上合理的 learning rules 中涌现,包括在 theta 序列内运作的脉冲时间依赖可塑性(STDP)以及在行为和重放期间的顺序预测学习 [48–51]。跨经验的连贯旋转产生了我们称为广义浓缩表征的东西:群体流形的一种几何排列,其中每个状态的位置反映其情境不是相对于外部环境,而是相对于来自先前经验的群体流形。这提供了一个神经基质,通过它,与后继表征原则一致的预测关系可以从群体几何中读出。

将表征变化分解为旋转分量和正交漂移分量阐明了分工:旋转保留并重新表达来自先前经验的结构,而漂移引入新模式,扩展表征容量并支持跨天和任务状态的情境分离。漂移的这种功能角色与越来越多的工作一致,这些工作表明表征漂移服务于多种计算目的,包括持续学习、适应变化的环境以及对突触扰动的鲁棒性 [28, 29, 52]。因此,螺旋动力学为认知地图提供了局部可导航的支架。但仅靠局部连续性不支持跨遥远状态的高效搜索;为此,地图需要捷径。

7.2 来自广义状态场的长程桥梁

完成小世界架构的稀疏长程桥梁源于广义状态场(generalized state fields)。局部“野”长期以来一直被用于描述海马对位置和时间的编码,并已被扩展到任务相关的抽象变量 [5, 6, 12]。我们的广义状态场(GSF)通过直接在表征空间的几何中定义野来推广这一想法:即神经元具有高解码活动的潜在坐标的局部区域,跨越任务位置、条件、时间以及群体编码中表示的任何其他物理和非物理变量的变化。即使代码的内在维度难以先验指定,这也提供了对局部结构的紧凑描述。

多野点发放在海马神经元中常被观察到,特别是在扩展环境和复杂任务中 [53, 54]。在我们的框架中,多野点结构成为一种计算特征,因为它可以揭示遥远状态之间的非局部链接。关键的观察结果是神经元之间的协调:在一个邻域中共发放的细胞倾向于在特定的遥远邻域中再次共发放,其中“遥远”可以意味着在物理空间上分离、跨越学习天数,甚至在构成认知地图的神经活动表征空间中。这些协调的共激活创造了统计学上显著的非局部重叠,其在表征空间中充当捷径边。长程桥梁是稀疏的(大约 1% 的边),并且似乎由相对较小的神经元子集驱动。检测这种稀疏结构可能需要最近才变得可行的大规模纵向记录(图 12)。

我们观察到具有重叠主野的神经元倾向于表现出协调的次级野(即非局部共发放结构),乍一看,这似乎与先前认为多野点结构在细胞间很大程度上是独立的工作不同。特别是,Rich 等人报道,在一个非常大、大致均匀的线性环境中,CA1 位置野的数量和位置可以很好地由随机模型解释,几乎没有证据表明不同野之间存在结构化的共激活 [53]。然而,后续研究强调了海马编码表现出额外结构的条件,包括:在具有重复元素的环境中,具有路径等效(重复)野的神经元在相关位置之间基于经验的协调 [55];具有相似野位置(通常靠近显著任务特征和目标)的 CA1 神经元的非随机解剖聚类 [56];CA1 共活动动力学中携带超越单细胞调谐信息的依赖于情境的结构 [57];以及 CA3 中更强的相关“细胞集合”组织,这与可以稳定和绑定分布式表征的循环网络机制一致 [58]。一个简约的调和是,多野点结构的协调成分是稀疏且依赖于状态/任务的:它可能在特征贫乏的轨道上进行连续的 theta 主导奔跑期间(且同时采样有限)较弱或难以检测,但在具有重复显著区域、记忆引导需求以及跨天大规模群体记录的任务中变得更加明显。重要的是,我们的机会水平对照通过使用并随后标准化由观察到的峰值密度分布估计的多项式零概率(公式 10;方法 §8.11),明确考虑了跨位置峰值密度的经验不均匀性,因此我们报告的超额次级共发放不能仅归因于共享占用或共同线索/奖励位置。总之,这些比较表明多野点发放可以反映两者:(i) 一个近似随机的背景成分,一旦考虑到神经元和位置特定的倾向性,它支持广泛覆盖;以及 (ii) 一个额外的、稀疏的协调成分,可能包括稀疏长程关联的基线先验,并且可以由行为/生理状态选择性表达或放大,从而在认知地图中提供长程关联链接,包括跨时间(例如,跨试验和天数)。

澄清这些桥梁与底层流形结构之间的关系很重要。Γ-AE 嵌入产生了一个平滑、连续的流形,忠实地铺排任务变量;该流形本身不包含拓扑捷径或不连续性,并且具有与每个潜在空间坐标相关的定义活动模式。我们描述的虫洞连接性指的是协调发放的统计结构:某些神经元子集在潜在空间中的多个遥远位置一起活跃,对应于表征空间中流形上的遥远位置,创造了类似捷径的关联的潜力。

我们观察到同步群体事件与这种捷径结构对齐,表明长程关联可以被调用,但控制何时以及如何的机制仍然开放。一种可能性是海马群体编码以依赖于状态的方式被重塑,使得神经调节信号 [59]、兴奋 - 抑制平衡的转变 [60, 61] 或振荡机制的变化 [32] 改变哪些神经元参与活跃系综,从而强调更多局部与更多非局部结构。最近的计算工作进一步提出,内嗅输入可以通过网格细胞成分的谱控制,将海马序列生成在局部扩散动力学和具有偶尔长跳跃的机制之间进行调节 [62]。在我们的数据中,CA1 表征空间本身被组织成密集的局部邻域,以及一组相对稀疏的源于协调多野点结构的非局部关联,提供了此类控制信号可以调用的具体地图级支架。一个互补的可能性是,可塑性机制可以快速印记或加强这些关联;例如,行为时间尺度突触可塑性(BTSP)可以在秒级分配信用,并可能帮助建立或加强跨位置和天数的稀疏长程链接 [63]。第二,下游电路可以实现灵活的读出策略。均匀加权海马输出的读出可能遵循流形的平滑局部几何,而选择性加权携带多位置关联的亚群的读出可以直接访问长程结构。不同的海马重激活类型伴随着不同的前额叶调节模式的证据支持了这种灵活读出的合理性 [64]。总之,重塑编码和选择读出为灵活调用小世界架构提供了互补的途径,识别控制这种调节的电路和条件是未来工作的重要目标。

总之,螺旋动力学和协调的多野点发放产生了一种兼具局部忠实性和全局覆盖范围的表征架构。一个自然的问题是,这种架构是否实际上在海马计算期间被调用。

7.3 同步事件穿越捷径支架

解释表征拓扑的一个核心挑战是建立功能参与:捷径支架只有在系统能够且确实穿越它时才有意义。大量工作表明,海马活动可以在在线和离线期间表达非局部表征 [3, 65, 66]。在行为期间,据报道在决策点 [67, 68] 和目标导向导航期间存在前瞻性扫描(prospective sweeps),其中 theta 序列反映当前目标并在可能的未来之间快速循环 [65, 69–71]。在静止和睡眠期间,锐波涟漪(SWR)事件支持多种形式的顺序重激活 [32],包括向前和向后序列 [72–74]、空间和时间上遥远经验的重激活 [66,75]、构建从未经历过的轨迹 [67]、新颖探索之前的预期序列 [76],以及与目标导向规划相关的序列 [2, 77]。

在我们的钙成像数据中,与静止相关的同步群体事件提供了一个窗口,让我们了解捷径支架是如何表达的。在这些事件期间,解码的活动模式经常落在遥远状态上,并且这些解码状态的位置由多野点组织预测。这表明捷径支架不仅仅是表征几何的静态属性,而是海马群体动力学的一个可访问特征。由于钙成像不直接测量涟漪振荡,我们将这些事件视为群体水平现象,在适当条件下可能与与重放相关的动力学重叠,而不是将它们与电生理定义的 SWR 一对一等同。这种方法与之前关于 SCE 及其与海马重激活关系的钙成像研究一致 [33, 34, 78]。

最近的工作强调重放跨越多种动力学表型 [79]:静止重放,其中解码位置保持在单一位置 [80];扩散重放,其中解码位置像布朗运动一样逐渐通过邻近状态 spread [81];以及超扩散重放,其中 abrupt transitions 携带解码位置比随机扩散预测的更远 [35,36]。具有间歇性长跳跃的超扩散轨迹让人想起动物搜索行为中常描述的重尾步长统计(heavy-tailed step statistics),即莱维行走(Lévy walks)[82, 83]。莱维行走类似的动力学也已在神经群体活动中报道 [84],在我们的框架中,这种统计量可能自然地从主要由局部遍历组成、偶尔被罕见的虫洞跳跃打断的过程中产生。与此图景一致,我们在同步事件期间观察到的过渡跨越了从平滑局部进展到跨越遥远位置和天数的突然跳跃的全范围,后者类似于在钙成像的较粗时间分辨率下表达出的超扩散动力学。值得注意的是,如果使用限制于当天任务和状态空间的解码器,事件也可能显得弱可解码;在我们的框架中,当活动穿越时间虫洞到达位于该解码器基座之外的其他天或情境的表征时,这种“不可解码”事件是自然预期的,因此在今天的坐标中看起来是随机的。我们的结果表明,小世界支架提供了一种支持这些多样过渡的表征结构,这与海马电路连同相关区域(如内嗅和前额叶皮层)被组织用于高效遍历的观点一致。更广泛地说,我们的框架提供了一种通过将其解码轨迹与明确的表征支架相关联来解释和分类异质性涟漪相关和涟漪样群体事件的方法,潜在地有助于识别额外的、此前未表征的事件表型。

7.4 对世界模型和人工智能的启示

我们识别的组织原则可能为人工世界模型和推理系统的设计提供信息。现代人工智能的一个核心挑战是构建能够高效规划、推理和泛化的系统。大型语言模型展示了非凡的能力,但通常需要大量的测试时计算(思维链推理、树搜索或迭代细化)[85–90] 来解决复杂问题。学习潜在动力学以进行规划的世界模型 [91–94] 面临类似的挑战:通过学习的潜在空间逐步展开轨迹可能在计算上昂贵,特别是对于长视野、复杂任务。我们的结果表明了一个具体的架构假设:当表征保留可靠的局部邻域并包含稀疏的非局部桥梁以减少到达遥远状态所需的中间步骤数量时,高效搜索就会出现。

这一想法与通过展开学习的潜在动力学进行规划的世界模型智能体一致。小世界先验建议保持潜在动力学局部平滑且可预测,同时学习一组稀疏的长程关联,可以在保持局部一致性的同时减少展开深度。对于在大型知识库上执行多跳访问的检索增强系统 [95, 96],它激励将学习到的图正则化为具有高局部聚类和更短全局路径的结构。

克隆结构因果图(CSCG)[97–101] 在此背景下提供了一个引人注目的框架。CSCG 通过学习一个图来解决感知混叠问题,其中感官状态的“克隆”代表不同时间情境下的相同观察,解释了分裂细胞(splitter cells)和依赖于情境的位置编码等现象。最近的工作表明,CSCG 独特地不仅重现了在小鼠学习期间观察到的最终正交化状态表征,还重现了逐步学习轨迹本身,这与 LSTM 或 transformers 等序列模型不同 [13]。基于模式的扩展进一步表明此类图如何在更高级抽象结构下被重用和快速重新锚定 [101, 102]。我们的结果表明了针对规划的有针对性的扩展:在克隆之间添加一组单独的稀疏长程“门户”边,这些克隆在遥远情境中可靠地共现(类似于协调的多野点结构),施加一个小世界先验,在引入有限数量捷径的同时保持高局部聚类,并根据任务需求或不确定性门控门户影响 [99, 100]。

广义浓缩表征提供了进一步的架构并行。在 transformers [103] 中,每个 token 嵌入将来自上下文窗口的信息压缩到当前表征中,使下游计算无需显式检索每个先前的 token。类似地,流形旋转产生了一种预测性组织,其中每个状态携带关于其局部时间邻域的浓缩信息。这可以被视为一个几何“上下文窗口”:流形上的每个点隐式地不仅代表单个状态,而且代表时间上相关的状态的邻域,以下游电路可以直接使用的形式打包。这种结构化和动态压缩可能使下游区域能够高效读出和计算,而无需显式重放或检索完整序列。人工系统可能受益于类似的架构模式:学习每个潜在状态隐式编码其局部邻域的表征,减少对显式多步展开或长序列注意力的需求。

7.5 展望

这项工作为未来的研究开辟了几个方向。一个关键的开放性问题是在行为期间如何控制捷径结构。高效的规划需要控制是利用捷径还是倾向于平滑的局部遍历。任务可以被设计为将局部准确性与全局访问分离:例如,要求在多个局部不可区分的遥远候选者之间进行选择,或者引入潜在情境和多天依变关系,迫使跨越时间以及空间的链接。海马体、内嗅皮层和前额叶皮层的同步记录可以测试捷径参与是否取决于可用的抽象尺度,以及前额叶信号是否将遍历偏向局部连续路径而非非局部过渡。因果扰动可以针对群体水平的结构,包括与静止相关事件的闭环干扰 [61,104],以及选择性削弱协调多野点结构同时保留局部解码忠实性的操作。

小世界连接不仅可以缩短路径:在合适的机制下,它还可以近似一个层次图,因为紧密连接的局部邻域充当模块(或子树),而一组稀疏的更长程捷径有效地提供了模块之间的高级链接,实现从粗到细的路由。关于去中心化导航的工作进一步表明,这种类似层次的效率取决于捷径长度是如何分布的,其中距离依赖规则(通常接近与底层空间匹配的幂律)使得简单的局部贪婪步骤能够可靠地找到短路径 [105]。海马 - 内嗅系统为此类组织提供了自然的多尺度构建模块:网格细胞被排列成具有不同空间周期的模块 [106, 107],且表征尺度沿海马长轴系统地变化,包括位置野大小的梯度 [108–110]。在此背景下,我们对小世界结构的观察提出了一个清晰的下一个问题:认知地图中的长程链接是否遵循距离依赖的统计规律,从而使网络有效地类似层次结构且最优可导航,以及学习和与内嗅及新皮层电路的相互作用如何塑造这种连接?相关地,层次表征可以从深度网络的学习动力学中涌现,指向可能也适用于跨尺度海马 - 新皮层组织的通用原则 [111]。

更广泛地说,将表征拓扑视为共享设计变量,为神经科学与人工智能之间持续的交流提供了一条富有成效的前进路径。在人工系统中,捷径密度和门控可以直接被操纵,并评估其对推理和鲁棒性的影响。在神经科学方面,一套迅速成熟的流形和潜在变量方法 [47, 112–115] 使得以日益增加的精度表征群体水平几何结构成为可能,揭示跨脑区的神经编码被组织在低维流形上,其拓扑反映了计算需求 [16, 116–118]。通过测试神经电路中的拓扑预测并将由此产生的原则转化为世界模型架构来收紧这一循环,可能在两个方向上产生见解。

8 方法

8.1 实验数据集与预处理

所有分析均在一项先前发表、公开可用的纵向双光子钙成像数据集上进行,该数据集来自海马 CA1,采集于小鼠学习记忆引导虚拟导航任务期间 [13]。在该研究中,雄性与雌性 Thy1-GCaMP6f 小鼠被头固定于虚拟现实装置中,并接受 2ACDC 任务训练:在一条 230 厘米长的走廊早期出现的指示线索,提示本次试验中奖励将在近端或远端奖励线索处发放。成像数据可通过 Figshare 获取(https://doi.org/10.25378/janelia.27273552 ),并在 cognitivemap.janelia.org 提供交互式可视化。

我们使用了发布时提供的神经与行为变量,包括与会话对齐的行为位置与试验类型,以及如 [13] 所述跨会话追踪的 CA1 神经元的处理后神经活动轨迹。简言之,在原始工作中,神经元使用双光子随机访问介观显微镜以 10 Hz 频率在多个相邻成像区域记录,并使用图像配准与聚类程序跨天配准细胞,使用 Suite2p [119] 提取荧光轨迹。所有分析均使用 Suite2p 提取的反卷积钙信号轨迹。除非另有说明,我们的分析聚焦于标准 2ACDC 任务中的核心近端与远端奖励试验类型,并使用作者提供的预处理与细胞追踪结果,未进行重新分割。

8.2 Γ-自编码器架构

与许多其他技术类似,Γ-AE [20] 构建数据的低维非线性流形。然而,与其他技术不同,Γ-AE 选择性地惩罚流形几何中涉及的所有失真。下文我们将讨论 Γ-AE 与其他技术的比较。

一个雄心勃勃的目标是使用自编码器构建一个低维且可解释的小鼠认知地图模型,阐明最显著的变量并准确表征它们之间的定量关系。许多深度神经网络的一个常见失效模式是,它们是通用函数逼近器,所形成的潜在空间向神经元活动空间的投影高度失真 [120, 121]。因此,在其产生的模型中,潜在空间中的距离和角度在神经元活动空间的流形上得不到保留,使得难以形式化所发现变量之间的定量关系(图 1F,左、中)。此外,沿潜在空间坐标的微小变化可能导致神经发放模式的剧烈波动(图 1G,左、中),这使得难以理解沿潜在空间坐标移动在神经发放模式变化方面意味着什么。我们的几何保持自编码器 Γ-AE 通过在损失函数中添加额外项来校正这些失真,这些项选择性地惩罚过度的流形非线性(见下文)。该过程产生一个具有足够非线性以定量表征数据的模型流形,同时在将潜在坐标映射到数据空间中的流形时局部保留距离、角度和方向。距离的保留确保潜在空间中的小(大)变化对应于神经元活动模式中的小(大)变化(图 1F,右)。角度的保留确保潜在空间中正交的方向对应于神经发放模式中最大独立的变化(图 1F,右)。最后,方向的保留确保沿潜在空间中特定方向移动会导致神经元活动规律且一致的变化(图 1G,右)。通过将这些代价纳入自编码器,我们将小鼠的认知地图建模为一个低维流形,该流形保留了群体活动中的定量结构,使我们能够研究地图如何组织以支持高效搜索(图 1H)。

我们通过将所有流形非线性完全且正交地分解为两种曲率来实现这一流形模型:外在曲率(extrinsic curvature),衡量集体变量方向沿流形坐标变化的快慢;以及参数效应曲率(parameter effects curvature),衡量潜在空间与数据空间之间距离和角度的失真。因此,Γ-AE 使我们能够构建可解释的非线性流形——潜在空间中的方向对应于数据空间中一致的方向——且定量的——潜在空间中的距离和角度反映数据空间中流形的距离和角度——即使在数据稀疏或无数据的区域也是如此。因此,Γ-AE 不仅构建了数据的几何一致流形,还构建了数据所占据的整个非线性子空间的几何一致流形。

打开网易新闻 查看精彩图片

8.3 流形几何

由于深度神经网络是通用函数逼近器,解码器形成的流形原则上可以失真,以任意顺序穿过数据。根据 [20],我们对所有流形非线性进行正交分解和正则化,以选择性地允许哪些非线性。该分解由两个组成部分构成。

首先,为了校正潜在空间坐标与流形之间距离和角度的失真,我们对参数效应曲率(parameter-effects curvature)进行正则化:

打开网易新闻 查看精彩图片

其中 是度量张量的逆,是克里斯托费尔符号(Christoffel symbols)[122],且公式 3 采用爱因斯坦求和约定书写(重复的希腊字母指标表示求和)。由公式 3 给出的参数效应曲率是流形二阶导数中在该点与流形相切的分量的范数。直观地讲,公式 3 衡量了潜在空间中的规则点阵在数据空间中经解码器映射到流形上时的失真程度。

其次,为了确保流形坐标具有可解释性,使得潜在空间中一致的方向对应于神经元活动模式的相似变化,我们强制要求潜在空间中的直线大致对应于数据空间中的直线,方法是同时对流形上每一点的外在曲率(extrinsic curvature)进行正则化,我们将其推导为

打开网易新闻 查看精彩图片

外在曲率是流形二阶导数中在该点与流形法向的分量的范数。直观地讲,公式 4 衡量了当我们遍历流形时,流形切线向新方向弯曲的程度。

此外,即使公式 3 量化了流形切线上的非线性,潜在空间坐标与流形切线之间的绝对全局尺度仍然存在任意性(例如,潜在空间中的一个单位距离在流形上有多远)。为了固定一个绝对尺度,我们在流形的尺度上包含一个额外的损失项,使其大致均匀,使得

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

8.4 构建经验曲面

打开网易新闻 查看精彩图片

8.5 计算广义状态场

打开网易新闻 查看精彩图片

8.6 计算统计显著的 GSF 峰值

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

8.7 计算统计显著的 GSF 共峰值

打开网易新闻 查看精彩图片

8.8 使用潜在空间共峰值定义小世界特性

打开网易新闻 查看精彩图片

8.9 定义位置和天数的率图

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

其中 ∗ 表示与核 k 的卷积, k 是一个标准差为 5 厘米的高斯核。该率图为每一天和每种任务条件分别构建。在率图及后续显著峰值分析的背景下,我们将每种任务条件单独视为一个环形轨道,使得这些卷积在两个周期性轨道上进行,从而为每种任务条件生成一个率图。然后,我们将这两个率图拼接在一起,对于任何涉及率图及后续峰值的分析,将沿此拼接率图的区间索引称为位置。

8.10 定义统计显著的率图峰值

打开网易新闻 查看精彩图片

8.10 定义统计显著的率图峰值

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

8.12 计算小世界系数并生成保度零模型

为了检验由位置(5 厘米)和时间(1 天)区间节点以及从查询区间到具有统计显著更高共峰值计数的其他区间的边所组成的图,我们计算了小世界系数 [38],该系数取图的聚类系数相对于零假设的比值,以及图的最短路径长度相对于零假设的比值。为了构建零假设,我们使用了 Maslov-Sneppen 算法 [124],该算法执行保度边交换,利用每条边约 10 次交换生成 1000 个随机化零假设图。根据我们实证测量的图和相应的零假设图,我们通过取经验聚类系数与零假设聚类系数之比,除以经验特征路径长度与零假设特征路径长度之比,来计算小世界系数。随后,我们通过计算每个零假设重连图的聚类系数与零假设系综的聚类系数之比,以及零假设重连图的特征路径长度与零假设系综的特征路径长度之比,来计算小世界系数的零假设分布。

8.13 解码与检验同步钙事件

同步钙事件(SCEs)是从活跃任务期间的静止时段(而非会话前或会话后的休息期)中识别出来的。这一标准捕捉了动物在目标导向导航过程中自愿在任务中途暂停的时刻——这些短暂暂停被认为与记忆巩固和规划相关。我们将这些事件称为 SCEs 而非锐波涟漪(SWRs),因为钙成像不直接测量底层的振荡动力学,尽管先前工作已证实此类群体事件可与电生理测量的 SWRs 共现。如果一个帧满足以下标准,则被归类为 SCE:(1) 速度 = 0 cm/s,(2) 不在试验间传送期,以及 (3) 在该帧或 ±2 帧内无舔舐行为。鉴于 10 Hz 的成像频率,每帧对应 100 ms。为确保 SCE 帧与用于流形构建的运行帧之间的时间分离,SCE 帧要求在任一侧至少有连续两个静止帧作为填充,而流形帧则要求至少有连续两个高速帧(速度 > 5 cm/s)作为填充。这确保了 SCE 帧与流形帧之间至少有 500 ms 的最小分离,最大限度地减少了信号串扰。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

8.14 检验 SCE 解码图与小世界图之间的重叠

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

为了检验这种对齐是否具有统计显著性,我们构建了一个置换零假设,其中我们取解码系数(其包含每个天和位置区间的系数),并将位置索引循环移位一个介于 1 到位置数减 1 之间的随机整数,然后重新计算重叠分数。这种循环移位确保我们保留了任何空间相关性,以便我们的零假设重叠分数不会因破坏空间相关性而人为地过低。我们执行这种零假设移位 1000 次,发现我们实证测量的重叠分数大幅高于整个零假设分布。

原文链接:https://www.biorxiv.org/content/10.64898/2026.02.07.704615v1.full.pdf