NC | 决策背后的神经序列：两种全新环路模型揭示大脑的证据累积机制|序列|波包|海马体|神经元|脑区|证据

认知神经科学前沿文献分享

基本信息

Title:Neural circuit models for evidence accumulation through choice-selective sequences

发表时间:2026-03-17

发表期刊:Nature Communications

影响因子:15.7

获取原文:

1. 添加小助手:PSY-Brain-Frontier即可获取PDF版本

研究背景

在日常生活中，无论是判断远处的红绿灯何时变色，还是在迷宫中寻找出口，我们的大脑都需要随时间不断收集信息（即“累积证据”），最终做出决策。在过去几十年的认知神经科学研究中，领域内的主流观点一直认为：大脑是通过神经元的“持续性活动（persistent activity）”来累积证据的。也就是说，随着证据的增加，特定神经元的放电频率会像爬坡一样持续上升或下降。

然而，随着大规模神经记录技术在啮齿类动物实验中的普及，这一经典理论遇到了挑战。研究者们发现在许多决策任务（尤其是涉及空间导航的任务）中，大脑多个区域的神经元并没有表现出持续放电。相反，它们是短暂且按顺序激活的，形成了一种“选择特异性序列（choice-selective sequences）”。神经元就像接力赛跑一样，一个接一个地短暂亮起，而具体是哪一组神经元参与接力，取决于动物最终的决策选择。

这就引出了一个关键的科学问题：如果神经元只是短暂激活，它们该如何把刚刚收集到的证据“传递”给下一批神经元？传统的积分器模型无法解释这种序列活动。为了填补这一空白，本研究提出了两种全新的神经环路模型，并结合小鼠在虚拟现实迷宫中的大规模神经记录数据，揭示了大脑不同区域究竟是如何在序列活动中完成证据累积的。

研究核心总结

为了弄清序列放电背后的计算逻辑，研究者首先构建了两种能够产生“选择特异性序列”的候选计算模型，随后将模型预测与小鼠四个脑区（前扣带回 ACC、压后皮层 RSC、背内侧纹状体 DMS、海马体 HPC）共计 14,247 个神经元的活动进行了对比。

一、提出两种全新的序列证据累积模型

要让序列放电的神经元完成证据累积，模型必须做到两点：第一，在当前位置整合新出现的证据；第二，将累积的证据无损地传递给序列中的下一批神经元。研究者提出了两种截然不同的机制来实现这一目标：

1. 相互抑制的竞争链模型（Competing chains model）：
在这个模型中，存在代表“左”和“右”的两条神经元链。证据的大小由这两条链在同一位置的神经元放电频率的相对振幅来编码。当动物向前移动时，位置门控信号会激活下一对神经元，前一对神经元则通过前馈连接将振幅信息传递下去。这种模型下，神经元对证据的调谐是单调的（monotonic）——证据越强，放电频率越高或越低。

2. 位置门控的波包吸引子模型（Position-gated bump attractor model）：
在这个模型中，证据不是由放电频率的高低来代表，而是由**网络中被激活的神经元的位置（波包，bump）**来代表。随着证据的累积，这个高活动的“波包”会在代表不同证据水平的神经元之间左右移动。当动物移动到新位置时，波包的当前位置会被传递给下一层神经元。这种模型下，单个神经元对证据的调谐是狭窄且单峰的（unimodal）——它们只在特定的证据水平下才达到最大放电。

Fig 1. 小鼠在虚拟现实 T 型迷宫中执行证据累积任务的示意图，以及在 ACC、RSC、HPC 和 DMS 四个脑区观察到的选择特异性序列活动。

Fig 3. 相互抑制的竞争链模型示意图。该模型通过神经元放电频率的振幅来单调地编码累积证据，并能完美复现行为学表现与序列放电特征。

Fig 4. 位置门控的波包吸引子模型示意图。该模型通过局部激活波包在网络中的位置来编码证据，其神经元表现出狭窄的单峰调谐特征。

二、新皮层与海马体采用了截然不同的证据编码策略

虽然在 ACC、RSC 和 HPC 中都能观察到看似相似的“选择特异性序列”，但当研究者深入分析单个神经元对证据的调谐曲线时，发现了令人惊讶的差异。

在新皮层区域（ACC 和 RSC），大多数神经元表现出宽泛的单调调谐（monotonic tuning）。它们的放电频率随着累积证据的增加而呈现出明显的上升或下降趋势，这与“竞争链模型”的预测高度一致。

相反，在海马体（HPC）中，神经元主要表现出狭窄的非单调调谐（non-monotonic tuning）。这些神经元的调谐曲线峰值广泛分布在整个证据区间内，意味着它们只对某个特定的“证据总数”敏感。这一特征完美契合了“波包吸引子模型”的预测。这表明，海马体可能在利用更密集的神经元资源来构建一张包含位置与证据的“联合认知地图”，而新皮层则更倾向于用放电率的对比来直接驱动最终的二元选择。

Fig 2. | Choice-selective sequences are not predicted by traditional integratormodels. A Schematic of a traditional mutually inhibitory integrator...

Fig 5. 不同脑区神经元的证据调谐特征对比。ACC 和 RSC 的神经元主要表现出宽泛的单调调谐（符合竞争链模型），而 HPC 神经元则表现出狭窄的单峰调谐（符合波包吸引子模型）。

三、从“渐进证据”到“二元抉择”的动态转换

如果 ACC 和 RSC 负责累积证据，那么它们的活动应该反映出渐进的累积过程，而不仅仅是最终的“左/右”决定。

研究者通过单细胞和群体解码分析发现，在迷宫早期的线索呈现阶段，ACC 和 RSC 的神经元确实表现出对证据的渐进式（graded）编码。然而，随着小鼠在迷宫中不断前进并进入延迟期（delay period），这种渐进式的证据调谐开始变得锐利，最终转变为类似阶跃函数的二元选择编码（binary choice tuning）。

为了在理论上重现这一现象，研究者对原有的竞争链模型进行了扩展。他们发现，无论是引入一个专门读取累积结果的“选择读出细胞群”，还是让积分器在序列后期变得轻微不稳定（模拟决策的紧迫感或承诺），都能完美复现这种从证据到抉择的动态转换。

Fig 6. 在 ACC 和 RSC 中，神经元的编码模式在迷宫早期表现为渐进的证据调谐，而在延迟期则转变为二元的选择调谐。

Fig 7. 扩展后的计算模型。通过引入选择读出细胞或增加链条后期的不稳定性，模型成功复现了实验中观察到的从证据编码向选择编码的转换。

研究意义

这项研究真正推进了我们对大脑决策机制的底层理解。首先，它在理论层面上打破了“证据累积必须依赖持续性放电”的传统教条，证明了通过位置门控和前馈连接，瞬态的序列放电同样可以实现精确的积分计算与信息传递。这为理解空间导航、工作记忆和感知决策的融合提供了一个极具潜力的通用框架。

其次，这项工作揭示了一个重要的方法学启示：仅仅观察到相似的神经现象（如序列放电），并不意味着底层计算机制相同。尽管新皮层和海马体在宏观上都表现出选择特异性序列，但它们编码证据的数学本质（振幅编码 vs. 位置编码）截然不同。这提醒未来的研究者，必须深入到神经元的调谐曲线层面，才能真正理解不同脑区在认知任务中的具体分工。

最后，这项研究也明确了当前的边界。虽然计算模型和相关性分析完美契合，但要最终证实这些环路机制，未来还需要依赖具有功能靶向性的光遗传学扰动实验。例如，模型预测在“竞争链”和“波包吸引子”中刺激单个神经元会引发完全不同的网络级联反应，这将是下一步验证大脑真实算法的关键试金石。

分享人：饭鸽儿

审核：PsyBrain 脑心前沿编辑部

你好，这里是「PsyBrain 脑心前沿」

专注追踪全球认知神经科学的最尖端突破

视野直击 Nature, Science, Cell 正刊及核心子刊与顶级大刊

每日速递「深度解读」与「前沿快讯」

科研是一场探索未知的长跑，但你无需独行。欢迎加入PsyBrain 学术社群，和一群懂你的同行，共同丈量脑与心智的无垠前沿。

点击卡片进群，欢迎你的到来

一键关注，点亮星标 ⭐ 前沿不走丢！