基本信息

基本信息

Title:Evidence accumulation from experience and observation in the cingulate cortex

发表时间:2026.1.7

发表期刊:Nature

影响因子:48.5

打开网易新闻 查看精彩图片

研究背景

研究背景

认知神经科学的一个核心标志是研究大脑如何推断体验背后的潜在原因(Hidden Causes)。想象一下,你早起感到胃部不适,你会试图判断这是因为昨晚的食物中毒,还是感染了流感病毒。你的判断依据首先来自自身的症状(恶心 vs 发烧),即体验性证据(Experiential Evidence);但同时,你也会参考他人的情况:如果你的饭搭子也有类似症状,你会更倾向于认为是食物中毒,这便是观察性证据(Observational Evidence)。

打开网易新闻 查看精彩图片

尽管我们确信大脑能够整合这两类证据来推断环境状态,但其背后的神经计算机制仍是未解之谜。前扣带回(Anterior Cingulate Cortex, ACC)长期以来被认为是基于证据决策的核心脑区,负责监控行为结果、更新信念以及编码环境的潜在状态。同时,ACC也被发现对观察到的奖励和惩罚敏感,参与替代性学习(Vicarious Learning)。

然而,现有的研究大多孤立地考察这两者。我们尚不清楚大脑是将“自身体验”与“他人观察”视为同一维度的信息进行处理,还是通过独立的通道进行编码?更重要的是,当这两类证据发生冲突或需要整合时,神经元群体是如何在动态变化的环境中构建统一的信念(Belief)的?针对这一空白,麻省理工学院 Mehrdad Jazayeri 团队通过一项精巧的双个体博弈任务,结合电生理记录神经网络建模,通过几何视角揭示了这一过程的计算架构。

研究核心总结

研究核心总结

研究团队记录了猕猴在进行双个体多属性决策任务时的ACC神经元活动,并对比了人类被试的行为数据。

打开网易新闻 查看精彩图片

Fig. 1 | Multi-agent evidence integration task and performance.

1. 行为学发现:理性的整合与权重的非对称性

研究发现,无论是人类还是猕猴,都能有效地结合“自身试错”和“观察同伴”的结果来更新对环境状态(即哪个选项是奖励选项)的信念。通过与理想观察者模型(Oracle)对比,研究者发现被试在整合信息时展现出一种明显的非对称性(Asymmetry):即相比于自身的直接体验,个体往往会给观察到的证据赋予较低的权重(Discounting)。这种现象并非由于注意力缺失,而是反映了某种内在的计算偏好。

打开网易新闻 查看精彩图片

Fig. 2 | Behavioural characteristics of experiential and observational learning in monkeys and humans.

2. 神经表征几何:正交编码

在单神经元层面,ACC神经元表现出混合选择性,既编码自身的行动结果,也编码观察到的同伴结果。然而,当研究者利用状态空间分析(State-space Analysis)检查神经群体活动的几何结构时,发现了一个令人惊讶的现象:“自身结果”与“他人结果”在神经状态空间中被编码在近乎正交(Orthogonal)的子空间中。这一发现强有力地支持了独立输入假说(Hypothesis 2),即ACC通过相互独立的输入通道接收自身和通过社会观察获得的反馈信息,而不是像之前某些理论预测的那样,通过单一的“结果”通道结合身份标签来处理。

打开网易新闻 查看精彩图片

Fig. 3 | ACC neurons encode and integrate actor and observer outcome.

3. 计算架构:混合投射与整合机制

为了解释这种正交性是如何实现的,研究者进一步分析了投射模式。结果排除了“由不同神经元亚群分别处理两类信息”的简单假设(H2a),而是支持混合投射模型(H2b):即自身和他人信息的输入投射到相互重叠的神经元群体上,但在群体层面维持几何上的正交性。这种混合表征可能有助于后续的整合过程,避免了复杂的门控机制。

打开网易新闻 查看精彩图片

Fig. 4 | Population geometry of multi-agent evidence integration.

4. 行为非对称性的神经起源

本研究最精彩的洞见在于揭示了“为何我们会更相信自己的经验”。研究定义了一个“信念切换维度”(Switch Evidence, SE),代表了大脑累积证据以决定是否改变策略的轴线。几何分析显示,“自身结果”维度的向量与SE维度的夹角,显著小于“他人结果”向量与SE维度的夹角。这意味着,在神经流形(Neural Manifold)上,自身经验的信息能更高效、更强烈地投影到决策变量上,从而推动信念的更新;而观察性证据由于角度较大,其对最终决策的驱动力被天然地“打折”了。这种几何结构直接解释了行为学上观察到的证据权重非对称性。

综上所述,这项工作统一了ACC在自我监控和社会学习中的双重角色,提出ACC并非简单地记录奖赏,而是通过正交的输入通道和特定的几何整合机制,将多源证据汇聚为统一的潜在状态信念。这不仅为理解灵长类动物如何在社会情境下进行决策奠定了神经基础,也为解释“为什么在此类任务中我们总是更相信自己”提供了优雅的几何学答案。

Abstract

Abstract

We use our experiences to form and update beliefs about the hidden states of the world. When possible, we also gather evidence by observing others. However, how the brain integrates experiential and observational evidence is not understood. We studied the dynamics of evidence integration in a two-player game with volatile hidden states. Both humans and monkeys successfully updated their beliefs while playing the game and observing their partner, although less effectively when observing. Electrophysiological recordings in animals revealed that the anterior cingulate cortex integrates independent sources of experiential and observational evidence into a coherent neural representation of dynamic belief about the environment’s state. The geometry of population activity revealed the computational architecture of this integration and provided a neural account of the behavioural asymmetry between experiential and observational evidence accumulation. This work lays the groundwork for understanding the neural mechanisms underlying evidence accumulation in social contexts in the primate brain.