认知神经科学前沿文献分享
基本信息
Title:Role of the primate ventral striatum as a neural hub bridging option valuation and action selection
发表时间:2026-03-28
发表期刊:Nature Communications
影响因子:15.7
获取原文:
1. 添加小助手:PSY-Brain-Frontier即可获取PDF版本
研究背景
在面对选择时,大脑如何将一个选项的“内在价值”转化为具体的“选择动作”?这是决策神经科学中的核心问题。比如,在自助餐厅里,从我们决定一道想吃的菜(如大闸蟹),到伸出手去拿取,这种从“想要”到“得到”的鸿沟是怎样发生的?
在经典的强化学习框架中,大脑的运作似乎泾渭分明:腹侧纹状体(Ventral Striatum, VS)和中脑多巴胺神经元负责“估价”。它们编码预期奖励的价值,并根据奖励预测误差(RPE)不断更新这些价值表征。简单来说,这个系统负责告诉大脑“哪个选项更好”。
然而,仅仅知道“什么更好”是不够的,大脑还需要把这些价值信息传递给运动系统,从而真正执行选择。过去的研究多将腹侧纹状体视为一个单纯的“价值记账员”,认为它只负责向皮层提供价值信号。但解剖学证据暗示,作为连接边缘系统与运动系统的关键节点,腹侧纹状体可能扮演着更主动的角色:它会不会直接参与了从“估价”到“动作选择”的转化过程?
为了回答这个问题,研究者在猕猴身上设计了一项基于价值的决策任务,并结合单细胞电生理记录、微电极刺激以及光遗传学手段,试图揭示腹侧纹状体及其多巴胺输入在决策形成瞬间的真实动态。
研究核心总结
这项研究的核心在于打破了“价值评估”与“动作选择”在时间与空间上的绝对隔离,证明了腹侧纹状体是一个动态的神经枢纽。
研究者训练猕猴完成一项序贯决策任务:屏幕上首先出现一个代表特定水量奖励的视觉选项(选项一),猕猴需要根据其价值,决定是松开按钮(选择该选项)还是按住不动(放弃并等待选项二)。
单细胞记录显示,腹侧纹状体神经元的放电活动并非静态地表征价值。在选项一刚出现时,神经元的活动主要反映该选项的“客观价值”;但随着时间推移(在几百毫秒内),这些神经元的活动模式发生了平滑的转移,开始反映猕猴的“动作选择”,即无论价值多少,只要猕猴决定松开按钮,神经元就会表现出特定的放电特征。
这种动态转移在单神经元和群体层面上均被观察到。这表明,腹侧纹状体内部正在实时进行着将“价值信号”翻译为“动作选择信号”的计算。
Fig 1. 猕猴基于价值的决策任务范式及行为表现,显示猕猴的松手决策严格依赖于选项的预期价值。
Fig 2. 腹侧纹状体神经元的动态放电特征。模型对比分析显示,神经元信号在选项呈现后,依次经历了“价值调节”阶段、“中间过渡”阶段,最终演变为“选择调节”阶段。
为了排除这种“选择信号”仅仅是松手动作本身的运动反射,研究者让猕猴完成了一个不需要做决策、只需单纯松手的控制任务。结果发现,绝大多数在决策任务中表现出强烈选择信号的神经元,在单纯运动任务中并未出现明显反应。这证实了腹侧纹状体编码的是“基于价值的动作选择”,而非纯粹的肌肉运动。
Fig 3. 决策任务与单纯按键释放任务中神经元活动的对比,排除了选择信号纯粹由运动执行引起的可能性。二、因果干预:腹侧纹状体直接介入“犹豫不决”的决策
如果腹侧纹状体真的在驱动动作选择,那么人为干扰它应该会改变猕猴的决策。研究者在猕猴进行决策的窗口期(即选项一呈现期间),对腹侧纹状体施加了微电极刺激。
结果非常有趣:电刺激确实改变了猕猴的选择倾向,但这种改变具有高度的条件特异性。当选项的价值极高或极低时,猕猴的决策非常笃定,电刺激几乎不起作用;然而,当选项处于中等价值(Value 4)时,猕猴本身处于“选与不选”的犹豫状态,此时的电刺激显著打破了平衡,导致猕猴在某些刺激位点更倾向于选择,而在另一些位点更倾向于放弃。
Fig 4. 微电极刺激腹侧纹状体对决策行为的影响。在面对中等价值选项时,电刺激显著改变了猕猴的动作选择概率,且这种改变与单纯的运动反应时无关。三、多巴胺的实时干预:不仅是“事后诸葛亮”,更是“幕后推手”
传统观点认为,多巴胺主要在获得奖励后释放,作为“教学信号”来更新未来的价值预期。但这项研究发现,多巴胺在决策形成期同样发挥着主动的干预作用。
研究者利用光遗传学技术,选择性地激活了投射到腹侧纹状体的中脑多巴胺神经元末梢。与电刺激的结果如出一辙,在选项呈现期间给予光遗传刺激,同样显著改变了猕猴面对中等价值选项时的动作选择。这表明,在决策正在进行的当下,多巴胺的输入直接参与塑造了腹侧纹状体内部从价值到动作的转化过程。
Fig 5. 光遗传学特异性激活多巴胺向腹侧纹状体的输入。在决策窗口期的光刺激同样能够双向调节猕猴对中等价值选项的动作选择。
研究意义
这项工作极大地丰富了我们对基底节环路在决策中作用的理解。
首先,它在理论上修正了传统强化学习模型中对腹侧纹状体的单一功能定位。腹侧纹状体不仅是一个被动的价值评估器,更是一个主动的“边缘-运动接口”。它能够在局部网络中完成从“估价”到“选择”的流式计算,直接为下游的运动输出提供决策依据。
其次,研究揭示了多巴胺系统的前瞻性功能。多巴胺不仅在事后负责“奖惩教学”,在事前和事中,它同样作为一种实时的神经调控力量,干预着动作选择的生成。
最后,这项研究也明确了自身的边界。无论是电刺激还是光遗传刺激,都观察到了双向的效应(有的位点促进选择,有的抑制选择)。这很可能与纹状体内部直接通路(D1受体主导,促进接近)和间接通路(D2受体主导,促进回避)的复杂微环路有关。受限于目前灵长类动物细胞类型特异性操控技术的瓶颈,研究尚无法完全拆解这两条通路在决策瞬间的具体分工,这也为未来的非人灵长类脑科学研究指明了极具价值的探索方向。
分享人:饭鸽儿
审核:PsyBrain 脑心前沿编辑部
你好,这里是「PsyBrain 脑心前沿」
专注追踪全球认知神经科学的最尖端突破
视野直击 Nature, Science, Cell 正刊 及核心子刊与顶级大刊
每日速递「深度解读」与「前沿快讯」
科研是一场探索未知的长跑,但你无需独行。欢迎加入PsyBrain 学术社群,和一群懂你的同行,共同丈量脑与心智的无垠前沿。
点击卡片进群,欢迎你的到来
一键关注,点亮星标 ⭐ 前沿不走丢!
一键分享,让更多人了解前沿
热门跟贴