你有没有想过,我们大脑里的奖励学习和动作执行是如何精准分工的?比如当我们想去买杯奶茶,大脑既需要记住奶茶是奖励的学习信号,又需要指挥身体移动的运动信号,这两种信号如何不混淆?

打开网易新闻 查看精彩图片

2026年3月25日,美国纽约大学Christine M. Constantinople团队在《Nature Neuroscience》上发表的研究《Acetylcholine demixes heterogeneous dopamine signals for learning and moving》,就解开了这一大脑奥秘:

背内侧纹状体中乙酰胆碱是多巴胺的调度员,它和多巴胺的相位关系,决定了多巴胺是调控学习还是运动。多巴胺滞后乙酰胆碱下降时调控奖励学习,超前时则无学习作用,与乙酰胆碱爆发同步时预测动作强度。

打开网易新闻 查看精彩图片

多巴胺和乙酰胆碱的信号有何不同?

研究者让大鼠做时间赌博决策任务,同时用光纤光度法实时记录背内侧纹状体里的多巴胺和乙酰胆碱的释放。

结果发现,两种信号在不同行为事件中,表现完全相反!奖励线索出现时:多巴胺升高,乙酰胆碱下降;大鼠转头运动时:多巴胺升高,乙酰胆碱爆发。

也就是说,两种神经递质在学习和运动相关场景下,信号表现完全不同。

打开网易新闻 查看精彩图片

多巴胺什么时候决定学习?

研究者仔细分析奖励线索处两种信号的相位关系,发现一个关键的规律:当多巴胺滞后乙酰胆碱下降约100毫秒时,多巴胺信号能预测大鼠后续的试次启动行为,符合奖励预测误差的学习功能;当多巴胺超前乙酰胆碱下降约50毫秒时,多巴胺信号无法预测学习相关行为,也不影响大鼠的等待决策。

也就是说,只有多巴胺 “慢一步” 跟随乙酰胆碱变化时,才能真正发挥奖励学习的调控作用,相位超前则会丧失该功能。

打开网易新闻 查看精彩图片

学习时,大脑里发生了哪些变化?

接下来,作者采用Neuropixels电生理记录监测背内侧纹状体神经元的放电,发现当学习相关的多巴胺信号出现时,约51.6% 的神经元放电率发生逐次变化,而且这种变化在试次间持续存在,这就是在体可塑性,是记忆形成的神经基础。这些神经元分为两类:一类放电增强,一类放电减弱,推测对应不同的多巴胺受体亚型。

也就是说,学习相关的多巴胺信号会让纹状体神经元产生持久的放电变化,这是大脑实现学习的神经基础。

打开网易新闻 查看精彩图片

多巴胺什么时候决定运动?

在大鼠转头运动时,多巴胺和乙酰胆碱同步爆发,多巴胺信号的峰值比头部运动速度的峰值早约100毫秒。而且,多巴胺信号的幅度能精准预测运动强度,想跑得快,信号就强;想走得慢,信号就弱。更关键的是,这个运动相关的多巴胺信号,不会引发神经元可塑性,与学习信号的作用完全区分。

也就是说,二者信号同步时,多巴胺专门负责指挥动作的快慢,不再参与学习过程。

打开网易新闻 查看精彩图片

全文总结

学习模式:奖励线索 → 乙酰胆碱下降 → 多巴胺滞后100ms → 多巴胺信号触发神经元可塑性 → 记忆形成;

运动模式:准备运动 → 乙酰胆碱和多巴胺同步爆发 → 多巴胺信号预测运动强度 → 执行动作,无记忆形成。

乙酰胆碱就像一个调度员,通过调整和多巴胺的相位关系,决定多巴胺今天负责学习还是负责运动。该研究还证实了学习相关多巴胺信号的在体可塑性机制,揭示了大脑内神经递质协同调控行为的精准方式。

小编寄语:

多巴胺是神经科学里最出名的分子之一。它管奖励、管学习、管运动、管动机……管的事太多,以至于科学家一直困惑:它到底是怎么同时管这么多事的?

纽约大学Christine M. Constantinople团队的这项研究,给出了一个精妙的答案:不是多巴胺自己管的,是乙酰胆碱帮它分的工。在背内侧纹状体里,多巴胺和乙酰胆碱的时间关系,决定了多巴胺今天扮演什么角色。多巴胺滞后乙酰胆碱100毫秒时,它负责奖励预测误差,触发学习;多巴胺和乙酰胆碱同步爆发时,它负责指挥运动强度,不触发学习。同一个分子,两种功能,全看时间差。

因此,大脑的复杂功能,不一定要靠复杂的分子系统,只需要给同一个分子配一个调度员协调就可以了。

打开网易新闻 查看精彩图片

https://doi.org/10.1038/s41593-026-02227-x

打开网易新闻 查看精彩图片

欢迎转发分享