导读
当我们提到多巴胺时,人们常常把大脑中多巴胺的释放等同于快乐的‘代言人’,仿佛只要分泌了多巴胺,人就会感到快乐,似乎大众对多巴胺的理解仅仅停留在让人产生愉悦这个解释上。
与快乐有关的神经递质
事实上,多巴胺带给我们的可不仅仅是快乐。多巴胺作为中枢神经系统一种非常重要的神经调控物质,对运动控制、学习记忆、动机等具有非常重要的作用。因此了解多巴胺的信号传递对于探究多巴胺如何调控不同生理功能至关重要。
其中一个广为接受的理论是,中脑多巴胺能神经元的时相性活动类似于强化学习模型中使用的时差奖励预测误差(Reward prediction errors, PREs)。在许多动物和不同任务条件下都观察到了符合PRE的反应模式,这种理论在很大程度上影响了我们对多巴胺功能的理解。由于这些研究的行为范式相对简单,该理论是否适用于更复杂的环境仍有待探究。近期在自由活动动物上的研究表明,纹状体中的多巴胺浓度可在数秒内急速上升,但也有些研究人员认为PRE并不能解释多巴胺的浓度变化,而是认为当动物接近奖励时多巴胺才会增加。此外,腹侧被盖区(Ventral tegmental area, VTA)的多巴胺能神经元的活动并没有增加,而是来自于纹状体多巴胺神经元轴突的局部调节。
多巴胺神经通路
因此,探究多巴胺在复杂环境中的信号传递机制及有效的行为范式诱导其释放,对揭示多巴胺的生理机制和意义有重要作用。从理论上讲,奖赏值可与PRE分开。在没有即时奖励时,PRE是奖赏值的衍生物,因此,多巴胺代表奖赏值还是PRE很难区分,但无论多巴胺代表PRE还是奖赏值,多巴胺信号都可能增强。
来自美国哈佛大学分子与细胞生物学系脑科学中心的Naoshige Uchida研究团队利用虚拟现实、光纤成像、电生理记录、光遗传学等技术手段,探究了小鼠在复杂环境下多巴胺信号时相性活动的神经机制,并与2020年11月27在顶级期刊《Cell》上在线发表了题为‘’A Unified Framework for Dopamine Signals across Timescales‘’的研究长文。
借助虚拟现实技术分离PRE和奖赏值
研究人员开发了一种特殊的行为实验范式(图1),头部固定的小鼠可在虚拟线性走廊中自由探索以获取奖励。而且研究人员可以利用虚拟走廊操纵小鼠的瞬时移动和速度。与此同时,作者利用光线成像技术实时投射到腹侧纹状体或称为伏隔核的多巴胺能神经元的信号活动。研究结果表明,经过该行为范式训练过的小鼠可以很好的区分PRE和当前奖赏值。
图1 借助虚拟环境分离PRE和奖赏值
多巴胺信号的增强与PRE保持一致
为了更好的探究多巴胺信号与PRE和奖赏值的关系,研究人员进行了4组不同的行为实验,除了标准化实验范式外,还随机增加了三个测试条件,如长时程瞬时传送、短时程传送和5秒钟静止(图2)。根据假设,如果多巴胺代表奖赏值,则多巴胺信号呈阶梯式递增,无论长时程还是短时程传送后的多巴胺水平应该相同且保持最大水平;如果多巴胺代表PRE,那么多巴胺信号将表现出相位奖励,其增强水平应随传送时程的变化而变化。结果表明,多巴胺投射到腹侧纹状体的信号变化与PRE保持一致。此外,通过计算模型的方法也证实,PRE模型比奖赏值模型能更好的解释小鼠多巴胺能的信号变化。
图2 伏隔核中多巴胺能轴突末梢的活动与PRE一致
多巴胺能神经元的活动不受感觉刺激本身影响
最近一些研究表明,多巴胺神经元可以被新异感觉刺激或感觉预测错误或觉醒等激活。作者接下来设计了双轨道的瞬时传送来验证是否新异感觉刺激可以引起多巴胺激活。在该行为范式中,小鼠在两个虚拟走廊中瞬时传送,但不改变奖励的目的地,结果表明瞬时传送引起感觉预测错误,但不会引起奖赏值的改变(图3)。当给与不同的奖赏时,小鼠的获取奖励的行为和钙信号水平都有所不同。同时感觉上新异刺激并没有引起钙信号的升高。这些结果表明,单纯的感觉刺激不会激发多巴胺能神经元,但奖赏值的改变则有影响。
图3 新异感觉刺激不能解释多巴胺神经元的活动特性
单个多巴胺神经元的放电活动也与PRE保持一致
尽管我们的研究已经证实,腹侧纹状体中多巴胺轴突的神经活动与PRE保持一致,但是否单细胞水平上也具有类似的特性并不清楚。作者利用光遗传技术特异性激活单个多巴胺能神经元,结果表明在单细胞水平上,多巴胺能神经元的放电模式可用PRE模型来解释,具有极高的相关性(图4)。
图4 单个VTA多巴胺神经元的放电活动与PRE保持一致
VTA中多巴胺胞体的神经互动与PRE保持一致
前面提到,VTA中的多巴胺能神经元可投射到腹侧纹状体,且后者中的多巴胺轴突末梢表现出与PRE一致的活动特性。那是否VTA处的多巴胺神经元胞体也具有类似特性呢?作者利用逆行标记技术和光纤成像技术证实,VTA中的多巴胺能神经元胞体和腹侧纹状体中的多巴胺浓度均与PRE保持一致。
图5 VTA多巴胺神经元胞体的活动特性与PRE保持一致
总之,研究人员结合虚拟现实技术下的复杂行为范式,并结合光遗传学、光纤成像、电生理记录、逆行病毒标记等技术,在多种不同时间和空间分辨率条件下,实现了将PRE和奖赏值的有效区分,证实了多巴胺能神经元的神经活动与PRE保持一致,而非奖赏值。
研究意义
本文通过构建一项复杂行为范式来区分PRE和奖赏值,通过瞬时传送和速度操纵证实了在环路水平和单细胞水平多巴胺能神经元无论是VTA的胞体还是腹侧纹状体的轴突末梢的神经活动特性都与PRE保持一致,对于在时间上揭示多巴胺在奖励或快乐行为中的关键作用提供了重要证据。同时也为强化学习或机器学习中的信用分配问题提供重要参考,深入了我们对多巴胺系统的计算神经生物学特性的理解,有助于我们更好地揭示多巴胺能神经活动与复杂生理功能之间的联系。
参考资料
Kim, H.R., et al., A Unified Framework for Dopamine Signals across Timescales. Cell, 2020.
DOI: 10.1016/j.cell.2020.11.013
热门跟贴