日常生活里,我们的行为常常分为两种:一种是主动思考、按需调整的刻意行动,比如为了拿零食一步步规划动作;另一种是不用动脑、下意识完成的惯性习惯,像随手关门、固定的走路动作,熟练后就会自动执行,很难轻易改变。
这些日常动作大多会形成连贯的行为流程,而流程的开始和结束,都会伴随不同环境线索提醒。但长久以来,人们并不清楚,动作开头和结尾的线索,会怎样悄悄影响我们的行为选择,又是什么大脑机制,让普通动作慢慢变成改不掉的习惯。
基于此,2026年5月2日,约翰斯・霍普金斯大学Youna Vandaele研究团队在《Neuropsychopharmacology》杂志发表了“Sequence termination cues drive automated habit-like strategy via dopamine-mediated processes”揭示了行为结束的信号,会借助多巴胺让人养成自动化的惯性行为。
研究设计两项任务,区分行为序列启动与终止线索的不同作用。发现仅终止线索能推动行为走向自动化、习惯化。伴随该过程,多巴胺信号提前前移、奖赏响应减弱,行为灵活性降低。激活终末多巴胺神经元还可直接诱导自动化行为。综上,序列终止线索介导的多巴胺信号,是形成习惯性动作的核心关键。
图一 终止线索促成惯性动作
训练后两组大鼠行为差异明显:LR5组反应速度更快。
训练初期两组按压节奏相近,后期LR5组高频短间隔按压更多,行为更自动化。
LR5组能形成连贯压杆动作,减少频繁探查奖赏;而LI5组全程反复探查,无法形成连贯行为。
这说明LR5组可将零散动作整合为固定行为组块,不再阶段性期待奖赏。
结果贬值实验也显示,LR5组更不易受奖赏变化影响。
综上,压杆收回的终止线索,才会促进行为自动化、组块化,让行为变成不易改变的习惯。
图二 习惯形成中的多巴胺动态变化
为探究行为序列里的多巴胺变化是否和奖赏预期、线索提示有关,作者利用光纤成像实时记录大鼠腹侧被盖区多巴胺神经元的活动。
通过特异性标记多巴胺神经元,排除性别差异干扰后,统一分析雌雄数据,并校正实验信号误差,分别检测不同行为阶段的神经反应。
行为结果再次证实:LR5任务早期就会出现行为自动化、动作连贯化。因此研究将学习过程分为早、中、后三个阶段对比分析。
LI5任务中,多巴胺只在开始动作和获取奖赏时升高,全程稳定不变,行为结束时无明显反应。
而LR5任务中,随着不断学习,多巴胺反应会从奖赏本身,慢慢转移到行为结束的提示信号上;动作起始的多巴胺信号则保持稳定。
长期训练后,LR5组结束线索与奖赏对应的多巴胺反应明显减弱。整体来看,两项任务的多巴胺活动,随学习进程呈现出完全不同的变化规律。
图三 奖赏感知与行为灵活性差异
完成训练后,通过取消奖赏测试,观察两组大鼠的行为和多巴胺变化。规则改变后,LR5组大鼠依旧频繁压杆,难以灵活调整行为,仍会按固定模式完成动作;LI5组则能及时减少行为、频繁探查奖赏。
两类大鼠的行为差异和脑内多巴胺活动密切相关。奖赏消失时,LI5组多巴胺明显下降,LR5组却基本不变;遇到意外奖赏时,LI5组多巴胺反应也更强。同时排除了探查行为带来的干扰。
总体来说,LR5训练会降低行为灵活性,削弱大脑对奖赏变化的感知,让正负奖赏信号反应都变迟钝。
总结
本研究阐明行为起始与终止线索可通过差异化调控中脑边缘多巴胺活动,编码目标导向与习惯化两类截然不同的行为策略。揭示了序列终止阶段多巴胺信号的关键作用,其可对整套动作进行价值整合,弱化奖赏预测误差响应,进而驱动行为自动化与固化。该研究从神经层面解析了习惯行为形成的核心机制,为理解日常行为固化、行为灵活性调控提供了重要理论依据。
文章来源:
https://doi.org/10.1038/s41386-026-02420-3
欢迎转发分享
热门跟贴