脑声常谈｜皮层-纹状体通路在学习中作用|介导|信号|海马汽车|皮层|神经元|纹状体通路|脑声

皮层-纹状体通路是学习的核心神经环路，负责将来自前额叶、感觉和运动皮层的高级认知信息（如动作意图、环境线索、任务规则和奖赏预期）传递至纹状体，从而指导适应性行为。该通路支持多种学习形式：前额叶-背内侧纹状体通路介导目标导向学习，使行为能根据结果价值灵活调整；而随着重复训练，感觉运动皮层-背外侧纹状体通路逐渐主导，促进行为自动化和习惯形成。在强化学习中，皮层输入与多巴胺信号在纹状体交汇，共同调控中型多棘神经元的突触可塑性。此外，该通路还整合动机显著性信号，影响决策投入并在环境变化时支持行为灵活性与策略更新。因此，皮层-纹状体通路不仅传递“做什么”的信息，更通过动态调节突触连接强度，实现从试错到优化的学习过程，其功能障碍与成瘾、强迫症及帕金森病等密切相关。

皮层输入向纹状体输出转换过程中中间神经元的作用

纹状体接收来自广泛皮层区域的输入，但其自身神经元数量却远少于皮层。那么，当丰富的皮层信息模式在纹状体微环路中被压缩和处理时，它们是如何被转化的？尽管某些皮层活动特征在纹状体内部计算过程中得以保留，但单个纹状体输出神经元所呈现的表征形式却明显不同。

例如，许多内侧/腹侧纹状体神经元表现出对海马θ节律（theta rhythm）的强烈同步。这些细胞很可能是前额叶皮层-海马-纹状体宏观环路的一部分，该环路在决策过程中利用情境信息至关重要；参与θ节律可能有助于调控这一宏观环路内的信息交流。然而，即使是与θ节律同步的内侧纹状体神经元，也不像海马“位置细胞”那样表现出与空间位置相关的放电变化；相反，它们的放电率受非空间性的行为序列调制。解析纹状体微环路信息处理的一种方法是考察不同类型神经元组分的活动模式。其中一类关键组分是快放电中间神经元（FSIs），尽管它们仅占纹状体神经元总数的约1%，却被认为在过滤不必要动作方面起着关键作用。

多项研究在清醒大鼠执行选择任务时记录到纹状体快放电中间神经元（FSIs），发现它们虽具有典型电生理特征，但放电高度个体化，通常不同步，即使在局部微区内也是如此，提示其作用是精细调控纹状体内部计算，而非提供全局控制信号。这一现象令人意外，因为相邻FSIs通过树突缝隙连接存在电耦合，但模拟研究表明这种连接通常不足以同步整个网络。

尽管单个FSI可与皮层–纹状体节律（如奖赏相关的80 Hz振荡）相位锁定，但这种同步更可能源于特定皮层输入，而非纹状体固有特性。然而，在特定行为时刻如动物启动选择性动作时，FSIs会短暂同步发放一个显著脉冲，可能用于抑制竞争性动作，这与图雷特综合征中FSI功能缺失的观察相符。

此外，FSIs接收来自苍白球的特异性反馈投射，其放电率与苍白球群体活动呈负相关，提示FSIs既整合多样化的皮层输入以精细调控中型多棘神经元（MSN）的放电时序，又参与传递一种更协调的基底神经节反馈信号。

纹状体直接通路与间接通路：从“行动/抑制”到复杂决策调控

经典“Go/No-Go”模型

纹状体中型多棘神经元（MSNs）分为两条通路：

直接通路（D1R-MSNs）：表达D1多巴胺受体，抑制基底神经节输出核（GPi/SNr），从而解除对运动系统的抑制，促进动作执行（“Go”）。

间接通路（D2R-MSNs）：表达D2受体，通过多级环路增强基底神经节输出，抑制运动目标区域，起到抑制动作的作用（“No-Go”）。

这一“Go/No-Go”模型长期被用来解释基底神经节如何通过两条通路的拮抗作用选择或抑制行为。

现实比模型更复杂：两条通路常“同步活跃”

大量在体记录发现：在自发运动、训练动作甚至感知决策中，D1R和D2R MSNs往往同时激活，且都与运动速度、对侧动作等参数相关。两者活动模式高度相似，并非简单对立。这表明，两条通路可能协同协调动作，而非单纯“一个推、一个拉”。经典模型显然过于简化。

新假说：通路差异体现在“决策变量”而非“动作本身”

尽管运动时活动相似，但在价值编码上，两条通路表现出明显对立：

D1R MSNs：在获得奖赏时活动增强，对高价值线索反应更强；

D2R MSNs：在未获奖赏或低价值情境下更活跃。

这提示：两条通路可能相反地编码决策背后的内部变量（如预期价值、结果评估），而非直接控制动作有无。

光遗传学证据：通路调控学习与策略，而非单纯运动

在概率反转学习任务中：

激活D1R MSNs → 动物更倾向于重复成功动作；

激活D2R MSNs → 更容易在失败后切换策略。

在条件性位置偏爱（CPP）实验中：

D1R激活增强对奖赏环境的偏好；

D2R激活则削弱偏好，甚至产生回避。

这些效应依赖于选项间的价值差异，说明其作用在于调节决策策略，而非简单改变运动输出。

间接通路的“意外角色”：并非总是“No-Go”

越来越多研究发现，间接通路的功能远超传统认知：在感觉Go/No-Go任务中，激活D2R MSNs反而增加“Go”反应；抑制D2R MSNs不会加速动作启动，却导致动物提前放弃任务；在伏隔核（NAc）或背外侧纹状体（DLS），D2R MSN激活不抑制行为，反而增强动机或泛化动作。

这些结果表明：间接通路在不同脑区、不同任务中可能承担多样化功能，有时甚至与“抑制”无关。

纹状体的谷氨酸能输入

纹状体谷氨酸能输入：功能特化与环路多样性

纹状体接收来自皮层（如前额叶、感觉运动皮层）和皮层下结构（丘脑、杏仁核、海马）的谷氨酸能输入。这些输入在解剖上呈拓扑有序投射，不同纹状体亚区（如背内侧纹状体DMS、背外侧纹状体DLS、伏隔核NAc）接收特定组合的皮层与丘脑输入。事实上，仅通过无监督聚类分析谷氨酸能输入的分布模式，就能重现传统纹状体分区边界并发现新的功能亚区（主要位于 DMS）。

1. 输入决定功能：经典假说得到支持

传统观点认为，每条谷氨酸能输入因其靶向区域不同而具有独特功能。近年研究通过投射特异性操控（如光遗传学靶向特定通路）证实了这一点：

纹状体尾部（TS）：接收听觉皮层（AC）的音调拓扑投射，TS神经元的频率调谐特性与其AC输入一致。在声音辨别任务中，激活AC→TS通路会偏向选择该神经元“偏好”的频率所关联的动作，抑制则产生相反效果；学习后，编码奖赏声音的皮层–纹状体突触被选择性增强。

内侧前额叶皮层→伏隔核（mPFC→NAc）：参与社会空间关联学习（如将同伴与位置联系），但不参与经典条件反射的习得（仅影响表达）；也不介导动作-奖赏或线索-奖赏的关联学习，但在任务切换中起作用，表明其功能高度特化。

2. 同一靶区，多重输入：协同、冗余还是对抗？

即使投射到同一区域（如NAc），不同输入也可能承担不同甚至相反的功能：

奖赏促进性输入：

基底外侧杏仁核（BLA）→NAc 或腹侧海马（vHPC）→NAc的光遗传激活具有强化作用（动物会主动触发刺激）；

抑制BLA→NAc可减少对奖赏预测线索的条件性舔舐反应，但不影响恐惧学习。

厌恶相关输入：

室旁丘脑（PVT）→NAc 的激活是厌恶性的，削弱该通路可缓解阿片戒断的负面症状；

板内丘脑→NAc在慢性社会挫败后增强，抑制该通路可减轻社交回避。

3. 前额叶不同亚区对DMS的差异化调控

在T型迷宫任务中：

操控前边缘皮层（PL）仅在“最大化奖赏”与“最小化厌恶刺激”（如强光）冲突时影响决策；

而操控前扣带回（ACC）则影响多种成本-收益权衡。

1. 内侧前额叶皮质（mPFC）→ 伏隔核（NAc）通路

核心功能：参与奖励强化、条件反射表达、社交关联学习和任务转换；

结果：

对 ICSS/CPP 的影响存在差异：部分研究显示激活该通路终端可强化触发刺激的行为（如按杠杆），但也有研究显示无影响，甚至会减少动物在刺激相关空间的停留时间；

巴甫洛夫条件反射：激活增强奖励寻求行为的表达，抑制则减弱；

社交 CPP：激活促进 “社交目标 - 空间位置” 的关联学习，抑制则削弱；

任务转换：激活 PL 区到 NAc 核心的终端，可减少固执错误（即更快切换策略），抑制则增加错误。

2. 基底外侧杏仁核（BLA）→ 伏隔核（NAc）通路

核心功能：介导奖励强化和条件性奖励寻求；

结果：

激活该通路：增加 ICSS 中的操作行为（如主动按杠杆），同时增强动物对刺激相关空间的偏好；

抑制该通路：减少巴甫洛夫条件反射中的奖励寻求行为（如对奖励预测线索的反应）。

3. 腹侧海马（vHipp）→ 伏隔核（NAc）壳区通路

核心功能：参与奖励强化、社交记忆和 “社交-空间” 关联学习；

结果：

激活该通路终端：强化 ICSS 中的操作行为，增加动物在刺激相关空间的停留时间；

抑制该通路：损害社交辨别能力（即无法区分熟悉与陌生个体），同时削弱 “社交目标-空间位置” 的关联学习；

突触可塑性：通过光遗传学诱导该通路突触的 LTP，可增强 CPP（即更偏好刺激相关空间）。

4. 海马背侧CA1区（dCA1）→ 伏隔核（NAc）通路

核心功能：调控蔗糖奖励相关记忆的提取；

结果：抑制该通路终端，会损害动物对蔗糖CPP的记忆提取（即不再偏好蔗糖相关空间）。

5. 丘脑室旁核（PVT）→ 伏隔核（NAc）壳区通路

核心功能：介导厌恶相关行为；

结果：激活该通路终端，会减少动物在刺激相关空间的停留时间（即产生条件性位置厌恶）。

6. 板内核丘脑（ILT）→ 伏隔核（NAc）通路

核心功能：调控社交压力后的回避行为；

结果：抑制该通路终端，可减少慢性社交挫败压力导致的社交回避（即动物更愿意参与社交互动）。

7. 腹侧被盖区（VTA，谷氨酸能神经元）→ 伏隔核（NAc）通路

核心功能：介导奖励强化；

结果：激活该通路的谷氨酸能终端可强化 ICSS 中的操作行为（如主动按杠杆以获得刺激）。

不同脑区到 NAc 的谷氨酸能投射通路具有功能特异性：有的介导奖励强化（如 BLA→NAc、VTA 谷氨酸能→NAc），有的参与社交记忆（如 vHipp→NAc），有的调控厌恶或压力相关行为（如 PVT→NAc、ILT→NAc），而 mPFC→NAc 通路功能更复杂，可能因亚区、任务类型不同而表现出差异。NAc作为 “奖励、社交、压力” 等信息整合中枢的作用且不同输入通路分工明确。现有证据表明，纹状体的谷氨酸能输入具有显著的功能分化，不同通路编码特定类型的信息（感觉、奖赏、厌恶、社会、冲突等）并支持特定学习或决策过程。然而，输入之间是否存在冗余（即多条通路执行相似功能）仍是未解之谜，需进一步研究。

纹状体胆碱能中间神经元（CINs）在学习与决策中的作用

尽管胆碱能中间神经元（CINs）仅占纹状体神经元的1–2%，却是该区域乙酰胆碱的主要来源。鉴于乙酰胆碱在注意和学习中的重要作用以及纹状体中高度富集的胆碱能标志物，CINs的功能备受关注。然而，其稀疏且弥散的分布使研究极具挑战。

CINs编码“显著性”而非奖赏方向

通过细胞外记录鉴定的“紧张性活跃神经元”（TANs）被认为是CINs。它们对具有动机意义的刺激（无论是奖赏性还是厌恶性）均表现出特征性的“暂停-爆发”放电模式即短暂放电暂停，前后伴随放电增强。这与多巴胺（DA）神经元形成鲜明对比：DA神经元通过正/负反应编码奖励预测误差（RPE），指示学习方向；而CINs对正负刺激反应相似，因此被认为传递的是刺激的显著性或动机意义，而非强化信号本身。

这一特性提示：CINs可能不直接驱动学习，而是调节学习发生的“增益”即在合适时机放大或抑制可塑性过程。

CINs调控学习速率

在伏隔核（NAc）中激活CINs可加速可卡因条件性位置偏爱（CPP）的消退；抑制CINs则延缓消退或习得。

这种效应伴随MSN上谷氨酸能突触强度的降低，但仅在学习情境中出现，若在非相关时段激活CINs，则无此效果。

单独激活CINs（如在实时CPP或颅内自我刺激任务中）不足以支持新学习，进一步说明其作用是调节而非驱动。

此外，特异性损毁背侧或腹侧纹状体的CINs虽不影响初始动作-结果学习，但在任务规则改变时导致明显缺陷：动物更易固执于旧策略且在消退测试（通过饱食使奖赏贬值以区分目标导向与习惯行为）中无法灵活调整行为。这表明CINs对行为灵活性和关联更新至关重要。

CINs调节MSNs的多重机制

CINs通过多种途径影响中型多棘神经元（MSNs）以支持学习：

1. 直接抑制：CINs通常抑制MSNs；其放电暂停可解除抑制，使MSNs对行为相关信息更敏感。

2. 促进多巴胺释放：CINs激活可触发中脑DA神经元在纹状体末梢释放DA，直接增强突触可塑性。

3. 调控谷氨酸输入：CINs活性可调节MSN上谷氨酸能突触的强度，影响长期可塑性。

CINs作为情境依赖的调控器，在动机显著事件发生时提升纹状体回路的可塑性增益。它们在行为灵活性、习惯更新和适应性决策中扮演关键角色。未来研究需进一步解析不同调控机制如何协同作用，以及其在神经精神疾病（如强迫症、成瘾）中的潜在功能障碍。

文献引用：

Cox, J., Witten, I.B. Striatal circuits for reward learning and decision-making. Nat Rev Neurosci 20, 482–494 (2019). https://doi.org/10.1038/s41583-019-0189-2
Pennartz CM, Berke JD, Graybiel AM, Ito R, Lansink CS, van der Meer M, Redish AD, Smith KS, Voorn P. Corticostriatal Interactions during Learning, Memory Processing, and Decision Making. J Neurosci. 2009 Oct 14;29(41):12831-8. doi: 10.1523/JNEUROSCI.3177-09.2009. PMID: 19828796; PMCID: PMC3849625.