PsyBrain 脑心前沿 | 公众号 PSY-Brain_Frontier

一键关注,点亮星标 ⭐️

不错过每日前沿资讯

认知神经科学前沿文献分享

打开网易新闻 查看精彩图片

基本信息:

Title:Orbitofrontal-sensory cortical interactions in learning and adaptive decision-making

发表时间:2025.12.4

Journal:Trends in Cognitive Sciences(TiCS)

影响因子:17.2

获取原文:

  1. 添加小助手:PSY-Brain-Frontier即可获取PDF版本

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

引言

每天早上换一家咖啡店,哪一杯更香、更顺口,会悄悄决定你明天往哪家走——这就是强化学习(reinforcement learning, RL)在生活中的表现。然而,做出“下次去哪儿买”的决定,不只是简单记住味道这么粗糙。大脑需要把气味、口感、杯型、价格、情绪、品牌这些杂乱信息,整合成一个“值不值得再去”的主观价值,还要在环境变了(比如咖啡突然变难喝)时迅速翻盘。

传统观点认为,感觉皮层只是负责“看清、闻清、尝清”眶额皮层(orbitofrontal cortex, OFC)负责“算账和决策”。但新证据提示,感觉皮层本身也会编码注意(attention)、工作记忆(working memory)、不确定性(perceptual uncertainty)甚至价值相关信息而 OFC 又通过反馈信号改写感觉皮层的表征。两者更像一个不断互相教学的闭环系统,而不是简单的“前端采集 + 后端决策”。

这篇 TiCS 综述文章以计算强化学习框架为主线,系统梳理了 OFC 与五大感觉系统(视觉、听觉、躯体感觉、嗅觉、味觉)之间的双向连接

感觉皮层把压缩后的任务信息送给 OFC,帮助构建抽象的任务状态与“认知地图”(cognitive map);OFC 再把基于价值与任务结构的“教学信号”回送感觉皮层,放大有用特征、重映射价值,让感觉皮层从“被动感受器”升级为“带认知功能的前端模块”。

这不仅改写了我们对感觉皮层的认识,也为理解人脑如何高效学习,以及如何设计更聪明的人工神经网络,提供了新思路。

打开网易新闻 查看精彩图片

实验设计与方法逻辑

本文并非单一实验,而是整合解剖追踪、动物电生理、人类 fMRI 以及深度 / 元强化学习(deep/meta-RL)模型等多类证据:

作者先从解剖结构出发,明确 OFC 与各感觉皮层的互惠投射;随后分别梳理自下而上的“感觉→OFC”通路如何提供注意、工作记忆与不确定性信息,自上而下的“OFC→感觉”通路如何实现感知增强与价值重映射;最后在强化学习的计算框架中,把这些结果统一成一个闭环模型,解释大脑如何边感知边学习、边更新任务结构。

打开网易新闻 查看精彩图片

核心发现

解剖上:OFC 是连接五大感觉通路的“价值枢纽”

图 1 展示了人类大脑外侧视图中,OFC 与躯体感觉、嗅觉、味觉、视觉和听觉皮层的广泛双向连接:后部 OFC 接收更多来自初级感觉皮层的输入,前部 OFC 更多连接联络区,尤其是与物体 / 面孔识别相关的腹侧视觉通路。 这种“从外周到高级”的多级输入,使 OFC 得以整合多模态信息(比如咖啡的味道 + 香气 + 触感),计算跨模态的主观价值,并向下游(如纹状体、海马)输出价值与任务状态信息,从而在解剖上奠定其“价值枢纽”的地位

打开网易新闻 查看精彩图片

Figure 1. Major anatomical connections between sensory cortices and the orbitofrontal cortex (OFC).

感觉→OFC:不仅传“是什么”,还传注意、记忆和不确定性

图 2A 用示意流程总结了感觉皮层送往 OFC 的多条信息流:除传统的感觉特征外,还有自下而上的显著性 / 注意信号(bottom-up attention)、感觉工作记忆表征以及对当前刺激的感知不确定性。 这些“预处理后”的高级信号,帮助 OFC更精准地进行奖励预测、价值比较与责任归因(credit assignment):突出的刺激优先被评估,可维持在感觉工作记忆中的特征更易被正确“记账”,高不确定性则会压低价值信号、推动探索。

打开网易新闻 查看精彩图片

Figure 2. Contribution of sensory inputs to value computation and representation learning in the orbitofrontal cortex (OFC).

OFC→感觉:用价值信号直接“调参”感觉皮层

在图 3A 的咖啡例子中,一次令人愉快的体验,会让 OFC 向感觉皮层发送奖励期望与目标导向注意两类自上而下信号:前者提升对与奖励相关特征的响应增益,后者选择性放大与当前目标有关的刺激、抑制无关输入。 动物实验进一步显示,OFC 投射到 V1、A1 或嗅皮层时,可以分别抑制无奖刺激、放大奖励相关刺激的神经反应,实现对感觉编码的“价值调谐”;在人类 fMRI 中,则可观察到在反转学习阶段,OFC 与奖相关 S1 区域的功能连接瞬时增强,提示其通过“教学信号”重写感觉-奖励映射

打开网易新闻 查看精彩图片

Figure 3. The orbitofrontal cortex (OFC)–sensory cortex interactions supporting reinforcement-based adaptive learning.

闭环 RL 模型:OFC–感觉皮层协同构建

“任务认知地图”

图 2B 和 3B 合在一起给出一个闭环强化学习框架:感觉皮层将压缩后的任务相关特征(包括不确定性、显著性与近期刺激记忆)送入 OFC,OFC 将其与海马、内嗅皮层等处存储的既往任务状态进行比较——若相似,则更新旧状态;若不同,则创建新状态并附带“探索”加成。 这些任务状态构成抽象的认知地图,驱动对未来结果的预测,再通过价值期望与重映射信号回传感觉皮层,持续调整前端表征,实现在不确定、可变环境中的高效学习与灵活决策。

打开网易新闻 查看精彩图片

归纳总结和点评

总体来看,本文提出了一个优雅的闭环模型:

  • 感觉皮层不再是被动的“像素工厂”,而是能根据注意、记忆与不确定性进行智能“压缩”的前端;

  • 眶额皮层则在此基础上构建任务状态与认知地图,并通过价值导向的教学信号,塑造感觉皮层对世界的“看法”。

这种双向互动既可以解释动物与人类反转学习、价值驱动注意和感知增强等现象,也为人工智能中的表征学习与元强化学习提供了神经启发。

作为一篇跨解剖、系统神经与计算建模的综述,它在“感觉皮层也很聪明”与“OFC 不只是算钱,更在教别人怎么算”这两个点上,给出了兼具数据基础与理论高度的统一视角,值得做决策与学习研究的读者细细品味。

打开网易新闻 查看精彩图片

AI 一句话锐评

这篇文章本质上在说:真正聪明的脑,不是前端感知 + 后端决策,而是让“感觉皮层也会思考、OFC 也会 teach”,把整张大脑网络训练成一个自我更新的闭环强化学习系统。

打开网易新闻 查看精彩图片

请打分

这篇刚刚登上TiCS的综述,是否实至名归?我们邀请您作为“云审稿人”,一同品鉴。精读全文后,欢迎在匿名投票中打分,并在评论区分享您的深度见解。

前沿交流|欢迎加入认知神经科学前沿交流群!

打开网易新闻 查看精彩图片

核心图表、方法细节、统计结果与讨论见原文及其拓展数据。

分享人:BQ

审核:PsyBrain 脑心前沿编辑部