在计算与认知神经科学的宏大图景中,预测编码(Predictive Coding)长期占据着显赫的版图。该理论认为,大脑的核心使命不仅在于感知,更在于不断削减“预测误差”。作为一种试图统摄全局的框架,预测编码曾被寄予厚望,人们期冀它能为大脑不同区域、不同模态的功能提供一个大一统的解释。
然而,新出现的神经生理学证据,却与这一正统理论格格不入。关于视觉这样的抽象感知如何由感官刺激经大脑推演而成,另一种解释框架正在崛起,即偏向竞争理论(BELIEF)。本文将首先基于前沿文献[1],梳理这两大理论的交锋,并指出为何偏向竞争理论提供了更为精准的解释视角。
▷Westerberg, Jacob A., and Pieter R. Roelfsema. "Hierarchical interactions between sensory cortices defy predictive coding." Trends in Cognitive Sciences (2025).https://www.cell.com/trends/cognitive-sciences/fulltext/S1364-6613(25)00271-2
在后半部分,本文将从感官数据扩展到更广阔的领域,探讨一项由50多位科学家通过开放社区协作完成的、关于将现有的实验研究与预测处理的理论模型进行对比的综述。这篇综述强调,大脑或许并非固守单一策略,而是采用“模型集合”的方法,根据情境动态地调动不同的策略,这意味着,预测编码可能只是大脑宏大策略库中的一种。
为了研究大脑如何在多种策略中权衡,研究者设计了一项实验,旨在测试预测机制如何随着预测情境的变化而改变。这些实验已于2025 年 4 月在艾伦研究所开展,并已记录初步数据集,正构建起开放社区科研的典范。
大脑究竟是批评家还是激励者?
1999年,Dana H. Ballard基于视觉信号处理[2],首次提出预测编码理论。在该理论的构想中,大脑层次分明:自上而下的反馈连接,从高阶视觉皮层向低阶区域传递着对神经活动的“预测”;而自下而上的连接,则负责传递预测与实际活动之间的“残差误差”。
▷预测编码编码理论的动图展示,代码由Qwen3 Max生成
在预测编码的视角下,高级脑区会生成关于每个时空点的预判,并将这些预判反馈至低级脑区。这些预测与传入的感官信息相互比对,一旦吻合,由预测信息引发的神经活动便会被削弱;反之,那些违反预测的意外刺激,因未被抑制而显得格外强烈。
这一理论之所以迷人,在于其广泛的解释力。从感觉、知觉到运动与认知,它似乎无所不包,且符合生物体节能的进化原则。这使得预测编码成为了一种普遍适用的,对皮层功能予以解释的理论。
另外,该理论还具有其现实意义,例如为理解精神疾病提供了新视角:精神分裂症可能源于过强的先验权重,导致基于内部模型喧宾夺主地主导了感知;抑郁症可能与负性预期偏差和预测误差处理异常相关;而孤独症谱系障碍,则可能涉及精确度加权失调,导致对感觉细节的过度关注。
与预测编码理论相互竞争的偏向竞争理论,源自backward enhancement of limited information and inhibition of expected information in feedforward pathways,却描绘了一幅截然不同的图景。该理论认为,视野中的物体为了获得大脑的表征,必须展开激烈的竞争。这种竞争在具有相似特征的视觉项之间最为激烈,因此具有独特属性的项会脱颖而出。当某一表征因其行为相关性被高级脑区“选中”时,这种选择会导致相应的神经元放电频率提高。
偏向竞争理论与预测编码理论的差别在于,前者认为自上而下的连接会增强预测要出现内容的对应的脑区活动,而不是如后者想的那样抑制它。
如果说预测编码像是大脑中一位严苛的“批评家”:高层区域不断对底层输入指手画脚,发出抑制信号,将那些意料之中的信息“压制”下去,只允许意外信息(即预测误差)向上汇报。
偏向竞争理论则更像是一位循循善诱的“导师”:高层区域对那些被注意或与任务相关的信息给予兴奋性的反馈,增强其表征强度,而抑制主要发生在前馈通路和局部回路中,用于过滤冗余信息。
▷图1:左图为预测编码对的“大象出现在车流中”的神经机制解释,高层脑区对车辆(可预测)发出抑制性反馈,使得大象(意外刺激)在底层活动中凸显。右图的偏向竞争理论强调:车辆之所以反应弱,是因为它们在局部前馈通路中被抑制;大象之所以强,是因为被注意选择后获得高层兴奋性反馈增强。(来自[1])
此外,两者在神经机制的细节上也大相径庭。预测编码依赖高层到低层的抑制性投射(如通过抑制性神经元);偏向竞争理论中抑制主要即时发生于横向或前馈通路中,且适应过程跨越了从毫秒到数周的广阔时间尺度。其反馈机制,始终是兴奋性的,只为增强那些被选中的主角。
▷图2:预测编码与偏向竞争理论中的兴奋性及抑制性反馈对比,来自[1]
确定大脑究竟是采用“抑制性减法”还是“兴奋性加法”作为核心策略,绝非仅是学术上的咬文嚼字。不同的理论透镜将引导科学家以完全不同的方式审视数据。一个统一的理论框架能帮助我们剥离特例,直抵本质。当大量证据(如反馈连接主要起兴奋作用、抑制多源于局部回路)更一致地指向偏向竞争理论时,固守预测编码可能会导致对数据的误读,甚至迫使研究者不断增加特设性的修正,而这会无疑会导致科研经费的浪费。
哪一种理论正确,不仅关乎真相,更具有现实意义。在对神经精神疾病的理解上,预测编码认为精神分裂症的幻觉可能与预测编码错误(无法有效抑制由内部模型产生的预测)有关。但如果偏向竞争理论是正确的,那么问题可能出在兴奋性反馈调节的失衡或前馈过滤机制的失效上。这将彻底改变药物研发的方向。
在人工智能领域,预测编码曾启发了许多生成式模型(如预测下一个Token)。而偏向竞争理论则可能为注意力机制提供更坚实的神经科学基础。它表明,一个高效的信息处理系统,不应试图并行抑制所有预期输入,而应学会将有限资源,用于选择性增强最关键的信息。确认哪一种理论更接近真理,或许能引导我们设计出更高效、更接近人脑的AI架构。
大脑不符合预测编码的4项实验证据
为了在这场理论对决中分出高下,我们需要将目光投向那些精心设计的实验现场。在这里,我们将通过四个经典的视觉案例,逐一审视预测编码与偏向竞争理论的解释力。
(1)视觉突显:谁让异类“鹤立鸡群”?
如图3A左所示,如果你面前的屏幕上布满了密密麻麻的竖线,其中突兀地横亘着一条横线。你的目光会瞬间被它捕获。这就是经典的“视觉突显”现象(pop out)。
对此,预测编码给出的剧本是:高层脑区迅速识别出“大多数是竖线”这一规律,于是向下发送抑制指令,压制了底层对竖线的反应;而那条横线因为是意外,未被抑制,从而在神经活动的背景中弹出。
然而,偏向竞争理论却讲述了一个更符合直觉的故事:竖线之间在局部发生了激烈的“侧抑制”竞争,彼此消耗;而横线因其特征独特,没有竞争对手,因此在前馈阶段就已然胜出。高层的反馈并非在做减法,而是在你注意到横线的那一刻,给予它额外的关注与增强。
当下的神经生理学证据,坚定地站在了偏向竞争理论这一边——横线的凸显,源于底层的自发竞争,而非高层的刻意压制。
▷图3:文本分割与突出显示这两个案例中,预测编码和偏向竞争给予的不同解释。来自[1]
(2) 路径搜索:在混乱中寻找秩序
第二个案例关于“寻找连线”(图3A右)。在一堆杂乱无章的随机线条中,隐藏着一串朝向一致的线条,它们共同构成了一条连续的路径。
按照预测编码的逻辑,这条一致的路径是“可预测的”,理应受到反馈抑制。但在V1和V4脑区的实际监测数据中,我们看到的却是相反的景象:对应路径的神经活动非但没有减弱,反而被显著增强了。
这与偏向竞争理论契合,当高层(如V4)检测到路径的一致性后,它像一位兴奋的指挥官,向V1发回增强信号,点亮了构成路径的每一个线条。即可预测的反馈,旨在增强预期的信息,而非抹杀它。
(3) 时间序列:是审美疲劳还是精准预测?
第三个例子转移到了时间维度。当一个刺激反复出现(如 x-x-x-x),大脑的神经反应会逐渐减弱,这被称为“重复抑制”。但如果序列中突然出现一个怪客(如 x-x-x-y),大脑对这个“奇异刺激”的反应会相对增强(图4a)。
预测编码将此解释为高层的“预判抵消”:大脑学会了规律,会对即将出现的频繁刺激x产生预测,并提前发送抑制信号抵消了频繁刺激x的反应;而y因为出乎意料,逃过了抑制,从而引发了强烈的“预测误差”信号,该信号也就得以完整上传。
偏向竞争理论理论则认为,这种反应减弱纯粹是前馈通路中的“生理疲劳”(即神经元适应性),与高层抑制无关。这种适应是局部和快速的。同时,高层脑区的反馈作用不是抑制,而是兴奋性的,它只用于增强被注意或与任务相关的信息的表征。
为了区分神经系统究竟是如预测编码解释的那样,是对熟悉信息变得适应了,还是在时间序列中学到了预测罕见信号,研究人员训练猴子学习特定的配对(如看到A通常预示着B出现),并监测其颞下皮层(IT)的神经元活动。
决胜的关键在于时间。如果预测编码是对的,那么当B被A预测时(序列A-B),高层的抑制反馈需要时间传输,那么对B的反应减弱应该出现在神经反应的较晚阶段。
▷预测和偏向竞争理论对重复出现的时间序列的两种解释的示例动图,代码来自Step2
然而,实际数据却给了预测编码一记重拳:对可预测刺激B的反应减弱,竟然从神经反应的第一个脉冲就开始了!这意味着,早在信号到达高层之前,底层的输入本身就已经变弱了。这无可辩驳地支持了偏向竞争理论关于“前馈适应性”的解释。大脑并非在做复杂的预测抑制,仅仅是底层的神经元“累了”。
如果这个A-B过渡在实验中频繁出现,那么负责检测这种动态变化的神经元就会对它产生适应,导致对整个序列的反应效能降低。这种适应发生在前馈通路中,之前用预测编码理论,给出的解释是重复出现导致神经反应减弱。但另一个可能的解释是,经过学习,配对刺激(A和B)的神经表征变得相似。因此,先呈现A会使神经元对表征相似的B产生更强的适应性反应减弱,而这正是中的横向抑制。
(4) 持续性活动:为即将到来的主角“预热”
第四项实验关于工作记忆。研究人员训练猴子从六个不同颜色的圆圈中(图4 b),找出那个颜色独特的“奇异项”并对其做出眼动反应。实验的关键在于,这个独特颜色在一次实验内是保持不变的(例如,连续几十次试次中,奇异项都是红色),是可以被预测的。但在不同实验之间奇异项会改变。
▷图4:时间预测任务中的实验数据可用偏向竞争理论解释,来自[1]
结果每次实验中,面对相同任务的重复,猴子对目标(异常颜色)的反应时间会逐渐缩短。这表明,大脑学会了利用“目标颜色在短时间内是可预测的”这一时间规律来提升任务表现。
在每次实验的后期,在搜索刺激出现之前,那些对当前实验中目标颜色(如红色)有选择性反应的V4神经元,其放电率就已经开始升高。这被称为“持续性活动”,是大脑主动将任务目标(红色)维持在工作记忆中的体现。
而当异常的红色圆块出现后,这些已经“预热”的神经元并没有像预测编码预言的那样被抑制,而是在已有的高基线上进一步爆发。也就是说,对可预测的、重复出现的目标刺激,其神经反应是被显著增强的,而不是被抑制。这一神经机制完美解释了行为上的反应时缩短:预先的持续性活动为即将出现的目标做好了准备,使其一旦出现就能引发更强、更快的反应。
这一过程揭示了大脑处理信息的真实逻辑:低阶区域(如V4)负责编码特征,而高阶区域则通过兴奋性反馈,将“被注意”的特征模板(如红色)投射回低阶区域,选择性地增强那些与任务匹配的神经元群体。自上而下的反馈,从来不是为了“抑制可预测项”,而是为了在嘈杂的世界中,为我们关注的事物打上一束聚光灯。而这正是偏向竞争理论的核心机制。
上述四项证据,从空间突显到时间序列,从被动感知到主动搜寻,构建了一个高度一致的证据链。它们共同指向偏向竞争理论更可能是对的:在感知过程中,低级与高级脑区之间的对话,并非如预测编码所言是“预测即抑制”的减法游戏。相反,高级区域的反馈倾向于增强那些被预测、被注意的表征;而神经反应的减弱,更多源于底层前馈通路在时空重复中的自然适应。这时只有被注意的刺激才能产生自上而下的预测,而在任何时刻,预测只能与一个感官刺激相匹配。
OpenScope 的科学实践:
一次开放科学的实验
至此,我们的讨论仍局限于大脑皮层层级间的局部博弈。然而,要真正撼动预测编码这一理论巨塔,我们需要更宏大的视野,以及一种全新的科研范式。
该研究来自Allen Institute创立的OpenScope,这是一个用于共享、高通量神经生理学实验的平台。OpenScope 借鉴了天文学和物理学等领域的大型观测设施模式,开展由全球科学家提出的新的实验项目。
OpenScope会从小鼠大脑的数万个神经元中记录数据,使用多探针 Neuropixels 记录多区域双光子钙成像。生成的数据集随后会与选定的研究团队共享,他们进行自己提出的数据分析,之后这些数据将向更广泛的科学界开放。
由于验证预测编码理论的需求在社区中呼声极高,因此Allen Institute的研究者,在众多科研人员之间创建了一个共享的 Google 文档,开始构建对话框架,深入回顾预测处理的相关文献,并每天投入数小时进行阅读、总结和综合分析。
从一开始,这篇综述的结构就是将现有的实验研究与预测编码的理论模型进行对比,目的是确定检验这些理论所需的关键缺失数据。这份在线文档在社交媒体上分享,邀请任何人提出意见、推荐论文或参与编写,每个人都拥有完整的编辑权限。在一年的时间里,有超过 50 位科学家参与了这项工作。
真正的讨论发生在 Google Docs 的评论中。一位新成员可能对某段文字提出质疑,引经据典;另一位远在世界另一端的研究人员会回应,随后便会出现长长的、深入的评论链,其精彩程度常常远远超出原始内容。研究者们在争辩中彼此学习,许多人正是被这种激烈而尊重的异见所吸引,投身其中。在某些情况下,当某篇论文成为争议焦点时,通讯作者本人常会被@进战场,亲自答疑解惑。
▷图5:一群分布于不同地区的科学家参与了这一研究
最终,开放社区贡献了超过 1900 条评论。每一条评论都通过透明的共识流程被独立解决。对许多人来说,这是一次独特的体验。通过这份共享文档,加上每周的在线会议和面对面交流,当拥有合适工具和开放精神的分布式团队后,研究者能够以一种自然且有力的方式整合研究项目。
最终成果是ArXiv上的一篇综述论文[4],该综述揭示了理论与实践的差异,更指出大脑或许根本没有唯一的预测算法。
尽管“预测下一个输入”可能是皮层的基本能力,但正如生物学中许多复杂功能一样,它并非源于单一的机制,而是由一组相互作用的策略拼凑而成。这篇综述强调,大脑可能采用一种“模型集合”的方法,根据情境动态地调动不同的策略。
▷Westerberg, Jacob A., and Pieter R. Roelfsema. "Hierarchical interactions between sensory cortices defy predictive coding." Trends in Cognitive Sciences (2025).https://www.cell.com/trends/cognitive-sciences/fulltext/S1364-6613(25)00271-2
为了研究这些权衡,该综述设计了一个实验,旨在测试预测机制如何随着预测情境的变化而改变。自从2025年4月,艾伦研究所已启动实验并记录了初步数据集。分布式社区共同分析了结果,并不断优化实验设计。每周的会议录像都被上传至 YouTube,以便任何人都能随时跟进。讨论和文档写作也从Google文档迁移到 GitHub。
如今,艾伦研究所正在源源不断地生成新数据,而这个社区的大门始终敞开。无论你处于哪个层次,都有比以往更多的机会参与其中。
▷图6:从实验到理论的双向验证过程,来自4
这种“开放科学”的范式,已证明其不仅适用于预测编码,更可以轻松复制到系统神经科学的诸多未解之谜中。事实上,社区中的多位先驱已跃跃欲试,准备将这一模式推广至其他领域。这一切的核心要素其实非常简单,仅仅是拥有一个充满热情的科学家核心小组,以开放、尊重和透明的方式进行讨论。
通过持续定量检验而不断完善理论
那么,OpenScope 的实验究竟准备如何验证这一理论?如果说预测编码的核心在于通过不断生成对感官输入的预测并与实际输入比较,可利用预测误差更新内部模型。那么实验的关键,便是在可控的实验室环境中,精准地诱导出这些“误差”。主要方式有三:
1)在重复的标准刺激流中,随机插入偏差刺激;
2)制造主动运动与感觉反馈之间的不一致(例如,小鼠奔跑时视觉流却静止);
3)呈现违反时空预期的感官刺激。
回顾前文论及的四个实验,我们不难发现这些策略的影子:前两个实验利用了“异类植入”,第三个实验操纵了“时空预期”,而第四个实验则触及了眼动反应与感官反馈的微妙关系。
然而,OpenScope 这篇综述的野心远不止于此。它不只关注不同层级的神经元之间的反应,还从各个角度讨论预测编码理论。综述考察了不同类型(兴奋性或抑制性)的神经元在预测编码中发挥的作用。特别是抑制性神经元,它们并非配角,而是通过精细调节兴奋性活动,成为了预测处理中的关键关键角色。
另外,论文对树突做了重新审视。神经元的树突绝非仅仅是信号传递的被动电缆,而是具备独立计算能力的亚细胞单元。顶端树突像是天线,主要接收来自高级皮层的反馈(预测)信号,而基底树突则扎根于底层,处理传入的感觉输入。
当天线接收到的预测与根部接收到的输入匹配时,顶端树突产生的去极化与基底树突的兴奋相互抵消,导致神经元放电减少(预测抑制)。反之,当两者不匹配时,这种抵消机制失效,神经元便会爆发出增强的放电响应,这正是预测误差在单细胞层面的物理实体。
这种树突级预测编码机制赋予了单个神经元惊人的能力,使其能独自完成自上而下的预测与自下而上的证据比对,实现局部化的误差计算。
▷图7:预测编码研究的不同范围,来自4
此外,跨物种数据的比较,发现啮齿类与灵长类在预测处理机制上展现出显著差异。灵长类拥有更深的皮层层级,可能支持更复杂的预测推理。而小鼠等模型生物则提供了细胞分辨率的研究窗口,揭示了预测处理的微观基础。
后记
本文梳理这两项关于预测编码的重磅研究,初衷并非为了证伪预测编码,将其打入冷宫;而是希望指出,大脑这座生物学迷宫的运行方式之复杂,往往远超单一机制的解释范畴。
预测编码理论在认知科学领域虽已占据显赫版图,但许多人对其仍缺乏全景式的认知,甚至将其奉为不可动摇的真理,而非有待验证的假说。我们必须铭记:所有的理论都是对现实的某种抽象与降维。评估一个理论的生命力,不在于它是否完美无缺,而在于它能否指导实验,能否在数据的激流中屹立不倒。正如文中图6所示,理论与实验应当构成一个闭环:理论指引实验的方向,而实验数据则作为反馈,无情地推动理论的修正、迭代,甚至替换。
此外,OpenScope 所展示的开放科学实践,更是证明了科学不应是象牙塔里的孤芳自赏,而应该跨越国界、打破壁垒。
这不仅是一个关于大脑的故事,更是一个关于“我们如何研究大脑”的故事。我热切地期待,类似的跨学科、跨国界的开放合作模式,能在国内的土壤中生根发芽。愿有更多充满热情的科研核心力量,能组织起这样的协作,让我们在探索未知的征途中,不再独行。
[1] Westerberg, J. A., & Roelfsema, P. R. (2025). Hierarchical interactions between sensory cortices defy predictive coding. Trends in Cognitive Sciences. https://doi.org/10.1016/j.tics.2025.09.018
[2] Rao, R. P. N., & Ballard, D. H. (1999). Predictive coding in the visual cortex: A functional interpretation of some extra-classical receptive-field effects. Nature Neuroscience, 2(1), 79–87. https://doi.org/10.1038/4580
[3] Lecoq, J. (2025, November 12). A community-designed experiment tests open questions in predictive processing. The Transmitter: Neuroscience News and Perspectives. https://www.thetransmitter.org/open-neuroscience/community-designed-experiment-tests-open-questions-predictive-processing/
[4] Aizenbud, I., Audette, N., Auksztulewicz, R., Basiński, K., Bastos, A. M., Berry, M., Canales-Johnson, A., Choi, H., Clopath, C., Cohen, U., Costa, R. P., Filippo, D., Doronin, R., Errington, S. P., Gavornik, J. P., Gillon, C. J., Granier, A., Hamm, J. P., Hertäg, L., & Kennedy, H. (2025). Neural mechanisms of predictive processing: a collaborative community experiment through the OpenScope program. ArXiv.org. https://arxiv.org/abs/2504.09614
关于追问nextquestion
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。您也可以在后台提问,我们将基于追问知识库为你做出智能回复哦~
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。
Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、、科普视频媒体「大圆镜」等。
热门跟贴