打开网易新闻 查看精彩图片

认知神经科学前沿文献分享

打开网易新闻 查看精彩图片

基本信息

Title:Human-like cognitive generalization for large models via mental representation-guided supervision

发表时间:2026-4-1

发表期刊:Nature Communications

影响因子:15.7

获取原文:

1. 添加小助手:PSY-Brain-Frontier即可获取PDF版本

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

研究背景

当前的大型语言模型和深度神经网络在图像与自然语言任务上表现惊艳,似乎只要不断增加数据和参数,人工智能就能无限逼近人类智能。然而事实并非如此。当涉及到理解抽象概念、逻辑推理以及适应全新场景等人类特有的复杂认知能力时,现有的深度神经网络依然举步维艰。

打开网易新闻 查看精彩图片

认知科学家曾指出,神经网络缺乏“心理表征的系统性”,这可能是它们难以实现类人认知的核心阻碍。目前的模型更多是在海量数据中寻找统计相关性,而不是像人类那样,通过结构化的知识组织来理解物理世界。

为了打破这一认知瓶颈,浙江大学团队近期在 Nature Communications 发表了最新研究。他们没有选择继续堆叠算力,而是另辟蹊径,直接利用人类大脑的神经信号作为监督信号,试图将人类的“概念结构”转移到大模型中。这项工作不仅揭示了规模法则在抽象概念理解上的局限,还为开发具备真正认知泛化能力的类人智能系统提供了一条全新路径。

打开网易新闻 查看精彩图片

研究核心总结

一、单纯增加模型参数无法提升对抽象概念的理解

研究者首先测试了不同规模的经典视觉模型,包括 SimCLR、DINOv2 和 CLIP。结果表明,参数量的增加确实能让模型更好地识别“袜子”或“天鹅”等具体概念,但在面对“衣物”或“鸟类”等抽象概念的单样本学习时,性能却几乎没有提升,甚至出现了下降。

通过表征相异度矩阵分析,研究者找到了症结所在。模型虽然能精准区分具体物体,但根本无法像人类高级视觉皮层那样,自发形成“生物”与“非生物”等宏观语义聚类。缺乏对概念间内在关系的把握,是限制模型抽象理解能力的致命弱点。

打开网易新闻 查看精彩图片

Fig 1. 随着参数量增加,模型对具体概念的分类能力稳步提升,但在抽象概念上却停滞不前甚至出现性能下降。
二、引入大脑信号让模型涌现出“类人概念层级”

为了解决这一问题,研究者提出了一种“心理表征引导的监督学习”框架。他们提取了人类受试者在观看物体时的高级视觉皮层 fMRI 信号,并利用图匹配算法,将深度神经网络的概念图结构与人类大脑的概念图结构进行对齐。

奇妙的是,仅仅使用 150 个具体物体的脑信号进行对齐,模型不仅在未见过的概念上实现了泛化,其内部还自发涌现出了与人类词汇数据库 WordNet 高度一致的概念层级结构。在模拟人类的三选一判断任务中,引导后的模型做出的选择也显著更接近人类直觉。

打开网易新闻 查看精彩图片

Fig 2. 研究者提出了一种心理表征引导的监督学习框架,通过图匹配技术将深度神经网络的概念表征与人类大脑的表征结构进行对齐。

打开网易新闻 查看精彩图片

Fig 4. 经过大脑信号引导后,模型内部自发涌现出了与人类高度一致的概念层级结构,并在认知行为测试中表现得更像人类。
三、类人概念结构大幅提升了复杂认知任务表现

拥有了类人概念结构后,模型在多项极具挑战性的认知任务中迎来了性能飞跃。在仅提供一个示例的抽象概念分类任务中,经过脑信号引导的基础版模型,其表现甚至超越了参数量是其近五倍的大型基线模型。

此外,在广义分布外识别任务中,模型能够仅凭极少的类别监督,准确推断出未见过的物体是否属于某个宏观类别。在脑到图像和图像到图像的跨模态检索中,模型也展现出了超越表层视觉特征的深层语义捕捉能力。

打开网易新闻 查看精彩图片

Fig 3. | Mental representation-guided supervision enhances the ability to understand abstract concepts for DNNs. a. Silhouette coefficient (SC) sco...

打开网易新闻 查看精彩图片

Fig 5. 具备类人概念结构的模型在抽象概念的单样本学习、分布外识别以及跨模态检索等复杂任务中,均实现了显著的性能飞跃。
四、重塑的潜在空间具备真正的“认知一致性”

为了探究性能提升的根源,研究者对模型的潜在表征空间进行了降维和文本解码分析。结果显示,脑信号引导让模型的概念流形具备了极强的局部语义一致性。

在这个重塑的空间里,概念之间不仅边界清晰,还能进行符合逻辑的平滑过渡。例如在车辆和有蹄类动物的表征之间进行插值,解码器会输出“马”。模型甚至能完成复杂的概念算术,比如将“骑摩托车的男人”减去“摩托车”加上“马”,模型会准确将其理解为“骑马的男人”。

打开网易新闻 查看精彩图片

Fig 6. 引导后的模型在潜在空间中形成了连续且符合人类直觉的语义流形,不仅支持概念间的平滑过渡,还能完成复杂的概念算术。

打开网易新闻 查看精彩图片

研究意义

这项工作从根本上挑战了当前人工智能领域盛行的规模法则,有力地证明了在通往高级认知的道路上,结构化往往比单纯的规模扩张更智能。

从理论与方法学上看,该研究表明人类大脑内在的表征几何结构包含着可转移到人工系统中的高级抽象规律。它提供了一种将生物认知先验与数据驱动学习相结合的全新范式,让模型在不依赖海量标注数据的情况下,也能获得强大的泛化与推理能力。

当然,目前该框架仍依赖于特定受试者的 fMRI 数据,存在个体差异和数据获取成本的限制。但它为未来利用大规模神经影像数据提取群体不变的概念结构指明了方向。这不仅有助于我们理解大脑如何组织知识,更为开发更具解释性、适应性和类人智慧的人工智能系统奠定了坚实基础。

分享人:饭鸽儿

审核:PsyBrain 脑心前沿编辑部

你好,这里是「PsyBrain 脑心前沿

专注追踪全球认知神经科学的最尖端突破

视野直击 Nature, Science, Cell 正刊 及核心子刊与顶级大刊

每日速递「深度解读」与「前沿快讯

科研是一场探索未知的长跑,但你无需独行。欢迎加入PsyBrain 学术社群,和一群懂你的同行,共同丈量脑与心智的无垠前沿。

点击卡片进群,欢迎你的到来

一键关注,点亮星标 ⭐ 前沿不走丢!

打开网易新闻 查看精彩图片

一键分享,让更多人了解前沿