人脑似乎以与先进人工智能语言模型相同的分层、逐步方式从语音中构建意义。这一发现重塑了长期以来关于语言的观念,表明理解是通过语境而非固定规则逐步成长的。

摘要:科学家们发现,人脑理解口语的方式与先进人工智能语言模型的工作方式非常相似。通过追踪人们听长时间播客时的大脑活动,研究人员发现意义是一步步展开的——就像GPT式模型等系统内部的分层处理一样。

打开网易新闻 查看精彩图片

一项新研究表明,人脑通过逐步理解口语语言,这种过程与先进的人工智能语言模型的工作方式非常相似。通过记录听讲故事的人的大脑活动,研究人员发现,大脑反应的后期阶段与人工智能系统更深层相匹配,尤其是在像布罗卡区域这样知名的语言区域。这些结果质疑了长期以来基于规则的语言理解观念,并得到了新发布的公开数据集的支持,该数据集为研究大脑意义如何形成提供了一种强有力的新方法。

这项发表在《SCIENCE DAILY》上的研究由希伯来大学的Ariel Goldstein博士领导,合作者包括谷歌研究的Mariano Schain博士以及普林斯顿大学的Uri Hasson教授和Eric Ham。团队共同发现了人类理解语音的方式与现代人工智能模型处理文本的方式之间意想不到的相似之处。

科学家们利用听过三十分钟播客的参与者的脑电皮层图录音,追踪了大脑活动在语言处理过程中的时间和位置。他们发现大脑遵循结构化序列,与GPT-2和Llama 2等大型语言模型的分层设计非常相似。

1 大脑如何随着时间构建意义

当我们听别人说话时,大脑不会一次性完全理解意义。相反,每个单词都经过一系列神经步骤。Goldstein及其同事展示了这些步骤随着时间推移的展开,与AI模型处理语言的方式相似。AI的早期层面侧重于基本词汇特征,而更深层次则结合了语境、语气和更广泛的含义。

人类大脑活动也遵循同样的模式。早期的神经信号与人工智能处理的早期阶段相匹配,而后期的大脑反应则与模型的更深层次相符。这种时间匹配在更高层次的语言领域尤为强烈,如布罗卡领域,当与更深层的人工智能层级关联时,响应峰值较晚。

据戈德斯坦博士介绍:“最让我们惊讶的是,大脑意义的时间展开与大型语言模型中转换的序列如此接近。尽管这些系统构建方式截然不同,但它们似乎都趋同于逐步构建理解的过程。”

2 这些发现为何重要

研究表明,人工智能不仅能生成文本。这也可能帮助科学家更好地理解人脑如何创造意义。多年来,人们认为语言主要依赖于固定符号和严格的等级制度。这些结果挑战了这种观点,反而指向一个更灵活、更具统计性质的过程,意义在语境中逐渐显现。

研究人员还测试了传统语言元素,如音素和语素。这些经典特征未能很好地解释实时大脑活动,也无法解释AI模型产生的情境表征。这支持了大脑更依赖流动语境而非严格语言构建模块的观点。

3 语言神经科学的新资源

为了推动该领域的发展,团队已公开了完整的神经记录和语言特征。这一开放数据集使全球研究人员能够比较语言理解理论,并开发更贴近人类思维运作的计算模型。

期刊参考

阿里尔·戈德斯坦、埃里克·哈姆、马里亚诺·斯切恩、塞缪尔·A·纳斯塔塞、鲍比·奥布里、扎伊德·扎达、阿维盖尔·格林斯坦-达布什、哈什瓦尔丹·加祖拉、阿米尔·费德尔、沃纳·多伊尔、萨沙·德沃尔、帕特里夏·杜根、丹尼尔·弗里德曼、迈克尔·布伦纳、阿维纳坦·哈西迪姆、约西·马蒂亚斯、奥林·德文斯基、诺姆·西格尔曼、阿丁·弗林克、奥默·莱维、罗伊·赖查特、乌里·哈森。人脑中自然语言处理的时间结构对应于大型语言模型的层级结构。《自然传播》,2025年;16 (1)

DOI: 10.1038/s41467-025-65518-0

来源 | SCIENCE DAILY