一项认知科学研究揭示了人类与当前人工智能之间的根本差距:新生儿在出生几分钟内就能理解物体恒存性——知道东西不会因为看不见就消失。这种对物理世界的直觉理解,大语言模型(LLM)至今无法掌握。

研究人员指出,婴儿通过观察物体运动、碰撞和遮挡,快速建立起关于质量、空间和因果关系的内部模型。这种学习几乎不需要标注数据,而LLM依赖的正是海量文本中的统计模式。文本里没有重力,没有惯性,只有"苹果落下"这几个字的共现概率。

打开网易新闻 查看精彩图片

更关键的是,婴儿的学习是具身的。他们触摸、抓取、扔东西,从物理反馈中修正认知。LLM没有身体,没有传感器,无法体验"重"或"滑"意味着什么。多模态模型能看图识物,却依然停留在像素层面的模式匹配,而非真正理解三维空间中的物体关系。

打开网易新闻 查看精彩图片

这一差距指向AI发展的瓶颈:当前技术路径可能无法通向通用智能。一些研究者开始探索"世界模型"——让AI像婴儿一样,通过预测物理结果来学习因果。但这需要全新的架构,而非在Transformer上堆叠更多参数。

对从业者而言,这意味着两类机会。一是垂直场景的深度整合,比如机器人结合LLM进行任务规划,用硬件弥补认知缺陷。二是认知科学的反哺,从发展心理学中汲取灵感,设计更接近人类学习机制的算法

打开网易新闻 查看精彩图片

婴儿的大脑是进化数亿年的产物,而深度学习只走了十几年。承认差距不是悲观,而是避免在错误的方向上过度投入。毕竟,能读懂"苹果落下"和真正知道苹果会砸到头上,是两回事。