婴儿天生懂物理，大语言模型却学不会

摸鱼算法

2026-05-26 00:23 ·北京

一项认知科学研究揭示了人类与当前人工智能之间的根本差距：新生儿在出生几分钟内就能理解物体恒存性——知道东西不会因为看不见就消失。这种对物理世界的直觉理解，大语言模型（LLM）至今无法掌握。

研究人员指出，婴儿通过观察物体运动、碰撞和遮挡，快速建立起关于质量、空间和因果关系的内部模型。这种学习几乎不需要标注数据，而LLM依赖的正是海量文本中的统计模式。文本里没有重力，没有惯性，只有"苹果落下"这几个字的共现概率。

更关键的是，婴儿的学习是具身的。他们触摸、抓取、扔东西，从物理反馈中修正认知。LLM没有身体，没有传感器，无法体验"重"或"滑"意味着什么。多模态模型能看图识物，却依然停留在像素层面的模式匹配，而非真正理解三维空间中的物体关系。

这一差距指向AI发展的瓶颈：当前技术路径可能无法通向通用智能。一些研究者开始探索"世界模型"——让AI像婴儿一样，通过预测物理结果来学习因果。但这需要全新的架构，而非在Transformer上堆叠更多参数。

对从业者而言，这意味着两类机会。一是垂直场景的深度整合，比如机器人结合LLM进行任务规划，用硬件弥补认知缺陷。二是认知科学的反哺，从发展心理学中汲取灵感，设计更接近人类学习机制的算法。

婴儿的大脑是进化数亿年的产物，而深度学习只走了十几年。承认差距不是悲观，而是避免在错误的方向上过度投入。毕竟，能读懂"苹果落下"和真正知道苹果会砸到头上，是两回事。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴