2026年6月,斯坦福大学教授李飞飞在Substack上发表了一篇文章。标题很长:《世界模型的功能分类:渲染器、模拟器、规划器,以及连接它们的循环》。
文章没有发布新模型,没有官宣新产品。就是一篇论文式长文。但整个AI圈震动了。
因为这篇文章做了一件事——给"世界模型"下定义。
过去18个月,超过100亿美元涌入"世界模型"和机器人AI公司。创业公司不管做什么,都在PPT上贴"世界模型"四个字。视频生成器叫世界模型,大语言模型叫世界模型,物理引擎也叫世界模型。整个行业都在用同一个名字卖完全不同的东西。
李飞飞看不下去了。
她从强化学习最经典的理论框架POMDP出发,把所有号称"世界模型"的系统,拆成了三类——
渲染器:输出视觉画面,核心是"像不像"。
模拟器:输出符合物理规律的世界状态,核心是"真不真"。
规划器:输出智能体的行动决策,核心是"会不会做"。
她说了一句话:现在市面上最火的那类被叫"世界模型"的产品——比如视频生成器——本质上只是渲染器。它能生成好看的画面,但它不理解物理规律,也不能帮机器人做决策。
翻译成人话:你以为你买的是世界模型,其实你买的是个美颜相机。
敢这样做的人,在AI圈里没几个。
因为"定义权"从来不是人人有的。定义权意味着资格,意味着底气,意味着你说的每一句话都有人认真对待。
而李飞飞的这种底气,是自己用四十多年,一步一步挣来的。
一、从成都到普林斯顿
1976年,李飞飞出生在北京。不久后,一家人搬到四川成都。父亲是工程师,母亲是老师。这是一个典型的知识分子家庭。
她父母的教育方式很特别——不逼她刷题,只规定一件事:学校作业只能在回家后40分钟内完成。时间一到,作业必须放下,剩下的时间,李飞飞可以做任何她感兴趣的事。
读书,跟小伙伴玩,发呆,看天上云的变化。
她后来回忆说,正是童年里那些"不用做作业"的自由时间,让她养成了高效专注的习惯,也给了她比别人更宽广的精神世界。
但艰难在后面。
16岁那年,父母做了一个大胆的决定:带她移民美国。
1990年代初的中国家庭,带着对一个"更好的教育环境"的期望,举家搬到新泽西。这是一场巨大的冒险——一家三口,没有人会说流利的英语。
父亲是工程师,到了美国只能给人修相机。母亲是教师,只能在超市当收银员。一家三口挤在一间小公寓里,靠着微薄的收入勉强维持。
李飞飞进入帕西帕尼高中。刚开始她听不懂课,看不懂课本。
她没有退缩,她除了努力适应美国的学习外,还在中餐馆洗碗、擦桌子、做清洁工。最忙的时候,一天只睡四个小时。
后来父母向国内亲戚借钱,开了一家洗衣店。李飞飞成了家里唯一能流利使用英语的人——接电话、谈客户、处理账单、应对政府检查,她一样一样地来。她后来开玩笑说:我是这家洗衣店的"CEO"。
这段经历,从18岁一直持续到研究生中期。整整七年。
当有记者问她这段经历教会了她什么,她说了一个词:坚韧。
"科学探索的道路从来不是线性的,充满了未知与挫折。而作为一个移民,在生存压力下学会的坚韧,是我在科研道路上最宝贵的财富。"
二、从ImageNet到AI教母
1995年,李飞飞以全班第六名的成绩从高中毕业,拿到了普林斯顿大学的全额奖学金。她选了物理学——"生活是渺小的,而物理学是广阔的,是大胆的。"
1999年大学毕业,她的大多数同学进入了华尔街和硅谷,拿高薪、过好日子。李飞飞做了一个让所有人都觉得她疯了的选择——去西藏研究藏药。
她跟牧民一起住在高原上,学习东方医学和哲学。她想知道,知识到底有多少种可能的形式。
一年后,她进入加州理工学院攻读博士。读博期间,母亲被查出癌症并中风。她一边照顾母亲,一边推进研究,什么都没耽误。
2005年,她拿到了加州理工学院电子工程博士学位。两年后,她回普林斯顿当助理教授。2009年,加入斯坦福。
这时候的AI视觉识别,还只能认出人脸和简单的物体。李飞飞觉得远远不够。她决定做一个疯狂的项目——给互联网上所有物体的图片打标签,每一张图片标注出物体在哪里、是什么。
她管这个项目叫ImageNet。
没有经费。没有团队。没有机构支持。
她和一个同事自掏腰包,花50美元启动了项目。最后的解决方案是:亚马逊众包平台。她请全世界的人来帮她标注图片,每张几分钱。
当ImageNet建成的时候,包含了超过1400万张标注图片,涵盖两万多个类别。
2012年,一个叫AlexNet的深度学习模型用ImageNet参加视觉识别比赛,准确率碾压所有传统方法。
AI革命,从那一年开始。
之后的故事很多人都知道了——李飞飞成为斯坦福大学首位红杉讲席教授。担任谷歌云AI首席科学家。创立了斯坦福以人为本AI研究院(HAI)。联合创办AI4ALL,推动AI教育的多样性和公平。当选美国国家工程院、医学院、艺术与科学院三院院士。
2024年,她在斯坦福休假期间创办了World Labs,专注于"空间智能"——让AI理解三维世界。公司至今估值已达50亿美元。
一个17岁还在中餐馆刷盘子的女孩,用了三十年,成为了被全世界尊称为"AI教母"的人。
三、李飞飞给人们的三个启示
然后,2026年6月4日,她坐下来写了一篇文章。
没有炫技,没有营销,就是回到理论源头,把行业里被滥用了18个月的"世界模型"概念,拆开来看清楚:什么叫渲染,什么叫模拟,什么叫规划。哪些是真的,哪些是唬人的。
她对全行业说:别再把视频生成器叫"世界模型"了。它不是。
超过100亿美元的泡沫,被一篇学术文章戳了一下。
这件事对我们的孩子来说,有三个启示。
第一,真正的定义权,来自走过的路。
李飞飞凭什么敢定义"世界模型"?凭她从ImageNet到World Labs,十七年一天都没有离开过这个领域。凭她对这个问题的理解,是在代码、数据、实验和无数次失败中淬炼出来的。
跟孩子说:不要做那个满口术语、一知半解的人。做一个真正懂的人。哪怕懂得慢一点,但每一步都是实的。真的底气不需要声嘶力竭,需要的是时间积累。
第二,最稀缺的能力,是"在混乱中厘清边界"。
AI行业不缺钱,不缺人才,不缺新概念。但缺一个人站出来说:停一下,这个词不是这个意思。
当所有人都在跟风堆概念的时候,你愿意停下来理一理逻辑——这就是科学精神。不是制造更多噪音,而是帮这个世界减少噪音。跟孩子说:不要追求"看起来厉害",追求"说清楚"。
第三,一个人的上限,由她的起点和选择共同决定。
李飞飞的起点是16岁,一句英语不会,在中餐馆洗碗。她选择的路是:物理学、藏药研究、ImageNet、AI伦理、空间智能、世界模型定义——都不是最"赚钱"的方向,但每一个都是"最该被做"的方向。
她没有追过热点。但热点后来都在追她。
告诉孩子:不用着急跑到人群最密集的地方去。选你觉得重要但没人在做的事。耐得住寂寞的人,最后往往最不寂寞。
希望我们的孩子也能长成这样的人——手里有活,心里有光,在所有人都往一个方向挤的时候,敢于朝另一个方向走一步。
热门跟贴