你刷到过那些AI生成的视频吗?打几个字进去,几秒钟就给你出一段画面,逼真得让人分不清真假。

它们用的方法叫扩散模型。今天能生成视频和图像的AI,绝大多数都用这套方法。国内的即梦、可灵,国外的Sora、Stable Diffusion、DALL·E 2,都是。

扩散模型不是某家公司的发明,背后是几篇关键论文。其中一篇的作者,是个江苏连云港人,叫宋飏。

他写这篇论文那年25岁,斯坦福博士读到第四年。

打开网易新闻 查看精彩图片

高中三年,宋飏在新海高级中学拿了两个一等奖:全国中学生物理奥赛一等奖、全国青少年信息学奥赛(NOIP)一等奖。

他参加了清华"新百年领军计划"的面试。这是清华的特殊招生项目。17位评委全票通过。

次年高考,江苏卷满分480分,他裸分425分,连云港市理科状元。

16岁,他上了清华。

清华数理基础科学班

宋飏选的不是姚班,是数理基础科学班。

两个都是清华的特殊培养班。姚班偏计算机科学;数理基础科学班数学加物理双修,培养的是基础学科的研究人才。

本科他没走基础学科的路。2016年清华毕业,去斯坦福读AI方向的博士。

博士期间他没碰当时主流的GAN,走的是一条冷门路线:score - based generative model(基于分数的生成模型)。

GAN的思路是"对抗"。一个网络画图,另一个网络挑刺,互相博弈到画得足够逼真。这套思路2014年发表之后,统治了图像生成领域整整5年。

宋飏走的是另一条路。他不让AI直接画图,而是教AI学一件事:拿到一张乱糟糟的噪声图,怎么把它往清晰方向修一步。学会这一步之后,从纯噪声开始反复修几百步,就能修出一张完整的图。

这种"反复修"的思路,就是后来的扩散模型。

2019年,他在NeurIPS(AI领域最顶级的会议之一)发表了第一篇基于分数的生成模型论文。这是基于分数的方法第一次在画图质量上把GAN比下去。

2020年底,他和导师Stefano Ermon等人合作,又发了一篇集大成的论文:Score - Based Generative Modeling through Stochastic Differential Equations。这篇论文用随机微分方程,把当时所有score - based方法和扩散模型装进了同一个数学框架。

这篇论文拿下了ICLR 2021杰出论文奖。

后来主流的图像和视频生成模型,几乎都建立在这套数学框架上。

2022年博士毕业,宋飏加入OpenAI,组建了一个小团队叫"战略探索"。

2023年4月,团队开源了一项新技术:Consistency Models(一致性模型)。一起署名的还有清华校友路橙和OpenAI联合创始人Ilya Sutskever。

扩散模型的痛点是慢。生成一张高清图要反复"修"几十到上百步。一致性模型把这个过程压缩到一两步出图,速度快了几十倍,质量基本不掉。

提出一致性模型的正是他自己。当年扩散模型,也是他奠基的。

那年宋飏27岁。

2025年9月25日,Meta把他从OpenAI挖走了。

在Meta,他担任超级智能实验室(Meta Superintelligence Labs)的研究负责人(Research Principal),直接向首席科学家赵晟佳汇报。两人都是清华校友。

超级智能实验室是扎克伯格2025年新成立的AI部门,专门用来追赶OpenAI。这一年Meta从OpenAI、DeepMind、Anthropic挖走了一批顶级研究员,宋飏是其中分量最重的几个之一。