读博路上,当身边很多人因科研受挫就怀疑自我、半途转向时,他却选择坚守。比起轻易放弃、另寻捷径,他更愿意直面煎熬,哪怕项目无果、论文被拒,也始终深耕深度生成模型领域。李崇轩从清华博士成长为中国人大副教授,谷歌学术引用超万次,斩获多项顶级学术荣誉。但当他坐进「CCF 优博之路」的直播间,没有堆砌论文成果,没有灌输科研方法论,而是以“读博的浪漫”为钥匙,剖开科研光鲜背后的煎熬与迷茫,讲自己论文高分被拒的绝望,讲追逐学术理想时的瓶颈,讲“读博到底教会我们什么”。

✍️文字整理 | 李曼

本期「CCF 优博之路」邀请到的嘉宾是中国人大高瓴人工智能学院副教授、博士生导师李崇轩——致力于生成模型基础理论、建模范式、大规模训练策略和高效采样算法的研究,带领团队研制扩散大语言模型 LLaDA,谷歌学术引用一万余次;获机器学习领域顶级国际会议 ICLR 2022 杰出论文奖、吴文俊人工智能自然科学一等奖。主持国家自然科学基金青年科学基金B类(原国家优青)、重大研究计划培育项目;入选智源学者、吴文俊优秀青年奖、北京市科技新星、Intech科技奖提名和青橙奖提名;兼任IEEE TPAMI 编委和ICLR/NeurIPS/ICML领域主席;作为主编出版《大模型十讲》教材,指导学生入选国家自然科学基金青年学生基础研究项目(博士研究生)、字节跳动奖学金计划等。

在这次分享中,李崇轩以“读博的浪漫”为核心,跳出科研的光鲜表象,坦诚拆解了读博路上的煎熬与挫败,用自身从清华读博到成为博导的完整经历,诠释了“浪漫”的真正内涵:不是一帆风顺的坦途,而是明知前路坎坷,仍甘愿为心中热爱承受代价、坚守成长的选择。

️ 这是回顾内容。将门编辑部将 5 月 18 日直播提炼成文,保留核心精粹,希望这份深度整理能为每一位读者带来新的启迪。

嘉宾:李崇轩|中国人大高瓴人工智能学院副教授、博士生导师

主持:黄树东|四川大学计算机学院副研究员、博士生导师

常驻主持:李翔|南开大学

01|研究的起点——深度生成模型的探索

我的个人成长离不开深度生成模型领域的发展。

李崇轩:我的主要研究方向是深度生成模型基础理论与方法。当前人工智能的主流思路是“从经验中自动学习可泛化的模式”,其中有两个重要流派:概率机器学习专注于刻画数据的不确定性;深度学习则强调拟合复杂函数。而深度生成模型,正是这两个流派的完美结合——刻画高维数据的不确定性时,需要拟合复杂函数,因此我们用深度学习的方法来实现,这就是深度生成模型的核心逻辑。

打开网易新闻 查看精彩图片

我的个人的成长其实是离不开这个领域的发展,很有幸我的导师们给我指的这样一个方向。我 2013 年加入了朱军老师的团队,我的读博阶段(2013-2017年),恰好是深度生成模型取得诸多重要突破的时期,包括概率解读方法、网络结构等方面都有新进展。受此影响,我当时就有一个想法:希望有一天能提出一个像 GAN、VAE 或者扩散模型那样,能够定义一种新的概率建模范式模型。

02|读博的煎熬——科研路上的困境与挫败

科研中 95% 的时间是让人沮丧的。

李崇轩:读博很难用“愉快”来形容,过程中总会伴随着诸多难受与痛苦的时刻。何恺明曾说过:“科研中 95% 的时间是让人沮丧的”,这和我自身的感受很契合。

刚接触科研时,我完全是一头雾水,根本不清楚“研究”到底是什么;项目周期中几乎没有正反馈,想法不确定能否成功;投稿常因审稿人主观不认可得到负面反馈;入门后还会面临同龄人竞争、资源跟不上期待、领域变化快跟不上节奏、难以判断研究意义等问题。

在加入朱军老师团队之前,我曾在 MIC 实习,当时做的两个项目想法都不错,却因为各种意外没能投稿。那段时间,我内心的挫败感特别强烈,甚至忍不住怀疑自己,甚至怀疑自己不适合做科研。2014 到 2015 年,我完成了自己的第一个科研工作,投稿后拿到了不错的分数,本以为大概率能被接收,通宵等待后,最终却被拒。那种绝望感至今记忆犹新,后来经过调整,转投其他会议才得以接收。

2018 年我深入了解生成模型原理后,想做一个像 GAN、VAE 那样的好模型,却发现很多概率建模方法的深度版本都已被人做过,错过了领域发展的关键时期。后来选择难训练的能量函数模型,花了两年时间,虽提升了数据维度处理能力,但生成结果远不如同期其他深度模型,那段时间非常煎熬。

打开网易新闻 查看精彩图片

03|读博的浪漫——困境中的选择与成长本质

读博的浪漫并非一帆风顺,在于自主选择做一个个未被充分探索的项目。

李崇轩:“读博的浪漫”不是简单的褒义词,它和浪漫的爱情、事业一样,都充满坎坷,核心是一种个人选择——你下定决心自己去做一件困难的事,他人可能会给你提供帮助,但最终需自己承担所有后果,明知有代价,仍甘愿为心中的目标坚持。

读博的浪漫,在于艰难过程中获得的成长:

一是能成就事业,论文中的贡献和名字会成为可查询的个人标签,甚至有机会快速获得名望,站上更高的平台。

二是能增长能力,读博期间无太多生活和家庭压力,可专注学习、思考和解决问题。

三是能塑造信心,自己有机会成为某一领域的专家,比绝大多数人更了解自己的研究,能经得起所有同行的评议,塑造自信的品格。

打开网易新闻 查看精彩图片

04|把握读博浪漫——外在与内在成长的辩证思考

外在反馈必要但有噪声,内在成长是很好的锚点但反馈慢。

李崇轩:外在反馈很重要,尤其在科研初期,能帮我们定位自身、确认价值,但外在反馈充满随机性,很多时候无法掌控,过度追求只会陷入焦虑和茫然。内在成长是更重要的“锚点”,它不依赖外物,即便论文被拒,只要自己清楚研究的价值,就不会过度沮丧,也不会影响后续研究。但内在成长反馈很慢,需要长期积累,二者是互补的关系。

打开网易新闻 查看精彩图片

我的建议是辩证看待二者,既要重视外在反馈,满足求职、拿奖学金等现实需求,也要摆脱盲目内卷,专注内在成长。选择项目时,不必都追求外在指标,有些项目是为了长期爆发式成长做准备,哪怕短期没有好的结果,也是在积累能力。

打开网易新闻 查看精彩图片

05|正视得失——负面结果与错过机会的价值

正面结果固然可喜,负面结果是内在成长信号。

李崇轩:正面结果是难得的正反馈,但负面结果更具成长价值。当你认为有前景的项目出现负面结果,说明初始判断与实际存在差距,只要分析清楚原因,就能提升后续的判断能力和成功率,避免浪费时间。

打开网易新闻 查看精彩图片

我曾错过视频生成大模型的关键机会,我们做的 U-ViT 架构比 DiT 早三个月放到 arXiv,投稿 CVPR 被接收,而DiT被拒后转投 ICCV,最终影响力远超 U-ViT。复盘后我发现,我们的不足在于题目和命名不够直观、关键词缺失、实验虽全但未聚焦核心指标、缺乏可扩展性分析和视野局限,没有及时做图像应用和宣传。这次错过没有让我埋怨,反而让我学会了反思,帮助我把握住了后续的机会,这就是负面经历的价值。

06|坚守与开放——科研路线的选择智慧

初期聚焦,后期开放。

李崇轩:科研初期,建议大家坚持一个方向,不管是老师给的方向还是自己感兴趣的方向,重点是完成完整的科研训练,了解科研流程,积累基础能力,不要轻易追逐热点——热点领域竞争激烈,科研新人很难脱颖而出。

到了博士后期,我们在某个方向积累足够、对科研有深入理解后,要保持开放的心态,不要局限于单一方向。此时我们可以结合自身技术积累,切入热点领域,找到合适的切入点,用自己的视角解决领域关键问题,实现影响力的突破,而不是盲目跟风。

打开网易新闻 查看精彩图片

我毕业前一直专注于生成模型的原理研究,把相关技术吃透;毕业后才慢慢开放视野,切入架构大模型、3D、语言等领域。我们围绕“高维空间复杂概率表示”这一核心问题,将生成模型的视角运用到不同模态,做出了有影响力的工作,比如我们的扩散语言模型 LLaDA,实现了我读博时提出的“定义新概率建模范式”的梦想,拿到了ICLR研讨会唯一最佳长文,模型下载量超 600 万次,入选基金委重大研究计划系列成果。

07|困境破局——论文高分被拒后的心态调整与突破

高分被拒不可怕,理性改进、心态从容,方能破局前行。

黄树东:你当时投稿被拒之后,尤其是分又比较高,你当时什么样的感受?又是怎么走出来的?

李崇轩:面对论文高分被拒,首先要感性倾诉,主动和导师、师兄师姐、家人沟通,获得安慰和专业建议;其次要理性分析,接受无法改变结果的事实,认真梳理审稿人的合理意见,针对性改进。

比如我第一次被拒后,补充了卷积网络的实验,转投后就被接收了,专注改进的过程也能转移负面情绪。

李翔:从另外一个视角来讲是“尽人事,听天命”,把工作打磨到自己能做到的最好状态,再交给时间。

08|路线坚守——扩散语言模型非主流路线的选择与坚持

坚持非主流路线,循序渐进、终见成效。

黄树东:为什么你坚持扩散语言模型这一非主流路线?

李崇轩:我们坚持扩散语言模型这一非主流路线,是一个循序渐进的过程。2023 年,我发现连续扩散模型的概率建模方法已趋于成熟,便想尝试将其应用到离散的语言领域,初期只是找学生做算法探索,后来发现扩散做语言有并行解码等优势,且有理论支撑,便下定决心找资源做大。我们在过程中虽遇到学生更换、资源被调走等挫折,甚至一度想放弃,但我们始终坚持,最终做出了有影响力的成果。

09|读博适配——如何判断自身是否适合读博

读博适配看两点,能承受最坏的结果,能容忍不确定性。

黄树东:怎么判断一个学生到底适不适合读博?

李崇轩:判断是否适合读博,关键看两点:

一是能否承担读博的最坏结果。如果读博不顺利,能否接受找不到更好的工作,甚至无法毕业,家庭和个人能否承受这种代价。

二是对不确定性和长期无正反馈的容忍度。是否有足够的好奇心,有愿意钻研、探索未知,适应读博的节奏和状态。如果过于纠结,大概率两种选择差别不大,选定一条路坚持走下去即可。

李翔:我们的人生是需要在叫谋生和谋道之间寻求一个平衡,谋道更多是向内求,谋生是向外求。如果你这个阶段是你的谋道的比例远大于谋生,你适合去读个博,它会给你一个相对比较纯净一点的环境,让你去再求一下道。但如果你自己的状态是求生大于求道的,建议优先工作,你先满足自己的生存。但整个人生还是需要寻求平衡的,你不能太出世,也不能入世。

10|博士训练——AI 时代博士训练的不可替代性

AI 可辅助科研,领域认知、科研判断力才是博士训练核心。

黄树东:AI 时代博士训练的不可替代部分是什么?

李崇轩:AI 时代,博士训练最不可替代的,是对领域的理解、科研品味和判断力——判断什么问题值得解决、什么项目值得投入,这是AI短期内无法替代的。AI 能辅助读论文、写代码、做 PPT,放大已有能力,但无法替代人对研究本质的认知。对能力强的人,AI 是杠杆,能让其更高效;对能力不足的人,AI 可能会放大错误,反而不利于成长。

11|结语——享受读博的浪漫,不负选择

研究本质上是满足自己的好奇心。

李崇轩:研究的本质是满足自己的好奇心。所谓的科研品味,就是选择自己觉得有意思、有价值的问题去探索,甚至有些大佬会把研究当作一种信仰,即便别人不认可,也会坚持下去。

读博没有绝对的对错,它只是一种个人选择。希望大家能享受读博的浪漫,正视过程中的坎坷与成长,只要不后悔自己的选择,就是最好的结果。

Illustration From IconScout By IconScout Store

报名截止至5月31日(周日)20 点,席位有限~

-The End-

本周上新!

扫码观看!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。社区上线700+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

yimingzhang@thejiangmen.com

或添加工作人员微信(aceyiming投稿,沟通投稿详情

关于我“门”

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

打开网易新闻 查看精彩图片

点击右上角,把文章分享到朋友圈