当学术圈习惯用"论文数量"衡量一个博士的产出时,杨学提供了一个更锋利的标准:你的工作是不是连续的,是不是系统的。
✍️文字整理 | Ellie文钦
本期「CCF 优博之路」邀请到的嘉宾是上海交通大学自动化与感知学院长聘教轨助理教授、博士生导师杨学——连续三年入选全球前 2% 顶尖科学家榜单和爱思唯尔中国高被引学者名单,在 CCF A 类期刊和会议上发表 50 余篇论文,包含最具影响力 AAAI 2021 论文榜首及《Remote Sensing》期刊最佳论文,谷歌学术引用累计超万次,并担任 ICLR/AAAI 顶级会议领域主席。 他在一个当时几乎没人做的小众方向——有向目标检测——上一扎就是七年,从硕士期间"踏踏实实写了两年代码"到博士期间形成模型架构、表征优化、数据训练、开源生态四大板块的系统性成果。这次直播,他把系统性科研拆解得足够坦诚: 他说自己博士期间"并不是最卷的那一批",但因为每一次工作都有前一次的基础,效率会越来越高;他承认自己最不满意的论文反而引用量最高,最满意的反而没人看;他讲述一篇论文被拒四轮、绕了一个完整轮回才最终录用的经历,但建议大家与其学会安慰自己,不如降低被拒的概率。他认为大模型时代下,单兵作战已经行不通了,但论文中不中可能也没那么重要了。
️ 这是回顾内容。「CCF优博成长访谈」系列直播由减论APP召集,CCF SPP、Machine Intelligence Research (MIR) 共同发起,将门-TechBeat人工智能社区参与组织。将门编辑部将 3 月 30 日直播提炼成文,保留核心精粹,希望这份深度整理能为每一位读者带来新的启迪。
嘉宾:杨学|上海交通大学教授、博士生导师、2023 CCF优博
主持:黄树东|四川大学计算机学院副研究员、博士生导师
常驻主持:李翔|南开大学
01 三种博士困境
你属于哪一种?
系统性科研的反面,不是“不努力”
杨学:我们不讨论不努力的博士。我们就讨论努力的博士——但成果要么不系统,要么不太好。
第一种,非常努力,但比较分散。他们会把很多时间花在写代码或工程性的事情上,很少去读论文。这种学生对老师而言其实还挺喜欢的,但对他个人而言很难积累科研成果。
第二种相反,非常喜欢读论文,一天读一大堆。但读多了之后会迷失——用做模型的话来讲,他过拟合了。他把自己的想法局限在现有的这些论文里面,跳不出局部最优。
第三种,Paper 确实多,博一博二就发了四五篇,但回过头一看,文章之间缺少联系。到写博士论文的时候就很痛苦——两篇论文毫无相关,怎么分章,怎么递进?
这三种情况非常常见。但我觉得这肯定不是天赋问题,更多的是方法问题和心态问题。
02 复利引擎
为什么我"不是最卷的那一批"
每一次工作都有前一次的基础,效率会越来越高
杨学:我回顾了一下,我个人在博士期间并不是最卷的那一批。但不是故意不卷——是因为我的工作效率比较高,得益于系统性科研。每一次做的工作,我都已经有基础了。
比如我要做有向目标的表征优化,我有一个好的 idea 要去实现——但实现需要一套好的 code base、需要数据准备。而这些东西我在之前做框架模型的时候已经打了非常深厚的基础,代码每一行都是我亲自敲的,数据也已经处理好了放在服务器上。
所以我只要负责把 idea 想出来,然后做实验。如果运气好,核心实验可能几下就做成功了,很快就进入写论文阶段。我不需要每天熬夜写代码,因为前面已经产生了一些复利能够让我使用,效率会越来越高。
03 标签觉醒
从"刻意隐藏"到"主动亮出来"
一位老师批评了我一顿,让我想通了
杨学:早期我其实挺抵触别人说我是做遥感的。当时遥感不受 AI 学界待见——一提遥感,大家就觉得是涉密的、数据不开源的、自己玩自己一套的。所以我发论文标题从来不提“遥感”两个字,写故事的时候尽可能抽象化,比如说"复杂环境"——其实就是遥感。
但博士毕业找教职的时候,有一位老师批评了我一顿。他说:你做遥感的就是做遥感的,这是你让别人记住你的身份。不同的人有不同的风格,你不需要迁就别人。
我后来想通了。现在别人不提,我反倒主动跟他说:其实我还做很多遥感的事情。这个标签我不再藏着了,我把它秀出去。
04 悖论时刻
最不满意的论文,引用量最高
越满意的文章,越没人看
杨学:对我自己比较满意的那些论文,往往引用量不高。反倒是我那几篇引用量最高的,我对它越来越不满意。
原因是早期做学术的时候,对领域还没有独到见解,很多都是跟风去做——跟风之作容易上手,所以容易火。但随着你对领域越来越熟悉,学术品味不断提高,你做的东西可能门槛更高了,很多人看不懂。
我最近看到一个李荣浩的采访,他自己说最不看好的两首歌反倒是他最火的代表作——一个是《李白》,一个是《不将就》。不管是做音乐创作还是做学术研究,好像都有这个现象。
05 拒稿轮回
一篇论文绕了一个完整的圈
与其学会安慰自己,不如降低被拒的概率
杨学:我影响力最大的那篇论文,最终发在 CVPR 2021。但其实 2019 年就投出去了——投 CVPR 2020 被拒,转投 ICCV 被拒,转投 ECCV 被拒,再转投 CVPR 2021,相当于一个轮回,然后中了。
从结果看还好都中了,引用量还挺高的。所以不要担心被拒了心情很差——客观看待审稿意见,有用的筛出来改掉,没用的不要管,不要被情绪带走。
但说实话,我觉得更重要的不是怎么安慰自己,而是怎么降低被拒的概率。很多学生抓到一个点,发现涨点了就硬往下做,不去思考这个东西即使涨 10 个点有没有意义。想清楚 motivation 再去做,比什么都重要。
06 神奇的人
两次灵光一现,都来自同一个朋友
不要单打独斗,尤其在这个时代
杨学:有一个对我影响很大的研究伙伴。第一次,我们都在用框来表征目标,他跟我说:能不能用高斯分布?我一开始觉得惊为天人,后来真去做了,work 了,产生了一系列成果。
第二次,还是这哥们,他花了一个晚上写了一套代码——只用水平框监督,输出的旋转框预测效果竟然跟全监督差不多。我们都很震惊,花了好长时间检查有没有数据泄露,后来证实没有。这个发现后来衍生出了我们整个弱监督有向目标检测的系列工作。
我做这个方向太久了,很多思维已经固化了。但跟志同道合的人交流之后,他们会提出我以前完全没想到的东西,甚至直接帮你跑通了,你只需要沿着他的点往外扩。
李翔:交流其实挺重要的。
杨学:真的不能单打独斗,尤其这个时代下,绝对不能单打独斗。
07 时代转轨
从单兵英雄到大兵团作战
论文中不中,可能以后没那么重要了
杨学:大模型时代下科研发生了实质性的变化。
首先是工具。以前一个博士写一套代码,在 GPU 上吭哧吭哧跑就行了。现在对代码能力的要求极大程度降低了——你只需要会用 Cursor、Claude Code 这些工具,把需求写清楚就能实现。但对你其他方面的能力要求反而更高了。
其次是实验管理。我做过一个 256 卡跑一个实验的代码,跑一次可能需要两周。按以前的方式做消融实验,一年跑完也得不到几个结论。你必须在有限的实验次数下挖出更多有意思的现象。
第三是协作模式。以前一个人能搞定,现在涉及数据、架构、预训练、后训练、评测、基础设施——需要很多人,大兵团作战。
最后是评价体系。以前最终目标是论文录用。但现在很多前沿机构并不在意论文有没有中,更多是以技术报告的方式放出来。我觉得未来一两年,论文可能没那么重要了,反而是生态影响力更重要——中不中论文可能也能毕业,甚至也能拿到教职。
08 “青椒”生存
没卡没经费,怎么把实验室建起来
不瞒你说,我们现在用的还是 3090 和 4090
黄树东:大兵团作战的理念很好,但它有前提——算力设施完善、经费充足、人力充沛。像我在西部高校,条件相对差一些,甚至有同行只做偏理论偏优化的方向,因为完全可以不用卡也能发文章。在这种条件下怎么展开协作?
杨学:不瞒黄老师说,我们实验室虽然也挂靠上海人工智能实验室,但现阶段整个大课题组只有我博士期间用下来的 3090 和 4090。A100、H100 我们买不起,即使买得起也没地方放。而且我跟大老板方向差异比较大,基本独立运作。
刚回高校确实觉得好多东西好难——要经费没经费,要卡没卡。学生交大倒还好,不太缺。但如果你没把实验室建起来,后面学生也会缺的,因为没人来找你了。
我现在的策略是几条线并行:实习方面,只放科研实习,不放纯工程的;项目方面,尽可能接科研性质的横向,借助大厂资源做更有影响力的工作;学生方面,刻意培养几个能力强的学生,让他们去带新人。我尽可能不去干扰学生的科研讨论——我发言的时候,往往是他们说"API 钱不够、卡不够"的时候,我说“我尽量帮你们想办法”。
09 系统性与追热点,真的冲突吗?
既蹭了热点,又没脱离系统性
黄树东:在时间有限、评价机制内卷的情况下,短平快的蹭热点和系统性的深耕之间,怎么做到平衡?
杨学:这两个事情不是完全对立的。我在做系统性科研的同时,也需要去了解热点在做什么。比如 Transformer 爆火的时候,我就去想——这个东西能不能和我做的有向目标检测做一个有机的结合?如果可以,既蹭了热点,又没脱离系统性。
到了大模型时代,大兵团作战本身就把这两个事情统一了——你做的就是热点,而且人多了,自然会形成系统性。每一个人参与进每个课题,课题之间就会产生关联。
李翔:本质上还是要往一个更 high level 的角度去思考。不能老陷在一个 local 的思想上——某个特征怎么连,某个模块怎么设计。要从整体的任务 setting 角度来考虑。
lllustration Generated by AI
-The End-
本周上新!
扫码观看!
“AI技术流”原创投稿计划
TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。社区上线700+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。
投稿内容
// 最新技术解读/系统性知识分享 //
// 前沿资讯解说/心得经历讲述 //
投稿须知
稿件需要为原创文章,并标明作者信息。
我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励
投稿方式
发送邮件到
yimingzhang@thejiangmen.com
或添加工作人员微信(aceyiming)投稿,沟通投稿详情
关于我“门”
将门是一家以专注于数智核心科技领域的新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。
将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。
如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:
bp@thejiangmen.com
点击右上角,把文章分享到朋友圈
热门跟贴