打开网易新闻 查看精彩图片

编辑|Panda

2018 年,斯坦福大学统计学家 John Ioannidis 和同事在 Nature 上抛出一个概念:「超级高产作者」(hyperprolific author)——指一年发表 72 篇以上论文的人,相当于平均每 5 天就要挂名一篇新论文

打开网易新闻 查看精彩图片

https://doi.org/10.1038/d41586-018-06185-8

他们从 Scopus 数据库里翻出了 9000 多个这样的名字,而这个群体的规模,从 2001 年到 2016 年扩大了 2.5 倍。当团队试着联系其中一部分人,请他们解释这份产出是怎么做到的,只有少数人能完整说清楚自己在每一篇论文里究竟贡献了什么。

五年后,Nature 记者 Gemma Conroy 在一篇后续报道里给出了更刺眼的数字:据 Ioannidis 团队 2023 年发布的一项新统计,一年发表 60 篇以上论文的「超高产」作者数量,比十年前多了整整四倍。她在文中直言,在一些学科里,现在已经能找到一年发表 50 篇、100 篇甚至更多论文的研究者!

打开网易新闻 查看精彩图片

https://www.nature.com/articles/d41586-023-03865-y

当然,需要指出,这不一定意味着造假,有时候只是大规模合作的产物。

七八年过去,「超级高产作者」这个曾经显得「离奇」的概念,正在 AI 和机器学习领域找到一个更极端的版本。当 ICML、NeurIPS 这些顶会的投稿量以每年翻倍的速度往上冲的时候,一个绕不开的追问是:这些论文到底是谁写出来的?答案的一部分,就藏在越来越庞大的「超级高产作者」群体里。

顶会里的「超级作者」

一项专门统计 AI 顶会发表趋势的研究《Publication Trends in Artificial Intelligence Conferences:The Rise of Super Prolific Authors》梳理了 2014 年到 2023 年间 NeurIPS、AAAI、ICML、ICLR、IJCAI、CVPR、ICCV、EMNLP、ACL、KDD、ACM CHI 这 11 个顶会累计发表的 87,137 篇论文,发现「多产作者」的数量正在逐年攀升:仅 2023 年的 NeurIPS 和 2024 年的 CVPR,就各自出现了超过 250 位在同一场会议里一年发表 5 篇以上论文的作者

打开网易新闻 查看精彩图片

arXiv:2412.07793

把标准再抬高一些,近年 CVPR 甚至出现过单个作者一年在同一场会议里挂名超过 20 篇论文的情况。

研究者还发现一个有意思的例外:在他们统计的所有顶会里,几乎每一场都允许单个作者一年发表 10 篇以上论文,唯独 IJCAI 是个反例。原因很简单,IJCAI 很早就设置了单作者投稿上限,把这条路直接堵死了。

这和 Ioannidis 团队十年前的发现有相似之处:当年 9,000 多名超级高产作者里,近 7,900 人集中在物理学,原因是高能物理的大型国际合作项目动辄有上千名成员挂名,严格意义上很难用「作者」的传统定义去衡量。

AI 领域的超级高产,同样有一部分能用类似的逻辑解释:大模型训练、大规模基准测试、跨机构的联合实验室,天然需要更多合作者共同署名

但另一部分驱动力,更接近美国路易斯安那州立大学教授、期刊主编 Steve Midway 最近在 Slate 撰文里提到的机制:当「发表数量」本身变成考核和晋升的硬指标,古德哈特定律就开始应验:一旦一个指标被当成目标,它就不再是个好指标。

打开网易新闻 查看精彩图片

https://slate.com/technology/2026/05/science-peer-review-journals-retractions.html

发一篇是好的,那么发两篇一定更好,发一百篇就成了「超人」。

顶会为什么纷纷给作者设「投稿上限」

超级高产作者的存在,和顶会投稿量的暴涨互为因果:一部分论文供给,恰恰来自那些一年参与十几篇甚至几十篇论文的高产作者和他们所在的大型实验室。

也因此,ICML、NeurIPS、AAAI、CVPR、ICCV、WSDM、KDD、ICDE 这些会议近几年不约而同地引入了「按作者设定投稿上限」的政策,上限区间大致在 7 到 25 篇之间,超出上限的论文通常按提交编号顺序直接淘汰。

这类政策本质上是在承认一个事实:光靠「自愿减产」约束不了超级高产作者,只能靠规则强行截断。

投稿端的压力最终会传导到审稿端。

以 ICML 为例,2026 年主赛道收到 23,918 份有效投稿,创下历史新高,比 2025 年的 12,107 份几乎翻倍,录用 6,352 篇,录用率 26.56%。NeurIPS 2025 年主赛道收到 21,575 份投稿,较上一年增长约六成,动员了 20,518 名审稿人才勉强消化;AAAI-26 主赛道收到近 2.9 万份投稿,涉及超过 7.5 万名独立作者,最终招募了超过 2.8 万名程序委员会及领域主席成员。

打开网易新闻 查看精彩图片

ICML 会议论文投稿与接收情况数据统计,今年的投稿数量相比去年几乎翻倍,https://openaccept.org/c/ai/icml/

审稿人越来越难招到、每个人分到的论文越来越多时,一部分人开始转向 AI 工具「代劳」。今年 3 月,ICML 就披露有 497 篇论文因其互惠审稿人违反 LLM 使用政策(承诺不用 LLM 却被水印检测技术抓包)而被连带撤稿。这起风波与其说是个案,不如说是超级高产作者制造的投稿洪流,最终反噬到审稿质量本身的一个缩影。

打开网易新闻 查看精彩图片

https://blog.icml.cc/2026/03/18/on-violations-of-llm-review-policies/

当然,也有一些机构在做更积极的尝试,参阅《一天审完两万篇!AAAI 2026 首次实装 AI 审稿,单篇成本不到 1 美元》。

从会议到期刊:超级作者的另一个主场

顶会只是这场「产出竞赛」的一个赛场,期刊端的情况同样值得关注,而且规则更宽松。

Midway 在文章里提到,五大科学出版商旗下拥有约 5 万种期刊,持续需要新稿件填充内容;开放获取模式(作者付费即可发表)进一步降低了门槛:MDPI 从 2000 年的 14 种期刊扩张到如今的 487 种,Frontiers Media 从 2007 年成立至今也扩展到超过 220 种。

期刊数量的爆炸式增长,给超级高产作者提供了几乎无限的「出货渠道」:只要写得出来(外加一点成本),总有期刊愿意收。

这套体系的隐患,在计算机科学与工程领域表现得尤其明显。

一项针对全球论文撤稿趋势的研究显示,电子工程与计算机科学(EE & Comp Sci)领域的撤稿率达到每万篇论文 31.97 篇,是物理学撤稿率的十倍,是撤稿问题最突出的学科之一。

打开网易新闻 查看精彩图片

arXiv:2511.21176v1

同一研究还统计到,过去两年里有 2,100 起撤稿被明确认定涉及 AI 生成内容(撤稿理由包括「不通顺的表达」「非常规措辞」「由大语言模型生成」等),另有 2,300 起涉及论文工厂(paper mill)——这类商业机构专门为有发表压力的科研人员批量代写论文,近年更是开始借助生成式 AI 自动撰写引言和讨论部分、生成可发表的图表,把整套流程进一步产业化、规模化。

Retraction Watch 联合创始人 Ivan Oransky 对此的判断相当悲观:在他看来,单靠 AI 审查工具去堵这个漏洞,类似「在泰坦尼克号上摆整齐甲板椅」。真正的解法是从根子上减少需要同行评审的论文数量,而不是指望技术修补一个已经严重超载的系统。

不止 AI:一个更古老问题的加速版

需要说明的是,「超级高产作者」并不是 AI 领域独有的新鲜事。

Ioannidis 团队最初发现的 9,000 多名超级高产作者里,近一半来自医学与生命科学领域,原因之一是流行病学等学科习惯把一个大型数据集拆成许多篇论文陆续发表,作者也因此不断累积署名。

也就是说,这是一个在学术评价体系里存在已久的结构性问题,AI 只是让它变得更容易实现、也更难分辨:生成式 AI 既能帮真正的研究者提速,也能帮论文工厂批量生产看起来「像模像样」的稿件,而审稿人往往很难在有限的时间里分辨两者。

也因此 Midway 会说,AI 救不了同行评审:它让审稿快了一点,却让投稿快了不知多少倍。

结语

超级高产作者的出现,本质上是「发表或灭亡」这套激励机制运行到极致的产物,而 AI 既是加速器,也让这个产物变得空前庞大和难以甄别。顶会设置的投稿上限、水印执法、AI 辅助初评,期刊端的论文工厂筛查工具,都是在同一个前提不变的情况下打的补丁:评审依然是无偿的志愿劳动,而论文产出的激励一直在加码。

Midway 给出的药方很朴素:正视同行评审的劳动价值,让机构在招聘晋升中为审稿记功,让出版商为这份劳动真正付费。对此,Midway 引用了一篇 2021 年的研究,给出过一个具体的数字:同行评审的劳动力价值在美国已经高达 15 亿美元,在中国也超过 6 亿美元——现在自然还会高得多。

打开网易新闻 查看精彩图片

https://pubmed.ncbi.nlm.nih.gov/34776003/

但只要「发得越多越好」的评价逻辑不变,超级高产作者就会持续涌现,审稿系统也就只能在一次次扩容和打补丁中,继续绷着那根越来越紧的弦。