图源:Unsplash / Lush Kooch
打开网易新闻 查看精彩图片
图源:Unsplash / Lush Kooch

撰文|张天祁

温州医科大学一名大四学生,最近引起了不小的关注。

他的 Google Scholar 个人主页显示,从 2024 年 7 月至今的一年多时间里,他已累计发表学术论文 48 篇。如果将时间进一步压缩到 2025 年,这一数字就显得更为集中。一年之内发表论文超过 40 篇,平均下来,几乎不到 10 天就有一篇新作上线。

初步梳理发现,其中仅有 4 篇未被 SCI 收录,其余 44 篇均被 SCI 期刊收录。这些论文并非主要集中在低分区期刊。按中科院期刊分区口径估算,约有 10 篇发表在一区期刊,20 篇左右发表于二区期刊。

需要说明的是,这 48 篇成果不全是研究论文,其中包含了致编辑的通信(letter)、综述性文章以及观点类短文。但即便不计这些文章,他的发表量和发表速率也足够惊人,特别是对本科生来说。

从作者结构看,这位学生本人多以第一作者身份出现,并兼任通讯作者。因为一作数量极多,外界有人怀疑他是靠家庭或者导师提携的学二代。但单看他的论文署名情况,“学界大佬”挂名通讯的情况并不多见,甚至连导师作为通讯作者署名的比例也并不高。实际上,论文的合作者更多来自同一所学校、和他年纪相仿的本科生。

在发表渠道上,这些论文多发表于开放获取(Open Access)期刊。这类期刊通常需要作者在论文接收后支付一定数额的版面费。相关费用从何而来尚不清楚,不过从学校现行制度来看,仅通过校内渠道,他就可能获得至少两类与论文直接相关的经费支持。

据温州医科大学官方通知,本专科学生在创新创业方面取得成果的学生、指导教师和学院予以奖励。奖励的成果包括学生为第一作者公开发表的论文(二级及以上)、学生为第一发明人获得的专利、学生参加各级“挑战杯”竞赛所获奖项等。

2021年公布的《温州医科大学大学生创新创业工作奖励办法》显示,温州医科大学大学生创新创业资金,每年投入预算500万元。本专科学生作为第一作者发表SCI、SSCI、A&HCI收录刊物奖励4000元。对学科竞赛获奖的学生集体,也有根据竞赛级别和获奖名次的奖励[1]。

在校内,各类科技创新项目几乎贯穿了这位学生的整个大学阶段。仅在院级公众号上,就能搜索到该同学申报2024年度温州医科大学本专科学生科研课题、年度大学生创新创业重点孵化团队。2024年浙江省大学生科技创新活动计划(新苗人才计划),以及2025年国家级大学生创新创业训练计划项目、2025年第十届全国大学生生命科学竞赛的记录。这些科技创新项目也有各自的资助。

这位学生发表论文的合作者,很多就是各个科技创新项目的小组成员。同一批项目中,多名学生都以不同方式参与论文产出,陆续获得了多篇论文署名,甚至共同第一作者。只是由于其个人发表数量更为集中,相关关注更多聚焦于他一人。

这些文章在研究对象上,涉及肿瘤、免疫、神经系统疾病、医学影像、药物和医疗器械评价等多个领域,但在具体做法上却高度接近。多数论文采用的是孟德尔随机化(Mendelian Randomization,MR)、组学、生物信息学筛选或网络毒理学方法,也有一部分直接基于 GBD 等公共数据库撰写流行病学研究。这些研究几乎都建立在现成数据之上,并不需要进入实验室开展实验。

这种方法上的集中,在论文标题中就能直接看出来。在他 Google Scholar 主页显示的 48 篇文章中,至少有 11 篇在标题中明确标注了“孟德尔随机化”。即便不计算那些未写入标题、但在正文中同样以孟德尔随机化作为主要分析工具的论文,相关方法在其研究中所占的比重也已经十分突出。

很多文章都是统计A成分与B疾病之间的关系。例如,围绕 PFAS(全氟和多氟烷基物质)与癌症的关系,他在不同时间点陆续发表了多篇论文。先是 PFAS 与肝癌,随后是 PFAS 与乳腺癌,又有将 PFAS 放入多种癌症框架中同时讨论的研究。同样的数据库,相似的分析逻辑,只需更换疾病的靶点数据,就能像拼积木一样拼凑出新的成果。

部分论文的内容还有复用的嫌疑。他在2025年初发表了一篇关于Busulfan导致无精症的机制论文,而在同年年末的全国大学生生命科学竞赛中,类似的内容又以《多组学整合揭示Busulfan诱导无精症的关键靶点与分子机制》为题出现。

很难判断这些论文是否有论文工厂的助力,但如果几位本科生已经能够搭建一条论文生产流水线,这或许并非孤立现象。与以往依赖家庭背景或导师支持的学术不端事件相比,它同样需要被认真对待。

01 AI时代,制造流水线论文只要两小时?

01 AI时代,制造流水线论文只要两小时?

类似温州医科大学这位学生,利用公共数据库和特定的方法,越过做实验的步骤大量快速发表论文,现在已经被视为一条论文发表捷径。

一个难以忽视的现象是,低质量、重复性论文的快速增长,在时间上几乎与AI生成能力的跃升同步发生。这种重合并不必然意味着因果关系,但已经足以引起警觉。

研究者们也注意到了这一点。来自英国萨里大学和澳大利亚昆士兰科技大学 的两位研究者,近期专门对 AI 工具与这类快速生产论文之间的关系展开了调查。研究者对 2021 年至 2025 年(截至 7 月底)已发表的相关研究进行了系统性梳理,试图回答:围绕同一套数据,学术界到底出现了多少“换题不换数据”的重复研究?

梳理对象聚焦于使用美国疾病控制与预防中心(CDC)国家健康与营养调查(NHANES)数据库的论文。在统计时,研究者将“重复”界定为这样一类研究:研究对象来自同一国家、同一人群,讨论的仍是相同的暴露因素与相同的健康后果,只是在题目、表述或分析方法上作出细微调整。

在对文献进行系统检索和匹配后,研究者共识别出 411 篇成对的重复“暴露—后果”论文。最常见的情形是:同一个暴露—后果组合,被发表成两篇论文,这一情况涉及 190 篇文章。某些主题的密集程度尤其高,例如“氧化平衡得分与慢性肾脏病之间的关联”,在一年之内就被发表了 6 次。

从时间维度看,这类重复发表几乎是一个近几年才迅速放大的现象。在 2023 年之前,围绕 NHANES 的重复论文仍然十分有限:2021 年仅 3 篇,2022 年为 12 篇。但到了 2024 年,这一数字骤然攀升至 198 篇,短短两年间增长了 17 倍。

更进一步,研究者们基于已发表的论文,使用大模型直接生产了三篇看似全新的稿件。求新文本在句法结构上必须与原文不同,以降低被剽窃检测工具识别的可能性。研究者坦言,LLM 并不能被指令生成完全无误的论文,但即便如此,每一篇论文从头到尾的生产时间,也仅仅只需要两个小时。

研究者随后将三篇由大语言模型生成的合成稿件提交至 iThenticate。三篇稿件在剔除参考文献后的总体相似度均低于 30%,且没有任何单一来源的相似度超过 5%。按照当前主流编辑流程的标准,这样的得分不会触发自动的预警。

当然,越过了第一道关卡,不意味着一篇论文就能够被接收。但是仅仅两个小时就能出产一篇通过自动检测的论文,如此之低的制造成本下,即便单篇论文的成功率并不高,只要不断重复提交,总会有一部分进入发表通道[2]。

这一问题在中国尤其严重。今年年初的一项研究显示,基于 NHANES 健康数据库垃圾论文数量的激增几乎完全集中在中国。2021至2024年间,全球共发表了316篇此类论文,其中有292篇的第一作者来自中国单位,占比超过92%。作者猜测,AI能够很方便的调用NHANES数据,是论文暴增的来源之一[3]。

类似的“数据挖掘论文”服务,在国内社交平台上并不难找到。在一些平台的广告中,造假的暗示已非常露骨。例如有平台写道:“因公共数据库的开放性,我们提供的统计服务可不断更换研究主题,挖掘数据,直至分析出发表级的统计分析结果。”

甚至在一些稍早的广告公众号文章里,温州医科大学这位同学发布的论文成了正面的宣传案例,“抓住一个研究目标,换个疾病就能复制粘贴出多篇文章”,这种方法适合“急需文章”的人群。公众号的目标也很明确,推销论文定制与“个性化”服务。

02 期刊开始收紧标准

02 期刊开始收紧标准

今年很多出版商已经对此做出了限制。Frontiers 将这种方式炮制的论文称为“快速生产的科学”(Fast-churn science),指出这类研究会“让期刊充斥着低质量、重复性的发现”。

2024 年年中,Frontiers 的编辑部注意到一个异常现象:基于孟德尔随机化的投稿量在短时间内激增。紧随其后,又出现了一波大量使用美国国家健康与营养检查调查(NHANES)公共数据集的论文。

佛罗里达大学教授 Arch G. Mainous III 指出。大型公共数据库中可调用的变量数量极其庞大,当可用变量足够多时,研究者只需不断调整变量组合,凭借纯粹的数据筛选制造出看似显著的相关性。

他直言,这些数据库本来是许多重要流行病学研究和疾病负担评估的基础工具,问题在于,一些研究并非从清晰的科学问题出发,而是反其道而行之.先在数据中寻找显著性,再为结果补写假设。

"由于可用变量太多,一些投机团体似乎只是构建一个庞大的变量矩阵,通过穷举相关性来寻找统计学显著结果。这些分析中缺失的,是具有明确结果的假设”。Mainous说。

Mainous 进一步指出,严肃的研究还必须考虑 NHANES 这类美国数据集所依赖的社会背景与制度条件,以及研究结论在其他国家和文化情境下是否成立的问题。但在大量涌现的稿件中,这些讨论往往被完全省略。

“不幸的是,这些在科学上存疑、但在统计学上显著的关系,恰恰可以被论文工厂用作待售稿件的基础。”Mainous 说。只要结果显著,论文被接收和发表的概率就会大幅提高。然而在进行足够多次统计比较的前提下,即便纯属偶然,也会有一些结果显示出统计学意义。结果是,大量质量可疑的稿件在短时间内涌入期刊系统,给编辑和审稿人带来了极大的压力。

2024 年 7 月,Frontiers 成为首批对这一问题作出明确回应的出版商之一。期刊宣布:所有基于健康数据集的孟德尔随机化研究,必须提供独立的外部验证。凡是仅依赖公共数据库、缺乏新增验证数据或机构数据支持的 MR 稿件,将在编辑初审阶段直接被拒。

政策实施后的第一个月,Frontiers 接收到的 MR 投稿量下降了 61%。今年年初,Frontiers 又进一步收紧了标准,明确要求所有“仅基于公共数据简单查询”的论文必须进行外部验证。在新政策实施后,Frontiers 已累计拒绝了 5,513 篇孟德尔随机化研究投稿(自 2024 年 7 月起),以及 1,382 篇基于 NHANES 数据的论文(自 2025 年 5 月起)[4]。

PLOS ONE也进行了类似的改革。PLOS ONE总编辑 Emily Chenette 表示,PLOS 旗下的期刊收到的投稿量激增,这些论文通常在特定人群(如 35 岁以下的女性)中寻找健康状况(如抑郁症)与潜在原因(如维生素 D 水平)之间的统计联系。研究人员推测,“论文工厂”可能正在大量产出此类论文,可能是通过AI进行助力,并向研究人员出售。

PLOS ONE更新了“评估使用公开健康和社会科学数据库进行研究的标准”。PLOS 旗下期刊的编辑将自动拒收基于这些数据集的论文,除非研究人员做了额外的后续工作(如实验)。Chenette 称,在新政策实施的第一个月,此类论文的退稿率已从 40% 上升至 94%[5]。

一些专门领域也有同样的现象。在药物安全领域,基于FDA 不良事件报告系统(FAERS)的数据,进行单一药物及其与特定不良事件关联的研究。2021 年,大约有 100 项。2024 年 ,这一数字达到了 600 项。

为了应对论文泛滥的情况,《药理学前沿》(Frontiers in Pharmacology)今年开始要求使用公共数据集的研究必须经过独立验证。 《药物安全专家意见》(Expert Opinion on Drug Safety )则在 7 月下旬决定完全停止接收使用 FAERS 数据库进行此类研究的稿件[6]。

参考文献:

  • [1] 温州医科大学大学生科研工作委员会办公室. (2023, October 30). 关于做好温州医科大学2022年度本专科学生创新创业成果报送工作的通知. 温州医科大学.
  • [2] Maupin, D., Suchak, T., Barnett, A., & Spick, M. (2025, September 12). Dramatic increases in redundant publications in the Generative AI era (Preprint). medRxiv.
  • [3] Suchak, T., Aliu, A. E., Harrison, C., Zwiggelaar, R., Geifman, N., & Spick, M. (2025). Explosion of formulaic research articles, including inappropriate study designs and false discoveries, based on the NHANES US national health database. PLOS Biology, 23(5), e3003152.
  • [4] Frontiers Communications Editor, F. C. (2025, September 15). Cutting through fast-churn science: How Frontiers raised the bar. Frontiers | Science news.
  • [5] O’Grady, C. (2025, October 8). Journals and publishers crack down on research from open health data sets. Science.
  • [6] Travis, K. (2025, September 16). Exclusive: Journal bans drug safety database papers as they flood the literature. Retraction Watch.