这段时间,许多科研人刷到论文打假新闻时,心情大概都很复杂。
一方面,看到顶刊论文、高校教授、知名团队被质疑,甚至被调查处理,会有一种学术圈地震了的感觉。另一方面,很多人也会忍不住想 ——
这些论文到底是怎么被看出问题的?为什么有些异常,发表前没有被作者、审稿人、编辑发现,反而是后来被一个博主,或者一群网友从补充材料里扒了出来?
这其实才是论文打假真正值得关注的地方。
01
打假潮来了,
顶刊光环不是论文的免检章
这轮打假潮的真正破圈,绕不开讲故事的耿同学。
2026 年 4 月上旬,科普博主「耿同学讲故事」发布视频,质疑同济大学生命科学与技术学院时任院长王某团队发表在《自然》上的论文存在数据异常。随后,同济大学成立调查组。
5 月 6 日,学校公布处理结果,认定相关论文存在学术不端行为,王某被免去学院院长职务、降低专业技术岗位等级,论文第一作者金某某被解除聘用关系。
图片来源:同济大学
这件事之所以引发如此大的震动,主要还是因为这样一项发表在顶级期刊、来自知名团队、被赋予很多学术光环的成果,居然存在严重的数据问题。
随后,耿同学又陆续质疑多位知名学者的论文存在问题。
例如,南开大学生命科学学院院长陈某、中山大学肿瘤防治中心副主任杰青康某某、中山大学生命科学学院副院长邝某某以及上海大学转化医学研究院院长苏某某。
目前南开大学、中山大学均已发布公告,多人被处理。(相关报道链接:)
图源:南开大学
耿同学最近一次的大动作是发布了一条标题叫做《给杰青们一个自查机会,拒不整改,再行举报!》的视频,表示自己还有 5 名杰青的造假素材,涉及同济大学、华东师范大学、湖南大学和中山大学。
图片来源:视频截图
大家或许会好奇,论文打假人是不是像侦探剧主角一样,一眼扫过论文,就会突然发现破绽,然后冷笑一声,「真相只有一个」。
现实没这么戏剧化。耿同学成为论文打假人也不是一日之功。
02
从科普博主到打假人,
耿同学都做了什么?
耿同学并不是一开始就以「学术打假人」的身份出现。
公开报道中,他的身份更像一个有生物学训练背景的科普博主:本硕学习生物学,博士阶段经历并不顺利,后来退学,转向做科普内容。
这个开局并不像爽文主角,更像很多科研人熟悉的现实支线 —— 热爱科研,但被现实磨得有点灰头土脸。
图片来源:网页截图
真正的转折,是他把专业背景、科普表达和论文打假结合到了一起。
论文打假最难的地方,不只是发现问题,而是把问题讲明白。很多科研人其实也见过奇怪论文,但常常停在一句「这数据不太对吧」。这句话在饭桌上有用,在公共讨论中没用。
真正有效的打假,需要把「感觉不对」变成「哪里不对、为什么不对、别人能不能复核」。
耿同学比较突出的地方就在这里:他把数据异常做成了普通人也能看懂的故事。
比如,真实的生物学实验数据通常有自然波动,不会整齐得像排队做广播体操。如果两列数据之间总是完美相差一个固定值,或者某一列数字的小数末位高度集中,就会让人警觉。
这类异常比单纯图片问题更难用「误用」解释。
图源:网络
过去很多论文打假集中在图片上,比如 Western blot 条带重复、显微照片重复、凝胶图镜像、局部复制粘贴。图片问题当然重要,但作者有时会解释为「排版失误」「图片误用」「上传错版本」。这些解释未必都成立,但至少存在「操作错误」的空间。
数据异常就不一样。数据如果呈现出真实实验中很难自然出现的规律,就像一群人假装随机排队,结果身高从左到右严格递增。你不能说这绝对不可能,但实在太像提前排练过。
这就是打假方法的升级:从「看图片像不像」变成「看数据合不合理」。
国外也有类似的科研侦探。
最有名的人之一是 Elisabeth Bik。她长期关注生物医学论文中的图片重复问题,尤其擅长识别 Western blot、显微图、凝胶图中的复制、旋转、镜像、裁剪和拼接。她和合作者曾人工筛查两万多篇生物医学论文,发现约 3.8% 的论文存在问题图片。
所以学术打假看起来不容易,实则也并不简单。
03 普通科研人如何识别可疑论文?
话说回来,不是每个人都要成为论文打假人,但每个科研人都应该学会如何识别可疑论文。
Nature曾总结过科研侦探识别可疑论文的一些经验,很多方法并不高深,普通研究者也可以上手。
第一,看参考文献。
比如,参考文献标题看起来很正规,但数据库里根本查不到;再或者引用了一堆和主题关系很远的文章,像是为了凑数硬塞进去现在还有一种新风险:AI 幻觉参考文献。看起来作者、标题、期刊、年份一应俱全,实际上一查,文章根本不存在
实用操作也很简单:不用查全部文献,挑最关键的三五个论断,点开引用核对。看原文是不是真的支持这个说法。
第二,看作者和单位。
跨单位合作很正常,跨国合作也很正常。但真实合作通常有逻辑:谁提供样本,谁做实验,谁做数据分析,谁负责临床资源,谁有相关领域积累。
如果一篇高度专业的实验论文,作者单位和研究内容几乎对不上;或者论文声称有复杂临床队列,但作者列表里看不出任何合理的数据来源;再或者作者贡献说明写得非常模糊,就要多留个心眼。
第三,看科学问题。
有些可疑论文不是因为结论太惊人,而是因为它太不懂行。
比如,研究对象、疾病类型、样本来源、生物学机制之间对不上;或者标题非常宏大,实验却完全支撑不了结论。不能说这种文章都不可靠,但如果没有清晰假说、没有独立验证、没有机制闭环,就要谨慎。
第四,看文字。
现在用 AI 润色论文很常见,这本身不一定有问题。但如果文章里出现明显的提示词残留、术语误译、句子逻辑断裂,就值得警惕。
第五,看图片。
生物医学论文里,图片是重灾区。Western blot、凝胶图、显微图、组织切片、流式图,都值得看一眼。
普通人可以先做肉眼检查:两张图是不是长得过于相似?背景纹理有没有重复?某个区域边缘是不是突然断掉?同一张图片有没有旋转、翻转、调亮之后再次出现?
第六,看数据。
真实数据通常不完美。实验会有噪音,样本会有差异,重复实验之间会波动。尤其在生物学、医学、生态学这类领域,自然变异本来就是研究对象的一部分。所以,当你看到一组数据特别整齐,反而要小心。
当然,学会打假,并不是为了互相伤害,而是为了读文献时不盲信,审稿时不放水,引用时多核查,发现问题时有证据、有边界、有流程。
科研不怕被检查。
真正可靠的数据,经得起质疑;真正扎实的论文,也不怕别人把补充材料打开看一遍。
题图来源:图虫创意
热门跟贴