当诺奖得主被爆出涉嫌学术不端,他选择了撤稿。但研究人员不得不面临一个难题:论文图片“美化”,边界在哪?

撰文 | 小叶

近几个月,格列格·赛门扎(Gregg Semenza)——这位2019年诺贝尔生理学或医学奖得主麻烦不小。2022年9月2日,《美国国家科学院院刊》(PNAS)同时刊登了4篇撤稿声明,均是赛门扎作为通讯作者的细胞生物学论文,原始论文两篇发表于2013年[1, 2]、其他两篇分别于2009年[3]和2014年发表[4]。在声明中,包括通讯作者在内的所有人承认可能存在图片/数据复制问题,以及图片拼接,但同时坚称所有结果真实可信,鉴于图片问题引发的不便,最终决定主动撤稿。而其中两篇后经验证性实验更新了图片[5, 6],另一篇则修正了图片错误[7],最终更新版本全部发表在预印本网站bioRxiv上。

这四篇文章都与赛门扎的诺奖成果——缺氧诱导因子相关,旨在探讨包括癌症在内相关疾病的机制和治疗方案。根据PNAS的原始论文页面统计数据,四篇文章引用次数总共超过750次。迄今为止,赛门扎个人并未公开发表任何回应。

格列格·赛门扎(Gregg Semenza,1956-)图片来源:Nobel Media. Photo: A. Mahmoud

撤稿论文图片重复使用

生物医学领域曝出学术不端问题司空见惯,而近年来,图片诚信(image integrity)问题尤为突出。一方面,随着技术手段的更新,各种修图软件推陈出新,研究人员修图更加得心应手。当然,完全合规的修图行为能更清晰地呈现研究结果,例如提高图片对比度或者色彩平衡,同时还方便作者修改图片编辑错误。但不可否认,修图工具也是造假的“一把好手”:复制粘贴可轻松实现一图多用,photoshop修图大法(习惯称作P图)更是最为诟病的造假套路。生物医学界依赖的蛋白免疫印迹(Western Blot)图像技术更是被“造假”阴霾团团笼罩。因此,面对愈发严重的图片造假趋势,无论有心还是无意,学术期刊对科研论文的图片审核愈发严格,而且知名学术打假网站PeerPub上科研人员彼此严格监督,一旦发现可疑图片,立刻打假揭发,希望不放过任何可能的造假行为。

此次赛门扎四篇撤稿论文涉及的图片问题便是一个典型案例。2014年发表的论文Hypoxia-inducible factors are required for chemotherapy resistance of breast cancer stem cells,作者指出原文图3E和图5F(图1)、图6C与图8A可能存在重复数据(图2)。如果仔细观察图片,几乎可以认定两处各自使用的是同一张图片进行拼接,而它们分别表示不同的研究对象。

图1 两张不同的图注6C和8A,黄框所示图片几乎一模一样,而对应的确是不同的实验对象,来源:PubPeer.com

图2 红方框与蓝方框标出的区域图片复制、拼贴明显,来源:PubPeer.com

2009年发表的Anthracycline chemotherapy inhibits HIF-1 transcriptional activity and tumor-induced mobilization of circulating angiogenic cells论文中,PubPeer评论人认为原文图2中VEGF启动子在20%O2和1%O2下相似度过高,特别是经过水平翻转后(见下图3),也有人认为干脆就是镜像的。

图3 在PubPeer的打假贴上,面对这张图注,有研究人员质疑水平翻转之后相似度未免太高了些 来源:PubPeer.com

另外于2013年发表的两篇Mutual antagonism between hypoxia-inducible factors 1α and 2α regulates oxygen sensing and cardio-respiratory homeostasis(4月)和Hypoxia-inducible factors mediate coordinated RhoA-ROCK1 expression and signaling in breast cancer cells(9月)同样也是一图多用的问题。9月发表的这篇最为严重,作者在撤稿声明中明确指出的问题图片高达10张,例如,图1D一张内3处数据存在重复问题;图1D和图3B,多处数据“撞图”等等。

2013年9月发表的论文中,不同颜色方框标出之处分别标出两张不同图注中过于密集的相似点。来源:PubPeer.com

对于上述种种质疑,作者的四篇撤稿声明都一一回应,格式统一整齐:首先承认“可能存在图片/数据重复、图片错误”并表示歉意,随后反复强调不会影响研究结论的真实可靠性,但“鉴于争议造成的不便,决定主动撤稿”。至于为什么会复制数据、是否存在主观误导等具体问题,作者并没有给出正面回应和解释。

并非初犯

2022年9月的PNAS撤稿事件并非首次让赛门扎与图片造假联系起来。事实上,第一篇质疑赛门扎论文图片问题的帖子最早于2015年出现在PubPeer上,不过当时并未引起任何关注。问题真正大规模暴发要从2020年9月开始,也就是赛门扎获得诺奖一年之后,用户名为Clair Francis的学术打假人在一个多月的时间内,一口气揭发了40多篇存在图片问题的论文,事件跨度从2001年至2018年。

除了例如上述显示的一文重复用图问题外,赛门扎的论文还涉及一图多文重复使用,即相同图片在不同文章中重复使用。第一篇撤稿原文2011年发表于《生物医学期刊》(Biomedical Journal)[10],经期刊重审,编辑发现作者将其他已发表的论文图片直接搬运到这篇论文中。2022年3月,《癌症研究》(Cancer Research)更正了一篇论文,并针对另一篇发表关注声明,因为在重新调查的过程中,编辑发现论文中对于不同实验,作者不仅无意中提供了相同的实验数据结果,而且还用上了更早时候发表的论文图片。

还有少数文章可能涉及伦理问题。据统计,争议论文中,涉及“乳腺癌”、“冠状动脉异常”、“高血压”、“红细胞增多症”等疾病的论文超过一半。截至今日,在PubPeer上输入格列格·赛门扎的姓名作为搜索词,总共可以看到55篇打假帖子。[11]

根据《自然》(Nature)报道,从2011年起,赛门扎作为合作作者,已经有17篇论文明确撤稿或修正、或期刊发表关切声明,而其中5篇撤稿论文的理由恰恰就是“图片操纵”(image manipulation)[12]。目前还有约15篇论文正在接受期刊重审,其中包括发表在《自然·遗传学》(Nature Genetics)期刊的一篇文章,以及斯普林格·自然旗下《癌症基因》(Onceogene)的另一篇。《科学·信号传导》(Science Signalling)则在调查两篇论文,就已经完成的一篇论文审查很快会发布一篇勘误声明。

而另一本期刊《生理学期刊》(Journal of Physiology)表示,先前已经重新审查过两篇相关论文,不过面对近期的撤稿事件,正在考虑是否更改先前的立场。期刊发言人表示在第一次调查之后期刊并未采取任何行动,因为他们无法获得原始数据,而且“发表在期刊上的论文图片清晰度实再太差了。”

知名的科研图片打假先锋人物伊丽莎白·比克(Elisabeth Bik)也参与了赛门扎合作论文的图片打假队伍。她表示,一个成功实验室20多年来出现这些数量的修正论文看似也合情合理,但“竟然有5篇论文都因为图片造假而撤稿,这确实让人大跌眼镜。”不免让大家担忧实验室是否不再秉持严谨负责人的科研态度,而是草率处理实验数据,大笔一挥做出漂亮图片好尽快发表。

而9月的事件更是将赛门扎送上了涉嫌学术不端的风口浪尖,他所供职的约翰·霍普金斯大学通过发言人表示,学校“始终秉持针对科研准确性和科研诚信的高标准、严要求”,并会认真应对任何科研不端行为的控诉,“学院拥有严格的方案和程序来审查任何相关指控”。但是拒绝透露这一审查过程的具体细节,也不愿评论针对赛门扎以及团队的具体指控。

图片造假与论文撤稿

近年来图片造假问题引发了各大期刊的重视。虽然每家期刊很早就发表过投稿论文图片准则,但判断图片问题究竟是属于处理不当,还是故意造假,一直没有非常明确的程度判断标准。直到2021年,几家国际大型学术期刊联合起来[8](包括爱思唯尔、威立、斯普格林·自然等),共同制定出科研论文图片问题相关的分级标准,以及作者的回应和编辑的应对措施。同年9月在《开放科学框架》(OpenScienceFramework)预印本网站上公布了第一版草案[9],并及时更新,旨在尽快成为学界公认的标准,其中将图片不当处理问题由轻到重分为三个等级:

第一等级,指图片存在不当处理问题,但情节较轻。例如图片部分复制、或者不同实验数据合并等,并不会改变研究结果或造成误导。一经发现,只要作者能够及时提供源数据,并给出合理满意的解释,无论发表前后,编辑都可进行更正、勘误。

第二等级则相对严重,指图片数据存在明显的“美化”痕迹,或者未声明的图片/数据操纵,从而破坏数据的客观呈现和完整性,违背公认的学术实践规范,并可能会改变关键数据以及推导出的结论。在未经进一步调查之前不排除刻意误导之嫌。此时,通讯作者不仅需要提供真实的源数据以及合理满意的解释,还要做好可能撤稿的心理准备。

而第三等级已属于严重的学术不端行为:篡改图片或者图片造假,主观上有误导意图,而且图片数量不限于一张,具体则包括在真实的图片基础上进行人为修改、剪切、拼接内容等而未予明显标示,破坏了原始数据的完整性等。一经发现,如果作者无法给出合理解释或者源数据,对于尚未发表的文章,编辑可直接拒稿。若文章已经发表,期刊应该直接予以撤稿作为惩戒。

对于这一新出的标准和措施,图片诚信专家认为:“虽然无法彻底杜绝图片造假问题,但仍然提供了更严格的审查标准,用于规范投稿阶段以及发表之后的科研行为。”[8]

根据标准等级,赛门扎的四篇撤稿论文显然已经在第二等级和第三等级之间“摇摆”,既然作者无法解释清楚图片复制的具体原因,那么主动撤稿只能是唯一“体面”的结果。

通讯作者责任重大

在赛门扎合计32篇被重新审查的论文中, 他本人为通讯作者或共同通讯作者有14篇。显然,这些论文还涉及多位知名学者。现在还不清楚谁对哪些文章中的任何错误或者图片问题具体负责,不可置否的是,无论责任在谁,通讯作者作为重要的把关人,必需要保证论文整体的真实可靠性。

关注学术诚信的记者列奥尼德·施耐德(Leonid Schneider)曾于2020年在For Better Science网站上发表博文指出,受到质疑的文章当中有许多作者重合,暗示他们之中可能有不负责任的学生或合作者,但“赛门扎作为许多文章的末位作者或通讯作者,表明他负有最终责任。”[13]

两年前,国内也关注过赛门扎涉嫌图片造假行为的新闻。国内低氧领域研究学者在接受《中国科学报》采访时提出两个令人担忧的情况,“目前被人质疑的多数是一些向下游转化的研究。”[14]一方面他肯定了赛门扎的诺奖工作非常扎实,经过了时间的检验;但同时也暗示后续的研究有急功近利之嫌,未尽到通讯作者之责。诺奖得主尚且如此,那么学术不端的情况可能更加普遍。

况且,通讯作者不仅对论文负责,更应该对团队中的每一人负责,学术不端的后果事实上由整个课题组承担。对于像赛门扎这样的顶尖科学家而言,仅仅撤稿可能不会对他本人产生很大影响,但在同一课题组内,还有一些资历尚浅、甚至不知情的年轻研究人员,他们会面临怎样的处境呢?[15, 16](参见《导师学术不端,学生履历会有污点吗?》)

他们可能不会因涉嫌学术不端而被推上舆论的风口浪尖,但浪潮之下的他们也跟着遭殃。以美国为例,根据美国诚信研究办公室(Office of Research Integrity,简称 ORI)的统计,每年 ORI 针对学术不端平均有30 多起调查,在每个给定的年份,都可能有几十名年轻研究人员发现自己的研究项目陷入危机,或者在实验室关闭后不得不匆忙寻找新职位。

他们最大的损失可能是自己辛苦一年甚至多年的研究结果突然之间全部付诸东流,同时要背负学术不端的名誉损失。之后在寻找新职位的过程中,他们之前的诸多努力、个人科研能力可能无法展示,履历中出现尴尬却又难以启齿的“空白期”。即便能够解释当时情况,但要证明自己,与新团队建立信任关系,“学术不端”仍是最大障碍。

另一方面,心理层面受到的影响是最直接的,不仅让年轻科研人员对个人学术名声和职业前途焦虑,更容易对学术合作甚至整个科学界产生信任危机,这种巨大的心理创伤可能因此让他们彻底放弃学术事业。当然,也有一些内心强大的学者,他们会因为这段经历重新审视科学研究,以更严谨的态度进行工作,这是人们希望见到的结果。

总而言之,科学求真求实,包括图片造假在内的不端行为要绝对抵制。不完美的图片并不可怕,可怕的是不加约束的造假行为,给科研人员刷上难以洗去的污点,让科学丧失真实、诚信,贻害无穷。

参考资料

https://www.pnas.org/doi/full/10.1073/pnas.2213288119

https://www.pnas.org/doi/full/10.1073/pnas.2213287119

https://www.pnas.org/doi/full/10.1073/pnas.2213285119

https://www.pnas.org/doi/full/10.1073/pnas.2213289119

https://www.biorxiv.org/content/10.1101/2022.07.11.499380v1

https://www.biorxiv.org/content/10.1101/2022.06.15.492526v1

https://www.biorxiv.org/content/10.1101/2022.06.27.497729v1

https://www.nature.com/articles/d41586-021-02610-7

https://osf.io/kgyc6

https://portlandpress.com/biochemj/article/434/3/571/80024/Activation-of-hypoxia-inducible-factor-1-in-human

https://www.pubpeer.com/search?q=gregg+semenza

https://www.nature.com/articles/d41586-022-03032-9

出品:科普中国