工作初衷:为疫情防治贡献一份力 由于担心关于COVID-19的研究论文可能存在过多的草率工作, 纽约雪城大学信息研究学院的助理教授Daniel Acuna 开 发了一个能够 对论文 中的图像进行 查重的程序, 据 悉,现在 这项程序已被应用在 全球的新冠病毒相关论文的预印本上。
2
查重结果存有争议 到目前为止,这项工作取得了一定程度的成功,但也引起了一些争议。 今年6月,Daniel Acuna从bioRxiv和medRxiv服务器上下载了3500个预印本,用他的软件查重了21,000张图像。在4小时内,该软件就查出了大约400张可能重复的图像。不过大多数结果都没有问题,他选择了24篇包含可疑重复图像的论文。 7月,他在自己的网站上发布了这些内容,并在PubPeer上公开。 这件事随后引起了轰动。一些论文作者回应说,Daniel Acuna的软件确实查出了重复的图像,他们将纠正错误,不过也有一些错误已经在同行评审版本中得到纠正。 芬兰赫尔辛基大学的病毒学家Giuseppe Ballistreri 对于这项技术,也持肯定态度,他表示,“如果该工具被证明是准确的,则应默认在PubMed中应用。”PubMed 是一个免费的搜索引擎,提供生物医学方面的论文搜索以及摘要。 另一方面,也有其他人指出,这些重复不是错误。Elisabeth BikBik以其在科学出版物中检测照片操纵的工作而闻名,她表示,希望Daniel Acuna首先向她咨询匹配结果。她进一步在PubPeer写道,该软件“ 仍然需要人工监督,以确保它不会错误地将适当的重复图像标记为不适当”。
3
再接再厉 除了技术上的不完美性,Daniel Acuna本人还指出了影响软件的准确性的一个外在因素:PDF文件格式会破坏自动提取图像的能力。例如,今年5月,Elisabeth Bik在推特上叙述了关于Nature的一篇COVID-19 论文的图像复制问题,该图像也出现在2月份的预印本中,但Daniel Acuna的软件由于论文是PDF格式而没有检查到。 目前为止,关于新冠病毒的研究产生了无数的论文,许多研究人员担心出现低质量的研究和错误,甚至欺诈。有科学家发出警告:“质量低劣的研究将泛滥成灾”。 接下来,Daniel Acuna 打算继续进行论文重复图像的自动检查,而之后首先要做的事情,就是将查重结果告知作者,只有在他们不回应的情况下才公开结果。 对于学术界低质论文泛滥成灾的现象,Daniel Acuna也发出了告诫: “ 我 希望那些正在动歪脑筋的论文作者们意识到,有人正在对论文图像进行查重。 ” 参考内容: https://www.nature.com/articles/d41586-020-02161-3
雷锋网雷锋网雷锋网
热门跟贴