Maxim Topaz删掉了自己写好的论文。

这位哥伦比亚大学护理学院的副教授,长期用AI工具润色论文的语法和格式。但几周前,期刊编辑的一封邮件让他停下了手边所有工作——AI在他不知情的情况下,悄悄塞进了一条根本不存在的参考文献。

打开网易新闻 查看精彩图片

"我深感尴尬。"Topaz对《财富》杂志说。他领导的团队正在开发医疗AI应用,"我是AI研究者,我知道幻觉是什么。如果连我都会中招,普通人呢?"

这场虚惊促使他展开了一项大规模调查。本月早些时候,他和同事在《柳叶刀》发表的研究揭示了一个令人不安的趋势:他们对PubMed Central收录的近250万篇生物医学论文、9700万条引用进行了审计,发现超过4000条伪造引用散布在近3000篇论文中。

虽然并非所有假引用都来自AI,但Topaz注意到一个关键时间节点——2024年,AI工具在研究领域的普及率飙升后,伪造引用的增长曲线几乎垂直上扬。"现在AI与这些假引用高度相关,这是非常合理的推断。"

数字触目惊心。过去三年,生物医学文献中的伪造引用率增长了12倍以上。2023年,每2828篇论文中有1篇包含假引用;到2025年,这一比例升至每458篇就有1篇;而2026年头七周的数据更糟——每277篇论文中就有1篇藏着不存在的参考文献。

"这只是冰山一角。"Topaz说。

幻觉的本质是AI模型优先匹配语言模式而非事实准确性。日常闲聊中,这往往无害。但当错误渗透进学术文献,后果便截然不同——医学是一个层层递进的领域:临床试验引用早期研究,系统综述整合这些试验,临床指南再引用综述,最终医生和护士依据指南治病救人。一条虚构的研究一旦被植入这个链条的底层,便会逐级向上污染。

"这就是证据链,是我们治病救人的方式。如果你在底部放一篇虚构研究,整个结构都会继承它。"Topaz解释道,"我们已经看到论文工厂的文章被纳入指导临床指南的系统综述。当指南论文引用了部分参考文献为虚构的论文时,治疗决策的证据链就被破坏了。"

AI的失误不分对象。幻觉问题早已为人所知,但Topaz的研究首次量化了它对专业领域的侵蚀程度。更令人担忧的是,这些伪造引用正在进入人类知识的永久档案——PubMed Central是全球临床医生和研究者使用的中央知识库,这里的错误不会被自动修正,只会被不断引用、复制、传播。

对于每天依赖文献做决策的医疗从业者,这意味着什么?Topaz没有给出简单答案。但他的研究提出了一个紧迫的问题:当AI成为学术写作的标配工具,谁来守护知识基础设施的完整性?