AI幻觉正在污染医学文献：每277篇论文就有1篇藏假引用|医学|学术|引用率|文献|柳叶刀|论文

Maxim Topaz删掉了自己写好的论文。

这位哥伦比亚大学护理学院的副教授，长期用AI工具润色论文的语法和格式。但几周前，期刊编辑的一封邮件让他停下了手边所有工作——AI在他不知情的情况下，悄悄塞进了一条根本不存在的参考文献。

"我深感尴尬。"Topaz对《财富》杂志说。他领导的团队正在开发医疗AI应用，"我是AI研究者，我知道幻觉是什么。如果连我都会中招，普通人呢？"

这场虚惊促使他展开了一项大规模调查。本月早些时候，他和同事在《柳叶刀》发表的研究揭示了一个令人不安的趋势：他们对PubMed Central收录的近250万篇生物医学论文、9700万条引用进行了审计，发现超过4000条伪造引用散布在近3000篇论文中。

虽然并非所有假引用都来自AI，但Topaz注意到一个关键时间节点——2024年，AI工具在研究领域的普及率飙升后，伪造引用的增长曲线几乎垂直上扬。"现在AI与这些假引用高度相关，这是非常合理的推断。"

数字触目惊心。过去三年，生物医学文献中的伪造引用率增长了12倍以上。2023年，每2828篇论文中有1篇包含假引用；到2025年，这一比例升至每458篇就有1篇；而2026年头七周的数据更糟——每277篇论文中就有1篇藏着不存在的参考文献。

"这只是冰山一角。"Topaz说。

幻觉的本质是AI模型优先匹配语言模式而非事实准确性。日常闲聊中，这往往无害。但当错误渗透进学术文献，后果便截然不同——医学是一个层层递进的领域：临床试验引用早期研究，系统综述整合这些试验，临床指南再引用综述，最终医生和护士依据指南治病救人。一条虚构的研究一旦被植入这个链条的底层，便会逐级向上污染。

"这就是证据链，是我们治病救人的方式。如果你在底部放一篇虚构研究，整个结构都会继承它。"Topaz解释道，"我们已经看到论文工厂的文章被纳入指导临床指南的系统综述。当指南论文引用了部分参考文献为虚构的论文时，治疗决策的证据链就被破坏了。"

AI的失误不分对象。幻觉问题早已为人所知，但Topaz的研究首次量化了它对专业领域的侵蚀程度。更令人担忧的是，这些伪造引用正在进入人类知识的永久档案——PubMed Central是全球临床医生和研究者使用的中央知识库，这里的错误不会被自动修正，只会被不断引用、复制、传播。

对于每天依赖文献做决策的医疗从业者，这意味着什么？Topaz没有给出简单答案。但他的研究提出了一个紧迫的问题：当AI成为学术写作的标配工具，谁来守护知识基础设施的完整性？

AI幻觉正在污染医学文献：每277篇论文就有1篇藏假引用