2024年某个下午,哥伦比亚大学护理学副教授马克西姆·托帕兹收到一封邮件。他即将发表的论文被期刊编辑拦下:参考文献里混进了虚构的出处。托帕兹是研究AI辅助医疗决策的专家,自己写论文也用AI工具校对。这件事让他脊背发凉——"连我这种懂AI幻觉的人都会翻车,普通人怎么办?"
他和团队做了一项大规模审计。他们扫描了PubMed Central数据库里2023年1月到2026年2月发表的约250万篇生物医学论文,用自动化系统核查了大约9700万条引用。结果发现,2810篇论文里藏着4046条"幽灵引用"。这些参考文献格式规范、看似真实,查无出处。
数量曲线令人警觉。2023年,每2828篇论文才出现1条虚假引用;2024年AI工具普及后数字开始跳涨;2025年变成每458篇就有1条;2026年头7周,频率冲到每277篇1条。三年间增速超过12倍。托帕兹说:"这只是冰山一角。"
医学研究的可怕之处在于链条效应。临床试验引用前人成果,系统综述整合多个试验,临床指南又依据这些综述制定。托帕兹解释:"你把虚构研究塞进这个链条最底层,整个结构都会继承它。"他的团队发现一篇论文30条引用里18条是假的,其中一些已经被其他论文引用,甚至进入了系统综述和护理指南。
好消息是,大部分问题论文只含1到2条虚假引用,暗示这并非故意造假,而是作者没仔细核对AI输出。坏消息是,学术出版界毫无准备——98.4%的问题论文至今未被撤回。
研究团队向出版社提出三项建议:主动核查参考文献、索引服务添加准确性元数据、伦理数据库建立虚假引用追踪机制。但漏洞不止在学术界。调查显示法律界大量使用AI辅助调研,而"AI编造判例"混入法庭文件的事件已多次曝光。2026年,美国作家斯蒂芬·罗森鲍姆的新书《The Future of Truth》因含大量AI生成的不当引用引发争议,他本人承认用AI写作导致错误,但表示会继续使用。
连2018年诺贝尔文学奖得主奥尔加·托卡尔丘克也公开承认用AI辅助写作调研,遭到强烈批评。2026年英联邦短篇小说奖的5部获奖作品中,3部被指"很可能由生成式AI写成"。当AI幻觉从聊天窗口渗透进论文脚注、法庭卷宗和文学奖项,核查机制的速度明显追不上扩散的速度。
热门跟贴