打开网易新闻 查看精彩图片
研究现状:据CNET于2026年5月20日报道,康奈尔大学和加州大学洛杉矶分校的相关研究人员发布了一项新研究,揭示了人工智能(AI)生成内容对科学出版界的严重污染。研究团队在分析2.5亿篇科学论文的1.11亿条参考文献时,在四大主要研究数据库中发现了高达146,900条由AI生成的虚假引用。
问题根源:大型语言模型(如ChatGPT和Gemini)存在产生“幻觉”的固有缺陷,往往会生成听起来合理但完全错误的信息。如果科研人员在撰写论文时依赖聊天机器人生成引用且不加核实,就会导致完全捏造的参考文献出现在学术记录中。研究发现,这种虚假引用并非集中在少数论文中,而是广泛分布在大量文章里,表明许多研究人员未经验证就使用了AI生成的参考资料。
学界担忧:虚假引用的泛滥正在侵蚀学术信任的基础。威奇托州立大学管理学教授乌莎·哈利指出,虚假或AI生成的引用破坏了作为同行评审和累积知识基础的学术记录可信度。令人不安的是,这种怀疑情绪正来自学术界内部和早期职业学者。这些虚假引用被发现的四大数据库为arXiv、bioRxiv、SSRN和PubMed Central,这些科学存储库在全球研究领域发挥着关键作用。
应对措施:面对AI劣质内容对科学体系的冲击,相关机构已开始采取行动。arXiv于2026年5月19日(周二)宣布,将对提交包含幻觉引用或未经仔细检查的AI内容论文的作者实施封禁。arXiv科学总监施泰因·西古德森表示,科学文献库正在被稀释,大量AI内容要么是主动错误,要么毫无意义,这不仅让寻找真实科研成果变得更困难,还可能误导研究人员。
参考链接:
https://www.cnet.com/science/ai-making-up-citations-scientific-papers/
热门跟贴