Nat. Mach. Intell.速递：AI 提高维基百科的可验证性

集智俱乐部

2023-10-26 16:52 ·北京

关键词：人工智能，语言模型，引文网络

论文题目： Improving Wikipedia verifiability with AI 期刊名称：Nature Machine Intelligence 斑图地址：https://pattern.swarma.org/paper/72b473fa-6ed4-11ee-8337-0242ac17000d 论文地址：https://www.nature.com/articles/s42256-023-00726-1

维基百科的核心内容政策是可验证性：观点需要得到引用的支持。维护和提高维基百科参考文献的质量是一个重要挑战，需要更好的工具来帮助人类进行这项工作。这项研究展示了利用人工智能（AI）和信息检索系统以及语言模型，可以改进引文过程。

研究中将这个基于神经网络的系统称为SIDE，它可以识别不太可能支持其声明的维基百科引用，并随后从网络中推荐更好的引用。作者们在现有的维基百科参考文献上训练该模型，也就是从数千个维基百科编辑的贡献和集体智慧中学习。

通过众包，研究者观察到，对于最有可能被系统标记为不可验证的前10%引用，人们70%的时间更喜欢该系统推荐的替代方案而不是原先引用的参考文献。为了验证该系统的适用性，研究者建立了一个演示版本，与英语维基百科社区互动，并发现对于同样前10%最有可能不可验证的声明，SIDE的第一个引用推荐的受欢迎度是现有维基百科引用的两倍。这些结果表明，可以使用基于AI的系统与人类协同工作，以提高维基百科的可验证性。