打开网易新闻 查看精彩图片


关键词:人工智能,语言模型,引文网络

打开网易新闻 查看精彩图片

论 文题目: Improving Wikipedia verifiability with AI 期刊名称:Nature Machine Intelligence 斑图地址:https://pattern.swarma.org/paper/72b473fa-6ed4-11ee-8337-0242ac17000d 论文地址:https://www.nature.com/articles/s42256-023-00726-1

维基百科的核心内容政策是可验证性:观点需要得到引用的支持。维护和提高维基百科参考文献的质量是一个重要挑战,需要更好的工具来帮助人类进行这项工作。这项研究展示了利用人工智能(AI)和信息检索系统以及语言模型,可以改进引文过程。

研究中将这个基于神经网络的系统称为SIDE,它可以识别不太可能支持其声明的维基百科引用,并随后从网络中推荐更好的引用。作者们在现有的维基百科参考文献上训练该模型,也就是从数千个维基百科编辑的贡献和集体智慧中学习。

通过众包,研究者观察到,对于最有可能被系统标记为不可验证的前10%引用,人们70%的时间更喜欢该系统推荐的替代方案而不是原先引用的参考文献。为了验证该系统的适用性,研究者建立了一个演示版本,与英语维基百科社区互动,并发现对于同样前10%最有可能不可验证的声明,SIDE的第一个引用推荐的受欢迎度是现有维基百科引用的两倍。这些结果表明,可以使用基于AI的系统与人类协同工作,以提高维基百科的可验证性。

打开网易新闻 查看精彩图片

图1. 基于AI的维基百科验证系统架构

打开网易新闻 查看精彩图片

图2. 维基百科使用者的偏好数据

编译|梁金

计算社会科学读书会第二季

详情请见:

‍1.

2.

3.

4.

5.

6.