在世纪之交,互联网经历了一场被称为“Web 2.0”的变革。1990年代的万维网在很大程度上是只可阅读的:静态页面、手工制作的主页、来自少数出版商的门户网站。

随后发生了2000年至2001年的互联网泡沫破裂,许多融资丰厚但实用性不强的互联网企业相继倒闭。在此之后,幸存的公司和新进入者转向了一种不同的思维方式,作者兼出版商蒂姆·奥赖利后来描述为“利用集体智慧”:平台而非页面,参与而非被动消费。

2001年1月15日,一个网站诞生了,似乎代表了这个新时代。其主页上的第一条信息简单地写道:“这是新的维基百科!”

维基百科最初并不是作为非营利网站而构思的。在早期阶段,它是通过联合创始人吉米·威尔士的营利性搜索公司Bomis进行托管和支持的。但两年后,维基媒体基金会成立,作为专门的非营利组织来管理维基百科及其相关项目。

维基百科体现了网络2.0的梦想,即一个建立在参与和分享基础上的没有等级、由用户主导的互联网。一个基础性的理念——志愿者人类编辑在发布后逐步审查和认证内容——在2007年《洛杉矶时报》的报道中被强调,报道中提到威尔士本人试图为南非古古雷图的一家肉店撰写条目。

他的编辑被其他不同意关于这个他们从未听说过的商店重要性的编辑撤回或阻止。最终,该条目以一个条款出现,巧妙地概括了这个平台的自我治理模型:“维基百科的共同创始人吉米·威尔士创建了关于该商店的维基百科条目,这引发了关于众包项目纳入标准的辩论。”

作为一名研究人工智能和互联网的历史社会学家,我觉得维基百科之所以有启发性,不是因为它完美无缺,而是因为它展现了自己的运作方式(以及缺陷)。几乎每个条目背后都有一层大多未被认可的人类判断:编辑们权衡来源,争论框架,澄清模糊的主张,并执行可验证性和中立性等标准。

通常,阅读维基百科最有启发性的方法是查看它的修订历史。学术界甚至把这个编辑历史作为一种研究方法——比如在研究Crispr基因编辑技术发展中的科学差异,或者2011年埃及革命的历史进程时。

考虑到它简单明了的呈现方式,维基百科所投入的人力劳动规模常常被人们视为理所当然。Statista 估计到2024年,约有44亿人访问了这个网站——超过一半的全球人口和三分之二的 互联网用户。超过1.25亿人 编辑过至少一个条目。

维基百科 没有广告,也不出售用户数据——这正是它声称编辑独立性的核心所在。但用户经常会看到筹款横幅和呼吁,维基媒体基金会还建立了付费服务来管理其内容的 高频重用——尤其是被用于AI训练的机器人。该基金会的 总资产 现在已超过3.1亿美元(约合2.3亿英镑)。

'Wokepedia'和'Grokipedia'

'Wokepedia'和'Grokipedia'

维基百科在25岁时,依然显得是原始网络2.0理想的一个罕见胜利——至少相比于如今大多数主要开放平台,这些平台已经把参与变成了监控广告。

包括我所在的大学在内的一些大学,借助网站的周年庆来缓解大家对学生使用生成性人工智能的担忧。我们曾经对学生依赖维基百科感到恐慌,但后来适应了这种情况,继续前行。现在同样的论点表明,我们不应该过于担心学生依赖生成性人工智能来完成他们的工作。

这种比较因埃隆·马斯克的人工智能驱动的维基百科版本(或称‘Wokepedia’,正如马斯克所轻蔑称呼的)快速增长而变得更加明显。虽然Grokipedia使用人工智能生成大部分条目,但其中一些与维基百科的条目几乎相同(所有这些条目都可以根据创意共享许可进行再发布)。

Grokipedia条目不能直接编辑,但注册用户可以建议修正供人工智能考虑。尽管这部人工智能百科全书仅在2025年10月27日上线,但它已经拥有超过560万条条目,而维基百科的总条目则超过710万。

所以,如果Grokipedia在规模上超过了这个更老的竞争对手,这现在看起来是有可能的,我们应该把它视为网络2.0梦想的终结,还是仅仅是另一个适应的时刻呢?

可信度测试

可信度测试

人工智能与人类创造的互联网 一直是 相互交织的。自愿分享被用于人工智能训练,但存在争议的同意和薄弱的归属。基于人类写作训练的模型生成的新文本污染了网络,被称为“人工智能垃圾”。

维基百科已经与此发生了碰撞。编辑们报告了人工智能撰写的补充内容,以及在核查时未能通过的可信引用。他们采取了如 WikiProject AI Cleanup 的措施,提供如何检测通用人工智能措辞和其他虚假信息的指导。

但威尔士并不希望在维基百科的领域内全面禁止人工智能。相反,他 表示希望 实现人机协同,强调人工智能有潜力吸引更多非母语英语的贡献者到该网站。维基百科也 承认 在条目和编辑者方面存在严重的性别失衡。

在其25年的历史中,维基百科的可信度经常受到考验。一个引人注目的例子是约翰·塞根索勒(John Seigenthaler Sr.)的 传记骗局,当时一名未注册的编辑虚假撰写了关于该记者与肯尼迪暗杀事件的所谓联系,以及 Essjay 争议,一名知名编辑被发现伪造了其教育资历。

关于付费或与国家相关的利益冲突,也曾多次引发 争议,包括2012年的 Wiki-PR 案件,当时志愿者追踪到一家公司的活动,并禁止了数百个账户。

这些漏洞使得关于政治偏见的说法引起了关注。马斯克多次将维基百科和主流媒体视为意识形态倾斜的,并将Grokipedia称为需要“清除宣传”的“重大改进”。

随着维基百科迎来25周年纪念,我们或许正在目睹一种新的“公地悲剧”,在这种情况下,自愿知识成为了可能产生不可靠材料的系统的原材料。乌苏拉·K·勒古恩的小说《无主之地》(1974)生动地描绘了维基百科面临的困境:一个无政府主义的公地只有通过持续的维护才能存活,同时面临着更富有的资本主义邻居的拉力。

根据批判理论家麦肯齐·沃克的说法:“权力不是知识,而是秘密。”人工智能通常运行在封闭的专有模型上,这些模型会抓取所有可用的信息。维基百科的对抗模型是一个具有可读历史和问责制的公共策展系统。

但如果谷歌的人工智能摘要和排名开始优先考虑Grokipedia,习惯可能会很快改变。这将重演“加利福尼亚意识形态”,记者兼作家温迪·M·格罗斯曼在维基百科推出的那一年被警告过——也就是说,互联网的开放性成为了硅谷市场力量的助推器。

维基百科和生成性人工智能都改变了知识的流通。一个是有规则和修订历史的人类出版体系。另一个是模仿知识但没有可靠基础的文本生产体系。至少目前,这个选择是我们大家的。