西雅图软件工程师Gregor Stocks小时候用几包第五版补充包学会了万智牌,但真正入坑是在玛凯迪亚假面时期。此后他断断续续玩了二十多年,期间无数次听人提起某篇"影响了他们思路"的老文章,却怎么也找不到原文。"这种挫败感太熟悉了,"他说。

互联网的记忆比想象中更脆弱。Stocks成长于2000年代初的互联网,他担心那些曾深刻影响自己的内容会默认消失。"互联网档案馆很棒,但我不想让它成为唯一的保存者,"他说。这种焦虑最终催生了"棱镜图书馆"(Library of Leng)——一个以万智牌卡牌命名的可搜索数据库,专门收录关于这款卡牌游戏的写作。

打开网易新闻 查看精彩图片

这个新项目已经汇集了17.5万篇文章,时间跨度从1994年(游戏诞生仅一年后)的战略分析,到几年前的赛事规则公告。数据来源包括旧Usenet论坛帖子、互联网档案馆抢救的爱好者网站内容,以及威世智公司(Wizards of the Coast) routinely 删除的官方更新。

技术实现上,Stocks面临的最大挑战是解析早期互联网数据。"现在写万智牌文章,你有内容管理系统自动检查卡牌名拼写、格式化牌表、统一HTML格式,"他解释道,"但90年代和2000年代初,人们基本是从零开始手写每个网页。"这导致他需要大量"意大利面条代码"来处理各种特殊情况、拼写错误,以及正确解析作者、日期和链接等信息。"这方面还有很多改进空间,"他承认。

棱镜图书馆不擅自全文转载文章,而是提供标题、摘要片段,并链接到互联网档案馆的存档版本。Stocks表示,项目上线后反响积极:读者分享他们半记得却找不到的老文章,原作者主动联系要求收录作品。"没人要求我删除他们的文章——当然如果有人提我会照办,"他说,"看到顶级万智牌职业选手在推特上谈论我的项目,真的很满足。"

威世智公司尚未回应他的收录许可申请。但Stocks已经准备好继续这项抢救工作——在数字内容的自然流失中,为三十年的玩家智慧争取一个更稳固的容身之所。