6.8分。

这是IGN给《死亡搁浅》的评分。而几年后,这款游戏的异步社交系统被玩家捧上神坛,小岛秀夫的明星制作人光环加上时代变迁带来的广泛共情,让当初那个分数成了社区里的经典笑柄——"IG8"的梗至今流传。

打开网易新闻 查看精彩图片

但有趣的是,如果我们翻开当年那篇评测,会发现评测者Tristan Ogilvie的扣分理由其实相当具体:过场动画冗长到打断节奏,传送需要连续跳过数个CG;任务设计千篇一律,主线支线全是送货;动作系统乐趣减少,击败BT后的反馈不足。这些批评指向的,是他个人长期关注的几个维度——动作系统、交互反馈、流程顺畅度。

打开网易新闻 查看精彩图片

问题恰恰出在这里:当评测者的"专业视角"与玩家的"真实体验"错位时,谁更接近那个叫"好游戏"的东西?

这不是IGN独有的困境。Polygon给《DOOM》(2016)的争议评分,VentureBeat那位"操作不足以完成《茶杯头》第一关"却拥有二三十年评测资历的编辑——这些案例指向同一个现象:游戏评测这个行当,似乎正在经历某种信任危机。

而危机的根源,或许藏在评测流程本身。

据IGN公开的流程,他们会内部筛选"最适合某类游戏且档期合适"的编辑,在同事协助下完成评测,经审核后排期发布。这个机制设计精巧,也确实贡献过大量高质量内容。但它的前提假设是:存在一类人,其游戏偏好与判断标准能够代表某种"专业共识"。

现实往往更混沌。一个编辑的阅历、偏爱的游戏类型、对GDC设计理念的理解深度,甚至同期竞品的市场表现,都会微妙地扭曲最终分数。当《死亡搁浅》恰好踩中某位编辑的雷区时,6.8分就成了必然——不是恶意,不是业余,只是两个坐标系之间的翻译失败。

更微妙的是时间变量。评测通常基于发售前后的版本,而《死亡搁浅》的异步社交价值需要玩家社群的沉淀才能显现。评测者面对的是"此刻的游戏",玩家记住的是"三年后的游戏"。这种时差造成的认知裂缝,至今没有标准解法。

这让我想到数码区的类似困境。手机评测会提性能、续航、外观、系统、拍照、外放,但非首发上手的内容不可能面面俱到。每个创作者都会根据自己的使用习惯有所偏重——有人是影像党,有人是续航焦虑患者,有人只关心原神能不能满帧。这种偏好在个人创作者身上更明显,但在机构媒体里同样存在,只是被"编辑部共识"的包装稀释了。

所以当我们质问"为什么我觉得好的东西,媒体给了低分"时,真正想问的或许是:评测的"专业性"到底该锚定在哪里?

打开网易新闻 查看精彩图片

是锚定一套可复现的评分维度?但游戏作为体验商品,维度本身就在不断膨胀——十年前没人会拿"拍照模式滤镜数量"给3A大作扣分。是锚定"大众口味"的预测?但《死亡搁浅》后来的口碑反转证明,大众的口味也会被教育、被重塑、被延迟满足。是锚定创作者意图的还原?那又需要评测者具备近乎人类学的田野调查能力,去分辨哪些设计是刻意为之,哪些是技术债务。

本文作者提到一个观察:随着硬件创新进入"渐进创新"阶段,产品节奏放缓,社区里开始出现"DIY区不如以前"的感慨。这种倦怠感或许同样适用于评测领域——当游戏工业的生产模式趋于稳定,评测话语却还在沿用旧日的框架,错位就不可避免。

作者自称"愤青的Random Yapping",且明确将自己纳入批判射程——"我自己就是后文中所批判的那个……小自媒体"。这种自我指涉很重要:它提醒我们,评测困境不是"他们专业媒体"的问题,而是所有试图用语言表达游戏体验的人共享的困境。

在B站粉丝量远未破千、在酷安和少数派发些"诉诸真实生活场景"的文章——这样的创作者身份,让作者的观察带有一种局外人的清醒。没有养工作室的压力,没有竞争环境中的生存焦虑,反而能看清一些东西:比如评测者个人坐标系与玩家集体坐标系的永恒张力,比如机构媒体为维持公信力而不得不表演的"客观性"神话。

但清醒也有代价。作者坦言写作过程"真的很痛苦",担心变成"直球辱骂",担心"在进入之前就已经和某些职业无缘",担心"把发文章的平台本身也拖下水"。这种焦虑本身,就是当代内容生产环境的缩影——说真话需要计算成本,保持诚实需要策略性模糊。

最终,文章没有给出答案。三万字的篇幅里,前三部分尖锐地抛出案例,后两部分温和地尝试回应,但那个核心问题——"主观体验向评测的尽头到底为何方"——依然悬置。

或许这就是诚实的姿态。承认评测是一种翻译行为,承认翻译必然失真,承认"我觉得好玩"与"专业评分"之间的鸿沟可能永远无法填平。在这个意义上,IGN的6.8分和玩家的后来追捧,都是真的,都成立,都只是不同坐标系下的合理读数。

而我们能做的,或许只是多读几个坐标系——在信任何一个分数之前,先看看那个给出分数的人,平时在玩什么,讨厌什么,又在什么情况下会忍不住跳过过场动画。