打开网易新闻 查看精彩图片

上周,Google DeepMind 发布了第三代视觉语言模型 Genie 3。紧接着,全球游戏公司股价应声下跌。

引擎巨头 Unity 暴跌一度超过 24%,顶级制作商 Take-Two、任天堂、CD Projekt Red 等无一幸免。下跌的趋势,也持续到本周。

打开网易新闻 查看精彩图片

资本市场剧烈的反应背后,逻辑简单又粗暴:

既然模型能快速生成以假乱真且可交互的 3D 世界,任何人都能做出 AAA 级别的游戏。那些投入上亿美元、耗时十年打磨一款游戏/开发工具的公司,岂不都完蛋了?

乍一听上去有点道理,但仔细一想,似乎不太对。

在我看来这是膝跳反应式的恐慌,暴露了一个认知误区:把视觉细节的生成,等同于完整世界的构建。

不是所有会画图的人都能成为建筑师。游戏开发的世界构建,也是这个道理。

《GTA》《荒野大镖客》《魔兽世界》《塞尔达传说》……问任何一个曾深度沉浸于开放游戏世界的玩家,他们大概都有类似的感受:

真正让游戏世界「活」起来的,从来不是美轮美奂的场景,或者简单的交互性,而是那种见微知著、难以言说的「生命感」。

打开网易新闻 查看精彩图片

Demo 只是 demo

Genie 3 的演示视频确实震撼。

给它一段文字、参考图、手绘图之类的,它的确能在令人难以置信的时间里,实时生成类似《GTA》《塞尔达传说》风格的场景。玩家可以在其中探索一段时间,扮演「游戏角色」在以假乱真的世界里游荡。

打开网易新闻 查看精彩图片

对于缺乏技术细节了解的旁观者而言,Genie 3 看起来确实像是「游戏开发的终结者」。

但 demo 只是 demo,甚至离游戏行业能够接受的「可游玩」或者「技术 demo」相去甚远。

Genie 3 本质上是一个自回归式的「帧生成」(frame generation) 模型。而「帧生成」也不是什么新鲜玩意,在游戏和显卡技术行业早已存在。它的工作原理,用最简单的话来说,就是看着前几帧画面,猜测下一帧的像素排列,生成新的帧,循环往复。

关键在于,Genie 3 的帧生成是靠「猜」的,而非硬编程,没有可靠的逻辑计算。

在一个真实的游戏中,当玩家扔出一个铁球,游戏引擎利用经典物理公式来计算它的下落速度。当玩家打开手电筒然后在房间里乱跑,游戏引擎模拟「光线追踪」和被照物体的材质,来实时渲染光照的效果。

但 Genie 3 没有这些能力,它只是在观察了数以千万记的视频片段之后,形成一个大概的「感受」,猜测物体在掉下去的时候可能会加速,光会在物体的身后打出一个影子。

Genie 3 「猜」出来的这些效果,并不真实。而在游戏世界里,不真实会严重破坏沉浸感。

在各种 demo 中,出戏的情况时有发生。

Genie 3 有个致命短板:缺乏长期一致性。它的记忆窗口(在目前的 demo 版本)只有最多 1 分钟。一旦超过这个时间,Genie 3 可能就会开始遗忘初始场景,世界结构随之崩溃。

与之相对,传统游戏能够保存确定性的状态。世界的构成,每一个素材都刻写在游戏文件里,游玩上百小时后的每一草一木依旧如故(除非碰到像《荒野大镖客2》这样的,能保留一具 NPC 的尸骨或树木上的弹痕直到天荒地老……)

你能接受在一个游戏里,同一个地方每次去都不太一样,甚至刚一回头就变了样吗?

打开网易新闻 查看精彩图片

RDR2 游戏中遗体随时间腐烂的过程

不仅缺乏记忆,模型猜想出来的世界,也不具备复杂逻辑。

在 GTA 里攻击一个 NPC,基于该 NPC 的平民、帮派成员、警察等不同身份,可能会产生不同的后果。但这种复杂的逻辑链条需要明确的框架——需要硬编程。

但 Genie 3 只能根据连续帧来做出反馈。虽然模型能力提升能够强化逻辑感,但没有硬编程,反馈注定只是概率的。换言之,在模型生成的世界里没有因果,只有模糊的猜测。

需要明确的是,相比前代以及其他视觉语言模型/世界模型,Genie 3 的一致性、稳定性已经强出不少。但出戏的情况仍然有相当大的概率出现,这在游戏里不可接受。

缺乏确定性的世界,就像没有筋骨的皮肉,看起来能动,但立不起来。

Unity CEO Matt Bromberg 指出:世界模型的输出是「概率性」的,缺乏传统游戏引擎那种结构化的、具有确定性的模拟能力,无法维持连贯的玩家体验。

打开网易新闻 查看精彩图片

精雕细琢才有「生命感」

说到游戏世界的构建,R星的《荒野大镖客 2》(RDR2) 是个绕不开的标杆。

这款开放世界大作的研发数据令人咋舌:主创 Dan Houser 透露,RDR2 的开发周期长达 8 年,团队上千人,剧本堆起来有几英尺高,动捕的总素材时长达到上千天,超过千名演员参演,研发和营销预算超过 5 亿美元。

这些数字共同造就了 RDR2 令人着迷的细节还原度。为了打造一个真实的 19 世纪末的美国,R星团队做过大量的调研,从现实中取材并加以演绎,造就了杂乱而具有生气的城市,以及荒废且令人窒息的边境小镇。绝大多数主要和次要角色的台词、动作经过充分的雕琢。甚至具体到成千上万个 NPC ,每一个都有着专属的、符合身份和所处环境的行为逻辑。

但这些只是表面。R星的恐怖之处,是对那些玩家几乎不会长期观察的细节,仍有着疯魔般的执着。

YouTuber Any Austin 对 RDR2 做了些「刁钻」的研究,揭示了 RDR2 其实有一套完整、自洽、规模令人惊叹的「电力系统」:

几乎每一个拥有电灯的建筑,房檐下都连着电线,这些电线跨越雪山草地、河流沼泽,最终都汇入同一栋建筑 Lanik Electric Co。深山老林里的房屋,有些装了电灯但处于关闭或破损状态,而有人居住的则点燃蜡烛或瓦斯灯照明。

打开网易新闻 查看精彩图片

AI 当然能生成一段 60 秒的,神似蛮荒西部的 demo,但它填充不了如此细致、精确、符实「电力系统」的细节。而正是无数这样看似不足为奇,甚至在整个游戏生命周期都不会被人注意到的细节,却共同构成了游戏世界的「生命感」。

以上讨论,仅仅是「视觉」层面。对于 R星来说,世界构建远不止于视觉,更重要的往往是「世界观」。

以 GTA5 为例,它对现实世界的诸多讽刺中有一项令我格外印象深刻,就是对于「媒介生态」的观察和体现。

游戏内嵌了海量的电台、电视、互联网内容。电台广告里卖着「印度神油」,主持人争论着极左或极右的论点。你在任务里炸死了一个科技公司 CEO,不仅很快能看到新闻报道,甚至在虚构的社交媒体上也能看到网友的吐槽。

打开网易新闻 查看精彩图片

再回到 RDR2,整部作品的主线、支线剧情和世界构建,其实是一场对时代精神的结构盛宴。

在新旧世纪的交界点上,蛮荒逐渐被文明所吞噬,但文明又带来了预料之外的问题。主角所在的范德林德帮代表了近现代美国的基石——无政府主义,靠道义与私刑维持的草莽社会;而平克顿侦探社,以及各处的商界政界大亨则代表了潮水的方向——现代秩序。

不仅如此,在繁华腐败轰隆向前的时代大背景下,亚瑟游走在法律之外和人情之中的个体体验,也更令玩家感受到「好人不长命」的逼仄、窒息感。

一款游戏的真正特色,在于人物、任务、故事、世界观。没有这些细节雕琢的世界,注定是空旷的。

在大模型可以瞬间生成像素的今天,R星的这种「笨功夫」反而凸显出「手搓」艺术作品的人文主义价值。当然,AI 一定会越变越强,但它恐怕很难模拟出带有特定的历史偏见、文学厚度的「灵魂」。而正是这些所谓的灵魂,才是优秀的游戏真正被玩家所热爱的理由。

打开网易新闻 查看精彩图片

AI 生成不了 IP——最多只会抄袭

另一个不得不提的本质问题:玩家玩游戏,到底热爱的是什么?

答案很多时候除了游戏(剧情、机制设定等)本身,还有游戏的 IP。

IP 的价值,远超出单一作品本身。

以任天堂为例,马力欧这个 IP 诞生于 1985 年,近 40 年来,任天堂围绕这个戴红帽子的水管工,推出了超过 200 款游戏,横跨平台游戏、赛车、体育、RPG 等几乎所有品类。

从《超级马力欧兄弟》到《马力欧奥德赛》,从《马力欧赛车》到《马力欧派对》,每一作都在强化玩家对这个 IP 的认知和情感。

2023 年上映的《超级马力欧兄弟大电影》全球票房超过 13 亿美元,成为有史以来票房最高的游戏改编电影。这个成绩不是因为电影本身有多么惊世骇俗,而是因为几代人对马力欧这个 IP 积累下来的情感。

IP 的构建需要时间,需要一致性,需要创作者的长期投入和精心运营。

好的游戏 IP,不光是做好游戏,而是一直不停地做好游戏。王权没有永恒。育碧的《刺客信条》,动视的《使命召唤》,这两个知名 IP 最近多年以来的颓势,都是这个逻辑的绝佳证明。

R星从 1997 年的《GTA》初代开始,用了近 30 年时间,才把这个系列打磨成今天这个能够代表开放世界游戏巅峰的 IP。每一代 GTA 都在延续核心的讽刺精神和犯罪题材,同时不断创新玩法和叙事手法。

这种持续性让玩家对 GTA 产生了信任:我知道下一部 GTA 会是什么样的基调,但我更期待它会带来什么新的惊喜。

这种信任关系,是 AI 无法在真空中生成的。

打开网易新闻 查看精彩图片

更重要的是,IP 运营是一个复杂的系统工程。哪些元素可以变,哪些必须不变?你需要在不同作品之间建立连贯性,让粉丝感到「这就是那个世界」。在该推出续作的时候推出续作,在该跳出思维惯性和肌肉记忆的时候就该跳出来。IP 需要处理版权、授权、跨媒体改编等一系列商业和法律问题……

小岛秀夫的《合金装备》系列是一个典型案例。从 1987 年到 2015 年,小岛用近 30 年时间,通过 5 部正传和多部衍生作品,构建了一个涵盖冷战、核威慑、信息时代、生物科技等多个主题的庞大世界观。

每一作都在延续前作的角色和故事线索,但对他们做出富有创意的「微调」,同时引入新的哲学思考。这种跨越数十年的叙事连贯性和主题深度,让《合金装备》成为游戏史上最受尊敬的 IP 之一。

科乐美在 2015 年踢走了小岛,虽然他们仍然拥有《合金装备》的版权,但粉丝普遍认为这个 IP 的灵魂已经离开了。即使后来的重制版画面再精美、玩法再完善,也很难再获得玩家同样的情感认同。

这揭示了一个残酷的真相:IP 的核心价值不在于素材和代码,而在于创作者的持续投入和玩家的情感积累。

Genie 3 可以在 1 分钟内生成一个看起来像《塞尔达传说》的世界,但它生成不了玩家对林克、塞尔达、海拉鲁的情感寄托。它可以模仿《巫师》的中世纪奇幻风格,但它给不了玩家杰洛特那种游走于灰色地带的道德选择所带来的思考。

所以当投资者恐慌地抛售游戏公司股票时,他们可能忽略了一个关键问题:那些真正有价值的游戏公司,手里握着的不只是开发工具和技术,更是经过数十年经营、已经深深扎根在玩家心中的 IP。

AI 能做的是快速生产素材,但 IP 需要的是缓慢积累。这是两个完全不同的时间尺度。去年是马力欧 40 周年,今年则是塞尔达传说 40 周年——这些 IP 的价值,不是 AI 在短期内能够撼动的。

打开网易新闻 查看精彩图片

AI 是画笔,人才是画家

这些道理,当然不需要专门写一篇文章来讲。任何对游戏有审美,对游玩体验有追求的人,都应该明白。

所以我相信,片刻的认知偏差和恐慌肯定会过去。优秀的游戏开发者,会获得与他们的作品质量、实力和创造力所匹配的市场公允价值。

但是,Genie 3 所展现出的技术发展的方向,当然值得探讨。

在 AAA 级别游戏工作室的实际流程中,AI 确实已经开始发挥一定的作用。比如在概念设计阶段,通过提示词来生成图片或 3D 场景来快速预览风格,构建原型;在素材生产的环节,使用 AI 工具来快速生成多种纹理的素材。

这些工具交给大工作室,能够一定程度上提高生产效率,给到个人开发者的手上,也可以显著降低开发者的负担。

同理,对于游戏开发者,乃至整个游戏行业而言,Genie 3 本来应该是个重大利好——正因为此,它引发的游戏公司股价暴跌才让我十分费解。

等到 GTA7 的时候,R星可能会利用 Genie 3 生成路边垃圾桶、NPC 的闲聊对话,甚至是完整的关卡、场景、人物。

但这些素材放在哪里、怎么放,它们在一个具体的任务,以及在整个宏观的世界中所扮演的角色,仍将由 R星的人物、任务、关卡、环境、世界设计师们决定。

AI 会成为游戏开发者的超级画笔。但只有在人类「画家」的手中,它才能画出具有文化深度和社会影响力的旷世佳作。

打开网易新闻 查看精彩图片