无数人尝试了 AI 和游戏结合,为什么还没有真正现象级的产品?让我们回归第一性原理:游戏要好玩才会有人玩。而已有的 AI + 游戏尝试,还没有让游戏变得更好玩。 “这款游戏啥都好,就只有一个问题:不好玩。” 游戏之神宫本茂对后来的任天堂 CEO 岩田聪如是说。

1

打开网易新闻 查看精彩图片

《代号:黑箱》 我们 Meshy Game Studio 的第一款产品,通过我们自研的 “AI 游戏机制大模型” 合成武器,每一局都有完全不同的玩法,上图的攻击技能是玩家的创意自由合成出来的。我们期待他是市场上第一款真正好玩的 AI 原生游戏,很开心今天能和大家分享一下这款游戏背后的故事。

时间回到 2014 年前,我在清华读大二。受当年大火的游戏 《2048》 启发,我做了一款数字消除游戏,《Not a Number》。当年在人人网火了一波,一周之内吸引了近 20000 人来玩。在清华上课的时候发现周围的同学没人听教授讲课,都在玩自己做的游戏,那成就感叫一个强 :-) 后来 NOI 2014 喊我去出题,我就出了一道《消除游戏》,不知道读者朋友有没有还记得这个游戏或者这个题的。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

把数字连成质数、回文数、完全数、平方数,就能得到相应的分数。这种玩法在清华(还有隔壁的北大)非常流行。截图来源:Luogu

从姚班毕业后,我去 MIT 继续攻读计算机图形学博士,毕业以后做了 Meshy AI,现在是 3D AI 全球市场份额第一位的产品。干 CEO 干累了,有的时候就想回归初心。我一开始为什么学编程?为什么搞图形学?

为了做游戏

创业蛮苦的,好在公司还比较成功,未来有无限可能。不管走多远,我都知道有一天我会重新回到初心,去做一件小时候的我最想做的事情:做一款游戏。恰好 Meshy 又是一家 AI 公司,我们在一个非常好的时间点去做一款 AI 原生的游戏。

打开网易新闻 查看精彩图片

“In my heart, I am a gamer.” 任天堂 CEO 岩田聪在 2015 年的 GDC 上的演讲。怎么说呢,虽然没有岩田聪那么厉害,但我的内心也是个 gamer...

1

AI 目前真的让游戏变得更好玩了吗?

先来简要总结一下目前 AI 和游戏结合的已有工作。我们没有走这些路线,但是这些工作毫无疑问会启发很多后人。

  1. 基于 real-time video model(不管是 diffusion 还是 autoregressive),也就是 Genie 3 的 “世界模型路线”。我花了 $200 去玩了 Genie 3,发现几个问题:这个产品基本上是一个风景模拟器,但是一个好玩的游戏有机制、美学、剧情等等成分,只能看看风景是不够有意思的。如果大家对“世界模型”感兴趣,请移步《硅谷 101》最新一期节目,节目组邀请我发表了一些看法:

  2. AI 对话。Character.ai 类似的应用就是典型的例子,相当于把游戏里面和 NPC 互动功能单独抽出来做成一个互动产品。直到今天,Character.ai 依然有着巨大的流量,不过我自己恐怕不是这个方案的受众。

  3. AI 生成图片或者 3D 模型进行换装、UGC。我们也和合作伙伴合作过这个事情。把 Meshy API 接入游戏中,允许玩家生成自己的武器、装备的形象。最后数据跑下来发现玩家只是被广告里面的 AI 两个词吸引了,也许短暂能观察到投放转化率的提升,但是由于简单的 AI 生成素材换皮这事儿其实并不 “好玩”,甚至大部分玩家连提示词都想不出来,很快玩家就流失了,留存率不变甚至变低了,ROI 算不清楚。也许乙女向的游戏里面有一些本方向的机会,可惜我不是受众。

  4. AI 一键生成游戏,代表产品如 Rosebud AI,本质上是 “vibe coding for games”,也能做出一些用户量。但是平台上的游戏普遍目前质量不高,暂时难以达到一个游戏原型应该有的标准。

  5. AI 小镇。以斯坦福小镇为起点,让 NPC 更加有烟火气。但是我作为一个玩家,总觉得参与度有些低。

  6. AI 生成剧情,最近有不少小成本的成功产品出现,也是很不错的方向。

上面的这些 AI + 游戏的方案有些取得了一定的进展。我们团队做游戏有一个原则:做出来的游戏,我们必须自己喜欢玩。如果一个游戏做出来我们自己都不爱玩,如果看了宣传视频我们自己都没有下载打开的动力,如果我们自己都玩两分钟就觉得无聊了,那一定是方向有问题的。所以,我们必须选择一条我们自己就是受众的技术路线,做自己爱玩的游戏。

1

如何破局

抛开我们自己是否爱玩,还有一个问题要回答:无数人按照上面的路径尝试了 AI 和 游戏结合,为什么还没有真正现象级的产品?

也许原因有很多。我们的分析思路是回归第一性原理:对于绝大多数游戏来说,成功的关键只有一点,“好玩”。游戏要好玩才能会有人玩。而已有的 AI + 游戏尝试,本质上并没有让游戏变得更好玩

如果要破局,能否换一个思路,从游戏本身出发,反过来思考:游戏本质上是因为什么好玩?而 AI 能对加强这个本质,做出什么贡献呢?

要回答这个两问题,我们来看两款我自己非常喜欢的游戏:Jonathan Blow(吹哥)的 《Braid 时空幻境》和《塞尔达传说:旷野之息》 (Botw)。这两款游戏分别是非常成功的独立游戏和大制作。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

上边是《时空幻境》的原型,下边是完成后的游戏画面。来源:gamedeveloper

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

Botw 的原型与完成后的游戏画面。来源:GDC

我们可以看到,在顶尖游戏开发者眼中,刨去画面表现,游戏的内核是这些在原型中依然存在的机制与玩法,比如“按 Shift 键时间倒流”,比如“我砍树,树就会倒下,还会随着河水漂流”。

对于大多数没有大成的游戏,真正的问题恐怕并不是画面不够绚丽、对话不够生动,而是没有趣味,不好玩。就好像你开了个餐馆,名字好、地段好、装修好、广告好,但是菜不好吃,也许能赚点钱,但是一定不能成为顶级的餐馆。当然,其他成分也是游戏成功的重要成分,但是仅仅有优秀的美术、音乐、剧情是不行的。

游戏玩法(Gameplay)和游戏机制(Game mechanics)才是大多数游戏最本质的内容。如果 AI 原生游戏真的想有增量价值,不是为了用 AI 而用,就必须让 AI 实现玩法或者机制的生成

注:游戏玩法(Gameplay)和游戏机制(Game mechanics)两个 terms 经常被混用,行业里也没有统一的定义。我们这里不泾渭分明地区分两个术语,而是将最核心的游戏机制定义为“玩法”。

但是要生成游戏机制,谈何容易!目前市面上很多游戏都只是在 “使用 AI 生成素材”,而不是 “由 AI 构成游戏机制本身”,是有原因的。

既然 “生成玩法和机制” 这个事情已经足够难,游戏行业又是一个存在了几十年、我们得保持敬畏的行业,我们就必须专注于解决核心问题,暂时放弃对其他方向的追求(比如 AI 生成环境、场景、NPC 等等)。

综上,第一款游戏,我们能且只能做 “AI 生成游戏机制” 这件事情。

1

站在巨人的肩膀上

既然决定专注研究游戏机制生成了,就得找一些以玩法见长的游戏。有哪些画面和剧情算不上顶尖,但是就是很好玩的游戏?我们从四个游戏中得到了启发:

暗黑破坏神 2。和我一样上了年纪的读者估计小时候玩过《暗黑破坏神 2》。小时候到外公外婆家一定要到小房间打开电脑玩上一小时。虽然从来没那个时间玩通关,但是能够体验一把死灵法师、德鲁伊、女巫在旷野中砍怪的爽快感,也对第一次看到安姐吓破胆的经历记忆犹新。尽管如此,我还是觉得当年玩《暗黑 2》有几个遗憾:

“技能树为什么是固定的?我想能做到言出法随!”

“要是我发出去的冰锥能够追踪就好了!最好击中以后再来个 AOE!”

“要是我召唤的骷髅怪,还能再召唤小怪就好了!”

打开网易新闻 查看精彩图片

暗黑 2 重制版。我只买过两个游戏的重置版:暗黑 2 和 帝国时代 2。

Noita. 第一次看到这个法术编程模拟器游戏的时候我还在 MIT 读 PhD,深入玩已经是几年以后的事情了。开局一根杖,通过“法术编程”,搓出机关枪甚至核弹、黑洞,其乐无穷。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

Noita 什么都好,只有两个问题:

1. 我作为一个 MIT CS PhD 要花十个小时才能初步入门《Noita 施法指南》,必须上 B 站看教程。

2. 太容易死了,前期极其劝退。我最后在打了十几个 mod 以后,终于顺利通关了。

打开网易新闻 查看精彩图片

吸血鬼幸存者。一次和一位好朋友爬山,他推荐了我这个游戏。后来他去了马斯克的 xAI,每天忙得要死,再也没有时间陪我爬山了,但是他推荐的吸血鬼幸存者一直陪伴着我。《吸血鬼幸存者》是“类幸存者”游戏的鼻祖,画面算不上最吸引人,但是游戏性极强。如果游戏里面的武器能够再丰富一些、合成能够更自由一些,就好了!

打开网易新闻 查看精彩图片

塞尔达传说:王国之泪 (Totk)这个作品我相信不用多说。具体聊一下“余料建造”:把蝙蝠眼睛合成到箭上,就能实现“追踪箭”。青沼大叔演示到这一步的时候,我想很多人都会觉得很惊喜、很想玩。(我最近硬件升级了 Switch 2,老存档丢了,只好从头开始玩。但是还是好好玩。)

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

“余料建造” 有了一定的自由度,但是还不够,依然还是按照写死的规则。为什么还要去查攻略看合成表呢?为什么就不能把任意两个道具合成?

1

AI 机制生成大模型

游戏的机制有不同的层面。按照如今 AI 的能力,自动设计出来一个 PUBG、搜打撤这种完全创新的宏观上的玩法,暂时是不太可能了,因为没有相应的训练数据。但是是否可以在大的玩法框架下(比如说 ARPG 打怪刷宝练级),做一些局部游戏机制的生成?

沿着这个思路就会发现,在上面四个游戏中,每一把武器、每一个职业、每一个技能,都是一个不同的攻击方式,都是游戏机制。比如要过河,野蛮人可以用斧子把旁边的树砍倒做一个独木舟,法师可以施展暴风雪把河面冻住,召唤师可以召唤一只河马宝宝驮我过去。能做到这个粒度的机制生成,其实就足够有趣了!

上面的几款游戏都以某种 build 机制为核心,实现了一定程度的游戏机制自由组合。但这几款我心中的神作里面的 build 机制还有如下的问题:

  1. 不够自由:比如在暗黑类游戏中玩家必须按照既定的技能树发展。虽然有一定 build 的自由度,但是 build 的规则依然是写死的,不能进行无限自由的操作。

  2. 不够直观:Build 的结果应该符合直觉。比如《吸血鬼幸存者》中的武器合成,我其实很难预判两个武器合成以后会成为什么样的新武器,这会大大降低我对游戏的掌控感。

  3. 门槛过高:Noita 就是典型的代表,如果一个 PhD 都要花十个小时才能上手,那么不太硬核的玩家大概率就和其中的乐趣说再见了。

自由、直观、低门槛三点相互制约。比如,“直观” 和 “低门槛” 这两点 Botw 和 Totk 已经做得很好了,但是其中的 “余料建造” 仅限于一些最简单的功能附加,比如附加个追踪、混乱等等,并不能通过一通精妙的合成实现一把惊天地泣鬼神的武器,于是自由度就上不去。另一个极端,Noita 在法杖编程的自由度上迈出了一大步,但是其不直观度和高门槛,又将很多玩家拒之门外。

打开网易新闻 查看精彩图片

当然,如果朝着 PoE 的方向做,也是一条路... 上图是 PoE 的技能树。要设计这样的技能体系出来本身也是成本极高的事情。(如果上面技能树图在手机上看不清,别怪我,要的就是这个效果。)

既然前面的作品里面的 build 系统已经做得很棒了,至少三点中占了一点或者两点。AI 要能做出增量价值,就只能 “自由、直观、低门槛” 三者全部做到。这是我们唯一的机会。

好在我们在做 Meshy AI 的过程中,掌握了 “多模态大模型训练” 这一异能。如果我们能够有效建立一套 “游戏机制数据集”,理论上就可以训练模型输出无穷无尽的机制,让玩家每次玩游戏都是一个新体验。

这是一个疯狂的想法,太阳系里面应该还没有人实现这样的事情。我们付诸了实践。经过一段时间的“炼丹”,终于得到了驱动我们的 AI 原生游戏的核心:“AI 游戏机制生成大模型”。

1

言出法随!

(此处省略一万字复杂的技术细节,以后有机会再分享吧...)

“丹” 炼好了以后,我们很快发现,最基本的 “言出法随” 已经可以实现。比如,你可以召唤一群爆破无人机

打开网易新闻 查看精彩图片

或者生成一把激光枪:

打开网易新闻 查看精彩图片

上面两个也许太简单,但是如果的提示词是 “召唤一组激光无人机” 呢?

打开网易新闻 查看精彩图片

当然,如果你希望你走过的地方生成一个黑洞,那也完全没问题:

打开网易新闻 查看精彩图片

如果你写提示词的能力足够强,来个全屏法术也不是梦:

打开网易新闻 查看精彩图片

好的合成应该做到意料之外,情理之中。回过头来看,我们的大模型恰好做到了我们要的三点:

  • 自由:任何输入 AI 都能给你捣鼓出点东西,而且往往有些惊喜(“意料之外”)

  • 直观:由于大模型用自然语言训练,模型自带很多常识,生成出来的东西又不会太离谱(“情理之中”)

  • 门槛低:不需要学习《高阶法杖编程指南》,谁都可以玩(“老少皆宜”)

1

《代号:黑箱》

毫无限制的言出法随只能作为技术 demo,不太能作为最核心的玩法,否则整个游戏将会毫无平衡性可言。另外,大部分玩家会觉得想提示词是一种负担。

团队核心成员都是大菠萝 2 的忠实粉丝,很自然地想到了这类刷子游戏(Loot games)其实可以和我们的大模型结合,允许玩家自由组合道具,合成出自己的武器:

比如,把 C4 炸弹和霰弹枪组合...

打开网易新闻 查看精彩图片

就能做出“散射 C4” 枪:

打开网易新闻 查看精彩图片

再加上回旋镖,就能合成出 “回旋护体弹”:

打开网易新闻 查看精彩图片

当然,如果你愿意再加上一些 “便便” 熏晕敌人,也无妨!

打开网易新闻 查看精彩图片

如果你想再整个放大器的话:

打开网易新闻 查看精彩图片

如果你喜欢法师,也可以玩召唤 + 冰霜流:

打开网易新闻 查看精彩图片

有了打怪采购合成武器提高战斗力打更多怪的核心循环,我们就基于 “AI 游戏机制生成大模型” 得到了一款可玩性很高的游戏,也就是《代号:黑箱》。我们还在游戏开发的早期阶段,下周的 GDC 欢迎大家来 Meshy 展台(展位号:941,找到 Meshy Labs) 试玩。

打开网易新闻 查看精彩图片

预计《代号:黑箱》再过几个月就在 Steam 上线。游戏原生支持中文,欢迎大家在 Steam 搜索Black Box: Infinite Arsenal,加入心愿单!

我们儿时在游戏中自由成长的梦想,有了 AI,今日终于得以实现。

1

AI 原生游戏是未来最重要的事

主策 Robin 和主程 Hao 哥带来了游戏行业的丰富经验,在他们的带飞下,我们快速做出了游戏试玩版;美术同学 ZH 帮忙做了剧情设定,关于 AI 与人类的未来,我们非常喜欢:

我想人类未来的事情很难预测,但是我觉得按照现在 AI 技术的发展,到 2035 年,由于大部分工作都被 AI 干了,只要人类社会不走向《终结者》这种 bad ending,咱们的平均休闲时间一定会大幅提高。因为从过去的 3000 年历史来看:

  • 农业时代,咱每天都得种田,不然就得饿死,那生存压力叫一个大;

  • 工业革命以后,19 世纪早期,大家常见工作14–16 小时/天、每周 6-7 天;

  • 工业革命后期,1926 年福特汽车在美国率先推行每天 8 小时、每周五天的 40 小时工作制;

  • 今天某些欧洲国家已经在推行每周 < 40 小时的工作制。

如果未来 AI 解决了大部分人类的收入、生存问题,大家可以做自己想做的事情了,还有哪些需求是未被满足的?

我想人类最更底层、更纯粹的需求永远需要满足:获得快乐的体验,并在有限的人生活出无限的意义。

而在未来最受欢迎的快乐体验生成工具是什么?一定是 AI 原生的游戏。游戏给人带来的沉浸体验是任何其他媒介做不到的,而 AI,恰好又能让游戏变得更加丰富、有趣。

打开网易新闻 查看精彩图片

1

相信你一定对 AI 游戏这个话题足够热爱,才会看到这里。我们是一支刚刚成立、技术扎实、又非常务实的团队。《黑箱》也还有很多没解决的问题,比如:

  • 平衡性、心流曲线

  • 特效、粒子系统的优化

  • 美术、特效、打击感(战斗策划)优化

  • 扩大AI生成的范围(怪物,地形,关卡目标等等)

  • 多模态 AI 引擎的继续研发

  • (任何你想参与的方向!)

打开网易新闻 查看精彩图片

前面的路不会容易。但是想象一下,AI 作为一个超人游戏设计师,拥有宫本茂的创意和闪电般的实现速度,在你玩第一关的 3 分钟内,已经根据你在关卡中的表现,把第二关光速设计好了,让你永远在玩最好玩的内容,这是一种什么样的体验?如果一个多模态的大模型能够生成风格一致、美轮美奂的环境、音乐、剧情、召唤兽、武器特效甚至敌人,游戏又会发生什么样的质变?

这些也许听起来很超现实,但是按照 AI 的发展速度,这样的未来近在咫尺。

我们就是要去打开这个神秘而又美丽的黑箱。

如果你有丰富的游戏经验,对 AI 只是感兴趣,没关系!我们非常需要你。学习 AI 是快速的,而审美、洞察、解决问题的能力,却是永远稀缺的。

如果你对 AI 很感兴趣,拥有多模态 AI、世界模型等相关经验,热爱游戏,也欢迎你加入我们一起探索游戏的未来。

打开网易新闻 查看精彩图片

为什么选择我们?我们已经是全球领先的 3D 生成式 AI 公司,已有产品 meshy.ai 在海外主要市场的份额超过同行第二名 + 第三名 + 第四名 + 第五名的总和,已经实现了近 4000 万美元的 ARR(年度经常性收入),公司拥有红杉资本、源码资本、GGV、BAI 等国际顶级投资机构的支持。Meshy 产品在技术和商业化的成功为我们带来了完善的技术储备、充足的现金流和外部资金,让我们能够更加激进地探索星辰大海。团队核心成员来自腾讯、网易、FunPlus 等头部游戏公司,拥有丰富的游戏开发经验。我自己作为创始人、CEO,在麻省理工学院取得了计算机图形学博士学位,我的博士论文项目 Taichi 编程语言获得 SIGGRAPH 最佳博士论文提名。(当然,你看我眼镜度数就知道我也是老玩家和老码农了。)

一首小诗收个尾,非 AI,纯手打。这也是我们团队的基因和宣言:

科学,艺术与乐趣

Science, Art & Fun

科学和技术决定我们能做什么;

艺术和品味决定我们不做什么;

乐趣和创意给我们做下去的动力。

加入 Meshy Game Studio

一起探索 AI for Fun!

我们程序、策划、美术、AI 模型训练岗位都在招聘。欢迎感兴趣的同学提交简历到邮箱:meshygames@outlook.com。加入我们,一起探索 AI 与互动娱乐的未来!

点个爱心,再走 吧