打开网易新闻 查看精彩图片

哥们最近刷了这么一个游戏视频,直接被震撼到了。

光看操作,大伙可能觉得,啥玩意操作,我上我也行。

但让世超震惊的点在于,画面里的操作,全都是由一个 AI 模型独立主动完成的,而且是你给它啥游戏就打啥,无缝切换,我连教都不用教。。

这个模型,就是英伟达新发布的,号称啥游戏都能玩的通用游戏模型,名字叫NitroGen

好家伙,老黄卖我游戏卡还嫌不够,还要让AI来跟我抢游戏玩是吧。

我看了很多网友的第一反应,就是:这外挂好啊,拿来打王者吃鸡,原神崩铁,甚至旮旯game,谁还打得过我?

打开网易新闻 查看精彩图片

但,觉得没意义的人也挺多的,我打工买了游戏还要给AI打,那不成给AI打工的了吗?

打开网易新闻 查看精彩图片

但不管怎么说,实力这玩意是明牌的。作为公司的游戏高手,世超已经感到手痒难耐了。

而且,他们把这个模型开源了,包括模型权重和数据集,大伙都能下载下来并安装到自己电脑上。

打开网易新闻 查看精彩图片

于是,世超赶紧下到了公司电脑上,想跟大伙一起来会会它的实力到底如何。

我随便开了几个游戏,结果发现,它真没骗人,确实有点操作。

这是 AI 在夜之城中被人追杀的精彩片段,它像开了自瞄,完成了反杀。

打开网易新闻 查看精彩图片

这是 AI 操作我的手柄,挑战黑神话悟空的珍贵画面,操作比我还6,渴了会喝药,挨打会翻滚,甚至知道技能衔接普攻。

打开网易新闻 查看精彩图片

这是 AI 在操作我的空洞骑士,平台跳跃也像德芙般丝滑。

打开网易新闻 查看精彩图片

它甚至能扮演双人游戏的 Player2,跟我来一局茶杯头,会躲避敌人还会捡金币。

蓝的是AI

打开网易新闻 查看精彩图片

不是,你真会啊?

但在我们继续深度测试了一段时间后发现,帮人类打游戏这事儿,好像没想象中那么简单啊。

在黑神话里,它的确能打过 Boss ,但这建立在我装备拉满的基础上,其实它也经常丢失锁定,空技能。

打开网易新闻 查看精彩图片

而在赛博朋克2077里,上面放的也只是几个比较像顿悟了的精彩镜头,其实常态是开车撞墙,走路瞄地,到处乱射。

打开网易新闻 查看精彩图片

茶杯头里,它也经常跟不上我的节奏,我还得边走边扶着它往前走。。

打开网易新闻 查看精彩图片

所以,测完一圈游戏后,俺的感受是,它的水平不高,但懂得大多数游戏的基本操作,了解基本机制,就像一个刚拿到手柄的小孩,能拿着手柄跑跑图,杀杀小怪,但遇到 Boss 就要被虐了。

而且,它只能玩能用手柄操作的游戏,因为它的训练数据都是用手柄操作的。

可能有些朋友要有点失望了,什么帮人打游戏,又是来吹牛的。

但世超觉得,即使做到这一步,也很难了,这意味着大多数游戏,它都能操作两下子,这说明模型的泛化能力非常强。

像之前很多打游戏的AI,像OpenAI能打过刀塔世界冠军的OpenAI Five,或者字节能玩原神的智能体之类的,基本都是对某一个游戏进行特训,所以这些 AI 的上限,就是只会打某一个游戏,甚至某一个关卡。

打开网易新闻 查看精彩图片

英伟达这玩意,是真的和人一样,摸两把新游戏就能上手操作的。

世超很好奇这模型是咋训练出来的,于是去翻阅了下 NitroGen 的官网和论文。

结果,他们用了一个你能想到最简单的方式,让AI看录像。他们直接找到了互联网上现成的 40,000 小时游戏视频,涵盖了超过 1,000 款游戏。

打开网易新闻 查看精彩图片

为了凑齐这些素材,英伟达一共收集了 38739 个视频,平均每个视频的时长都达到了 1 小时 50 分钟左右 。

其中,动作 RPG 是绝对的大头,占了总时长的 34.9%,这也难怪,它玩黑神话看上去还有模有样的。。

紧随其后的是占了 18.4% 的平台跳跃类游戏,也怪不得空洞骑士里能跳得那么丝滑。。

剩下的则是动作冒险、体育,甚至类银河战士恶魔城、肉鸽和吃鸡类也榜上有名。

但,AI不像咱们人类,看了就能学会,因为它没手啊。

所以为了让AI学得更轻松,英伟达特意选择了带手柄指示器的游戏视频,就是为了让AI知道,如果看见这种画面,手柄应该按什么键,摇杆推多少,游戏才能继续下去。

打开网易新闻 查看精彩图片

为了完成这件事,英伟达炼了一个专门分析图标的小模型,然后用算法把每一帧画面的按键动作硬生生抠了出来。

然后再训练 AI 看图操作,比如看见车头卡住,就意味着应该拉手柄上的摇杆,倒车了。

从某种意义上,它就是一个看了无数直播、自学成才的顶级云玩家。

我们用它打游戏时,它会疯狂截屏,然后把当前屏幕状态交给AI分析,然后根据当前屏幕的战况,让AI决策下一步的操作。

但在我们实测的过程中,我们还发现了一个问题,就是AI打游戏的时候,画面怎么是一卡一卡的?

打开网易新闻 查看精彩图片

我知道,是子弹时间!对AI来说,一帧能玩,两帧流畅,三帧就能打电竞。

诶,并非如此。其实这是英伟达故意设计的,因为在打游戏时,让AI看屏幕,再推理下一步的操作,非常吃算力,AI 的脑子根本转不了游戏那么快。

为了让它能控制市面上任何一款商业游戏,英伟达开发了一个,能直接拦截游戏里系统时钟的工具。

如果 AI 没算好下一步的操作,程序的底层代码就会发力,直接让游戏时间暂停;AI 算好了,游戏才会继续下一帧。

AI 其实是用这种方式,强行把所有游戏变成了回合制:游戏走一步,等它思考一会,再走下一步。如果你去代码里,强行关掉这个减速挂,它就会因为反应不过来而像失去了智力,瞬间红温开摆。

打开网易新闻 查看精彩图片

而且论文也说,NitroGen 只训练了它的下意识反应,也就是我们常说的肌肉记忆。

它脑子其实很简单,看见有人打它,不是躲避就是反击,没什么规划能力,像什么玩战术啊,逃课啊都太难了,它只有对每一帧的条件反射。

这也是为啥,它经常会在不需要跳的地方乱跳,或者对着空气挥剑。

打开网易新闻 查看精彩图片

最后,对咱游戏玩家来说,可能会更关注它的游戏能力。但其实对科研人员来说,它的价值不在于通关,而在于“通用”。

NitroGen 虽然菜,但它不挑食。随便给它游戏,它虽然玩得烂,但它能动起来,而且知道哪个键是跳,哪个键是打,哪个是敌人。

英伟达自己也说了,真正的目的不是帮你开挂,是为了造福机器人的研究。

打开网易新闻 查看精彩图片

如果每个机器人刚出厂,天生就知道“遇到台阶要跳”、“看到杯子要伸手”,跟人类的条件反射一样,就相当于给机器人赋予了直觉,倒了知道爬,疼了知道躲,训练起来就会轻松很多。

正如英伟达机器人总监 Jim Fan 所说,他们想做的是通用型机器人,不仅能搞定现实世界的物理规律,还能适应虚拟世界里的各种规则。

哪怕它现在还像个三岁小孩,但每一个顶级高手,都是从菜鸡练起来的。

总之,这玩意是个有研究价值的科研项目,感兴趣的朋友可以下载跑一跑;但如果你只是想找个挂帮你打游戏,那还是洗洗睡吧,还不如让你亲戚家小孩来呢。

撰文:不咕

编辑:江江&面线

美编:焕妍

图片、资料来源

NitroGen,BiliBili,YouTube

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片