打开网易新闻 查看精彩图片

哈喽,大家好,小圆这篇评论主要来分析近期游戏AI领域的两大重磅突破,英伟达新模型靠看直播练就游戏通才,以及GPT-5.2在塞尔达谜题中展现的碾压级推理能力,在很多人印象里,AI玩游戏要么靠“开挂”读后台数据,要么只能精通单一游戏。

而这两个新进展彻底打破了这种认知,从看直播学操作到精准破解复杂谜题,游戏AI的进化速度远超预期,更重要的是,这背后藏着的是AI向现实世界迈进的关键逻辑。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

提到AI玩游戏,以前的套路大多是靠读取游戏内部代码,或者依赖专门的传感器获取环境数据,本质上就是“开着上帝视角”在玩,和人类玩家靠视觉观察、手动操作的逻辑完全脱节,但英伟达最新发布的NitroGen模型,彻底颠覆了这种玩法。

当然,它不是随便刷视频,而是专门瞄准了带有手柄叠加画面的直播,就是主播会在屏幕角落放个虚拟手柄,按哪个键,虚拟手柄就会同步亮起的那种,通过分析4万小时这类直播素材,NitroGen把游戏画面变化和手柄按键操作精准对应起来。

打开网易新闻 查看精彩图片

这种“端到端”的学习逻辑,其实就是游戏界的特斯拉FSD,不用中间繁琐的规则设定,直接实现“视觉输入-动作输出”的闭环,这种方式的核心优势就是贴近人类交互逻辑,为AI适应复杂未知环境打下了基础。

打开网易新闻 查看精彩图片

传统游戏AI有个致命缺点,偏科严重,会玩王者荣耀的大概率搞不定超级马里奥,每款游戏都需要单独训练。但NitroGen主打的就是“全能”,通过4万小时直播学习,它覆盖了1000多款不同类型的游戏,不管是动作RPG、横版过关还是Roguelike,都能快速上手。

这个测试的意义远超游戏本身,它证明顶尖AI已经具备复杂的前瞻性规划能力,这种能力正是自主智能体的核心,以前我们觉得游戏攻略得靠人类总结,但现在AI既能玩得好,又能精准规划操作,未来AI自动生成攻略、甚至修复游戏Bug都不是空想。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

可能有人会问,英伟达花这么大力气做游戏AI,难道就是为了做更厉害的NPC?其实格局远不止于此,NitroGen是基于英伟达的GR00T机器人基础模型构建的,这就说明,游戏场景只是AI的练兵场,最终目标是让AI掌握现实世界的交互能力。

这里的逻辑很简单:游戏里的看到悬崖-知道会掉下去-控制手柄跳跃,对应到现实就是看到水坑-知道会滑倒-控制机器人抬腿跨过,游戏世界提供了丰富的视觉环境、复杂的物理规则和明确的任务目标,而且数字化、可扩展的特性让AI能快速积累海量交互经验。

打开网易新闻 查看精彩图片

未来的通用智能体很可能是分层架构:顶层是GPT-5.2这类推理模型,负责长程规划和指令理解;中层是NitroGen这类通用策略模型,把高层指令转化为具体动作;底层是GR00T这类控制器,负责精准执行动作。

从英伟达NitroGen看直播学游戏,到GPT-5.2秒杀塞尔达谜题,游戏AI的突破不仅让我们看到了更智能的娱乐体验,更揭示了AI走向现实的清晰路径,游戏不再只是娱乐载体,而是人类为AI构建的成长摇篮,更理解了基础的物理规则和交互逻辑。

打开网易新闻 查看精彩图片

当前技术还存在明显短板:缺乏触觉反馈让AI无法感知物体重量和表面光滑度,高精度操作能力不足限制了其在精密场景的应用,而安全性和伦理问题更是通用智能体落地的关键前提,这种“虚拟反哺现实”的技术路径,为具身智能的发展提供了极具可行性的方向。

这些突破的核心价值,在于让AI逐渐跨越莫拉维克悖论,从擅长逻辑推理的大脑,成长为能灵活应对物理世界的完整智能体,当这些在游戏中毕业的AI走进现实,或许真的能帮我们处理家务、完成工业作业,而这一切的起点,就是那些我们以为只是用来消遣的游戏画面。

打开网易新闻 查看精彩图片