Genie 3技术升级
谷歌DeepMind于2025年8月5日正式发布第三代AI世界模型Genie 3。该模型在实时交互与场景一致性上实现突破,支持720p画质输出,并能维持数分钟的稳定模拟,较前代Genie 2的360p画质和60秒极限时长显著提升。
核心功能突破
新模型引入“可触发世界事件”功能,用户或AI代理可通过文本指令实时修改模拟环境状态。例如,在演示中,系统能根据指令在滑雪场景中动态添加鹿群。尽管动作真实性仍有改进空间,DeepMind认为此功能将大幅提升AI训练效率。
应用前景与局限
DeepMind研究团队表示,Genie 3旨在为自动驾驶等AI系统提供复杂场景训练,例如模拟行人避让等“假设性情境”。但模型目前存在文本渲染缺陷,且需将模拟时长从分钟级延长至小时级才能满足实际需求。
后续计划
目前Genie 3尚未开放公众使用,但DeepMind计划扩大测试范围。研究科学家Jack Parker-Holder指出,即使当前版本存在不足,其已能帮助识别AI代理的不安全行为,为迭代优化提供关键数据。
(信息来源:Engadget 2025年8月5日报道)
参考链接:
https://www.engadget.com/ai/google-deepminds-genie-3-can-dynamically-alter-the-state-of-its-simulated-worlds-140052124.html
热门跟贴