你的AI助手突然有了"安全屋"——能跑代码、能试错,还不用你操心环境配置。OpenAI这次更新,瞄准的正是开发者最头疼的落地难题。

沙盒:让AI从"嘴炮"变"动手"

打开网易新闻 查看精彩图片

内置沙盒执行环境,意味着AI生成的代码可以直接运行验证。不是输出完就完事,而是真跑起来、看结果、再迭代。这对需要处理数据、调用API的自动化任务来说,省去了本地配环境的麻烦。

Harness:模型自己管执行

模型原生执行框架(Harness)把调度权交给模型本身。传统流程是人写死步骤,现在模型根据任务动态决定怎么调用工具、什么时候停。灵活性上去了,但也对模型的"自我认知"提出了更高要求。

一个务实信号

OpenAI没追更大的模型参数,反而打磨工程层。说明Agent赛道已从"炫技"进入"交付"阶段——能稳定跑起来的工作流,比单次惊艳的演示更有商业价值。

但问题是:当模型既当裁判又当运动员,调试和追责会不会变得更麻烦?