开发AI代理的工程师们最近迎来了一个好消息。OpenAI Agents SDK新增了沙盒执行功能,同时引入了一套模型原生的运行时框架——这意味着过去需要自行拼凑的容器、状态管理、工具路由等模块,现在被整合进了官方工具链。

这套SDK的核心变化可以概括为两点:隔离执行环境与自动化编排层。

打开网易新闻 查看精彩图片

沙盒部分给代理提供了一个类Unix的隔离工作空间。代理可以在其中运行代码、执行shell命令、操作文件系统,还能安装软件包、克隆Git仓库。更实用的是,它支持挂载外部存储(S3、GCS、R2等),暴露网络端口,并且状态可快照、可恢复。如果会话中断,可以从序列化的状态点继续运行。

模型原生运行时(model-native harness)则是另一个关键设计。它负责工具分发、多步骤执行、状态持久化和流式响应。当模型调用shell或file_read等工具时,harness自动路由到对应的沙盒工具;对话状态、工具结果、工作空间状态在多次模型交互间保持连续;代理循环可以跨轮次持续,每一步都可观察、可取消。

值得注意的是架构上的刻意分离:harness掌控控制平面(模型调用、工具路由、审批逻辑),沙盒负责执行平面(文件、命令)。这种解耦让同一套代理定义可以部署在不同环境——本地Unix开发环境、Docker容器,或是Cloudflare、Vercel等托管平台——而无需重写代码

在此之前,构建能安全执行代码的生产级代理,开发者需要自行整合:模型API客户端、容器运行时、凭证隔离、状态持久化、工具路由、审批逻辑。每个环节都是定制代码。现在的SDK把这些压缩成一份清单:描述工作空间、附加能力(shell、文件系统、技能、内存)、选择沙盒客户端,harness处理模型交互之间的所有事务。

根据OpenAI文档的定位,这套SDK面向的是"服务器拥有编排权、工具执行权、状态和凭证"的场景——即代码优先的集成路径,而非完全托管的SaaS方案。