来源:市场资讯

(来源:石臻说AI)

打开网易新闻 查看精彩图片

石臻说AI

编辑:石臻

OpenAI 刚刚把 Codex 的边界又往外推了一截:它不只是能在 Windows 上跑了,而是开始能“接管”Windows 桌面,并且可以从 ChatGPT 手机端远程发起、查看和接手任务。

这件事看起来像一个平台适配,实际更像是 AI 编程助手从“编辑器插件”走向“个人计算机操作员”的一步。

打开网易新闻 查看精彩图片

北京时间 5 月 30 日凌晨,OpenAI 发了一条很短的公告:

Codex 的 Computer Use 现在支持 Windows。这意味着 Codex 不再只是在代码仓库、终端、IDE 里工作,它可以看到并操作 Windows 电脑上的图形界面。

更关键的是,ChatGPT 手机端也接入了 Windows 上的 Codex。你可以在手机上启动任务、查看进度、补充指令、审批操作,让工作继续在 Windows 电脑上跑。

OpenAI 自己也把话说得很克制:这是一个早期体验。但方向已经很清楚了。

以前的 Codex 更像一个很强的程序员同事,坐在你的代码仓库里。现在它开始像一个远程桌面上的执行者:你发一句话,它不只改代码,还能打开应用、点击按钮、复现 GUI 问题、在浏览器里验证结果。

这次更新到底多了什么

先把能力拆开看。

第一,Codex App 已经覆盖 macOS 和 Windows。OpenAI 官方文档里写得很直接:Codex App 是一个桌面端体验,用来并行处理 Codex 线程,带有 worktree、自动化和 Git 功能;现在 Windows 也是它的正式平台之一。

第二,Computer Use 支持 Windows。Computer Use 的含义不是“让 AI 写代码”,而是让 Codex 看见并操作图形界面。比如打开一个桌面应用、测试一个按钮流程、修改某个设置、复现只能在 UI 上出现的问题。

第三,ChatGPT 手机端可以远程控制连接的 Windows 主机。官方远程连接文档里已经更新:你可以用 ChatGPT mobile app 在连接的 Mac 或 Windows 设备上使用 Codex,启动新线程、继续已有线程、发后续指令、审批命令、看 diff、看测试结果和截图。

这三件事放在一起,意思就变了。

它不是“Codex 出了 Windows 版”这么简单,而是 OpenAI 在把 Codex 做成一个跨设备、跨界面、跨工作流的执行层。

为什么 Windows 很重要

如果只是开发者圈层,macOS 已经覆盖了很大一部分 AI 编程用户。但如果你要碰真实世界的电脑工作,Windows 是绕不开的。

大量企业内网、财务系统、运营工具、传统客户端、硬件配套软件、行业软件,都还在 Windows 上。很多工作不是一个 API 调用就能解决,也不是打开 VS Code 改几行代码就结束。

真正麻烦的任务往往长这样:

  • 一个老系统只有 Windows 客户端;
  • 一个 bug 只在桌面应用里复现;
  • 一个表单流程必须在浏览器登录态下跑完;
  • 一个设置项藏在多层菜单里,没有命令行入口;
  • 一个测试需要看界面变化,而不是只看单元测试结果。

过去这类任务很难交给 AI,因为 AI 没有“手”。它可以告诉你怎么点,但不能替你点。

Computer Use 就是在补这只手。

当然,它现在还不是科幻电影里的全自动电脑管家。OpenAI 明确提醒:Windows 上的 computer use 会在当前前台桌面运行,Codex 会移动鼠标、输入文字、占用当前会话。也就是说,它更适合你把一台 Windows 电脑留给它干活,或者放进虚拟机里跑,而不是在你一边打游戏一边让它偷偷干活。

但这个限制反而说明了一件事:OpenAI 没有把它包装成“无感后台魔法”,而是在按真实操作系统的边界往前推。

手机端的价值被低估了

这次更新里,手机端可能比 Windows 支持本身还值得看。

很多人对“手机控制 Codex”的第一反应是:屏幕这么小,怎么写代码?

但手机端不是让你在地铁里手敲代码。它解决的是另一个问题:AI 任务越来越长,人不可能一直坐在电脑前盯着。

你可以在电脑上把环境配好,把 Codex 跑起来。之后人在路上、饭桌边、会议间隙,用手机看一下:

  • 它卡在哪一步;
  • 它要不要审批某个命令;
  • 测试失败是什么原因;
  • diff 有没有跑偏;
  • 要不要补一句“别重构,先修最小问题”。

这很像从“人坐在电脑前使用 AI”,变成“电脑留在桌上替人干活,人用手机做监督和调度”。

真正的效率提升不在于手机能写多少代码,而在于它把 AI 任务从电脑屏幕前解放出来。

这不是 IDE 插件战争了

过去一年,AI 编程工具的竞争焦点主要在 IDE 里:补全更准、上下文更长、Agent 更会改代码、PR review 更聪明。

但 Codex 现在走的路线更宽。

它不只是要成为 VS Code 里的一个按钮,而是要成为连接本地文件、终端、浏览器、桌面应用、远程机器、手机端的工作代理。

这个方向和普通 IDE 插件的边界不一样。

IDE 插件擅长在代码上下文里工作;Codex App 则在试图控制“工作发生的环境”。代码只是其中一部分,GUI、登录态、浏览器、测试页面、系统设置也都变成了上下文。

AI 编程的下一步,不是让模型多写几行代码,而是让它进入真实工作现场。

这也是为什么 Windows 支持这么关键。Windows 不是开发者审美里的“优雅平台”,但它是现实世界里大量工作真正发生的地方。

现在能不能放心交给它干活

还不能盲目放心。

Computer Use 的风险比普通代码生成更高,因为它能看屏幕、点按钮、操作浏览器登录态。OpenAI 在官方文档里也强调,要把任务限定清楚,敏感操作要在场,权限提示要认真看。

尤其在 Windows 上,它跑在前台桌面,实际效果更接近“你把鼠标键盘暂时借给 Codex”。这适合自动化复现、测试、检查、低风险操作,不适合让它自由穿梭在支付、账号、安全设置、私密资料之间。

比较稳的用法是:

  • 让它打开本地应用复现一个 UI bug;
  • 让它用浏览器跑一遍你刚改的页面;
  • 让它在 Windows 客户端里检查某个配置;
  • 让它做明确、可中断、可回看的小任务;
  • 手机端只负责审批、补充指令和验收。

别把它当万能代驾,更像一个可以远程呼叫的实习执行者:能做事,但你得给边界。

真正的信号

这条公告最有价值的地方,不是 Windows 用户终于被照顾到了。

真正的信号是:OpenAI 正在把 Codex 从“写代码的 AI”推向“操作电脑完成任务的 AI”。

桌面端负责环境,手机端负责调度,Computer Use 负责跨过命令行和 API 的边界。等这些能力稳定下来,开发者日常工作流会变得很不一样。

你可能不会一直盯着 AI 写代码。

你会给它分配一个任务,离开电脑,在手机上审批关键节点,回来时看结果、验收、合并。

这就是 Agent 真正进入工作流的样子:不是更会聊天,而是更能接住那些以前必须人坐在电脑前完成的琐碎步骤。

OpenAI 说这是早期体验。没错。

但如果 Codex 能在 Windows 这片复杂、嘈杂、真实的桌面环境里站稳,它的想象空间就不再只是“更强的代码助手”了。

它会开始像一个真正的远程工作代理。

  • Codex App 官方文档:https://developers.openai.com/codex/app
  • Codex Remote Connections 官方文档:https://developers.openai.com/codex/remote-connections
  • Codex Computer Use 官方文档:https://developers.openai.com/codex/app/computer-use