来源:市场资讯
(来源:石臻说AI)
石臻说AI
编辑:石臻
OpenAI 刚刚把 Codex 的边界又往外推了一截:它不只是能在 Windows 上跑了,而是开始能“接管”Windows 桌面,并且可以从 ChatGPT 手机端远程发起、查看和接手任务。
这件事看起来像一个平台适配,实际更像是 AI 编程助手从“编辑器插件”走向“个人计算机操作员”的一步。
北京时间 5 月 30 日凌晨,OpenAI 发了一条很短的公告:
Codex 的 Computer Use 现在支持 Windows。这意味着 Codex 不再只是在代码仓库、终端、IDE 里工作,它可以看到并操作 Windows 电脑上的图形界面。
更关键的是,ChatGPT 手机端也接入了 Windows 上的 Codex。你可以在手机上启动任务、查看进度、补充指令、审批操作,让工作继续在 Windows 电脑上跑。
OpenAI 自己也把话说得很克制:这是一个早期体验。但方向已经很清楚了。
以前的 Codex 更像一个很强的程序员同事,坐在你的代码仓库里。现在它开始像一个远程桌面上的执行者:你发一句话,它不只改代码,还能打开应用、点击按钮、复现 GUI 问题、在浏览器里验证结果。
这次更新到底多了什么
先把能力拆开看。
第一,Codex App 已经覆盖 macOS 和 Windows。OpenAI 官方文档里写得很直接:Codex App 是一个桌面端体验,用来并行处理 Codex 线程,带有 worktree、自动化和 Git 功能;现在 Windows 也是它的正式平台之一。
第二,Computer Use 支持 Windows。Computer Use 的含义不是“让 AI 写代码”,而是让 Codex 看见并操作图形界面。比如打开一个桌面应用、测试一个按钮流程、修改某个设置、复现只能在 UI 上出现的问题。
第三,ChatGPT 手机端可以远程控制连接的 Windows 主机。官方远程连接文档里已经更新:你可以用 ChatGPT mobile app 在连接的 Mac 或 Windows 设备上使用 Codex,启动新线程、继续已有线程、发后续指令、审批命令、看 diff、看测试结果和截图。
这三件事放在一起,意思就变了。
它不是“Codex 出了 Windows 版”这么简单,而是 OpenAI 在把 Codex 做成一个跨设备、跨界面、跨工作流的执行层。
为什么 Windows 很重要
如果只是开发者圈层,macOS 已经覆盖了很大一部分 AI 编程用户。但如果你要碰真实世界的电脑工作,Windows 是绕不开的。
大量企业内网、财务系统、运营工具、传统客户端、硬件配套软件、行业软件,都还在 Windows 上。很多工作不是一个 API 调用就能解决,也不是打开 VS Code 改几行代码就结束。
真正麻烦的任务往往长这样:
- 一个老系统只有 Windows 客户端;
- 一个 bug 只在桌面应用里复现;
- 一个表单流程必须在浏览器登录态下跑完;
- 一个设置项藏在多层菜单里,没有命令行入口;
- 一个测试需要看界面变化,而不是只看单元测试结果。
过去这类任务很难交给 AI,因为 AI 没有“手”。它可以告诉你怎么点,但不能替你点。
Computer Use 就是在补这只手。
当然,它现在还不是科幻电影里的全自动电脑管家。OpenAI 明确提醒:Windows 上的 computer use 会在当前前台桌面运行,Codex 会移动鼠标、输入文字、占用当前会话。也就是说,它更适合你把一台 Windows 电脑留给它干活,或者放进虚拟机里跑,而不是在你一边打游戏一边让它偷偷干活。
但这个限制反而说明了一件事:OpenAI 没有把它包装成“无感后台魔法”,而是在按真实操作系统的边界往前推。
手机端的价值被低估了
这次更新里,手机端可能比 Windows 支持本身还值得看。
很多人对“手机控制 Codex”的第一反应是:屏幕这么小,怎么写代码?
但手机端不是让你在地铁里手敲代码。它解决的是另一个问题:AI 任务越来越长,人不可能一直坐在电脑前盯着。
你可以在电脑上把环境配好,把 Codex 跑起来。之后人在路上、饭桌边、会议间隙,用手机看一下:
- 它卡在哪一步;
- 它要不要审批某个命令;
- 测试失败是什么原因;
- diff 有没有跑偏;
- 要不要补一句“别重构,先修最小问题”。
这很像从“人坐在电脑前使用 AI”,变成“电脑留在桌上替人干活,人用手机做监督和调度”。
真正的效率提升不在于手机能写多少代码,而在于它把 AI 任务从电脑屏幕前解放出来。
这不是 IDE 插件战争了
过去一年,AI 编程工具的竞争焦点主要在 IDE 里:补全更准、上下文更长、Agent 更会改代码、PR review 更聪明。
但 Codex 现在走的路线更宽。
它不只是要成为 VS Code 里的一个按钮,而是要成为连接本地文件、终端、浏览器、桌面应用、远程机器、手机端的工作代理。
这个方向和普通 IDE 插件的边界不一样。
IDE 插件擅长在代码上下文里工作;Codex App 则在试图控制“工作发生的环境”。代码只是其中一部分,GUI、登录态、浏览器、测试页面、系统设置也都变成了上下文。
AI 编程的下一步,不是让模型多写几行代码,而是让它进入真实工作现场。
这也是为什么 Windows 支持这么关键。Windows 不是开发者审美里的“优雅平台”,但它是现实世界里大量工作真正发生的地方。
现在能不能放心交给它干活
还不能盲目放心。
Computer Use 的风险比普通代码生成更高,因为它能看屏幕、点按钮、操作浏览器登录态。OpenAI 在官方文档里也强调,要把任务限定清楚,敏感操作要在场,权限提示要认真看。
尤其在 Windows 上,它跑在前台桌面,实际效果更接近“你把鼠标键盘暂时借给 Codex”。这适合自动化复现、测试、检查、低风险操作,不适合让它自由穿梭在支付、账号、安全设置、私密资料之间。
比较稳的用法是:
- 让它打开本地应用复现一个 UI bug;
- 让它用浏览器跑一遍你刚改的页面;
- 让它在 Windows 客户端里检查某个配置;
- 让它做明确、可中断、可回看的小任务;
- 手机端只负责审批、补充指令和验收。
别把它当万能代驾,更像一个可以远程呼叫的实习执行者:能做事,但你得给边界。
真正的信号
这条公告最有价值的地方,不是 Windows 用户终于被照顾到了。
真正的信号是:OpenAI 正在把 Codex 从“写代码的 AI”推向“操作电脑完成任务的 AI”。
桌面端负责环境,手机端负责调度,Computer Use 负责跨过命令行和 API 的边界。等这些能力稳定下来,开发者日常工作流会变得很不一样。
你可能不会一直盯着 AI 写代码。
你会给它分配一个任务,离开电脑,在手机上审批关键节点,回来时看结果、验收、合并。
这就是 Agent 真正进入工作流的样子:不是更会聊天,而是更能接住那些以前必须人坐在电脑前完成的琐碎步骤。
OpenAI 说这是早期体验。没错。
但如果 Codex 能在 Windows 这片复杂、嘈杂、真实的桌面环境里站稳,它的想象空间就不再只是“更强的代码助手”了。
它会开始像一个真正的远程工作代理。
热门跟贴