现在,你等咖啡的时候,也能用来处理电脑上的工作了。
最近一个月,OpenAI 持续给 Codex 增加新的能力,先是桌面后台自主运行,实时展示状态、情绪价值拉满的桌面宠物,再是 Chrome 扩展进入浏览器实时对话。今天,Codex 又能连接上手机了。
OpenAI 宣布把 Codex 带到手机端,已集成进 ChatGPT App,iOS 和 Android 全量计划用户都可预览使用。
那些原本在电脑的 Codex 应用中才能进行的工作流,查看实时运行环境、审阅输出、批准命令、切换模型、发起新任务等,都可以在手机上就搞定。
我不是只能用来写代码
很多人听到 Codex 的第一印象,大概是一个专门面向开发者的应用,甚至可能是像 VS Code 那种单纯的本地开发环境,点开就是一脸懵的代码。
但其实现在的 Codex 可以说是 OpenAI 的一个 Agent 产品,它不仅能满足开发者的需求,即便是 ChatGPT 里的那些日常任务,简单的问答、使用 GPT Image 2 生图、初步的深度研究,用 Codex 也能做。
从 ChatGPT 官网顶部的左侧边栏,点击 Codex 进入介绍页面,不用被「连接到 GitHub」给吓到,还有上面的 CLI、什么 IDE 扩展程序,以及底部的终端之类的词语。
我们只需要下载应用,点击下载 macOS 版,像正常的应用安装程序一样。
打开 Codex,和网页版的 ChatGPT 布局基本一样,左边是不同的项目和单独的对话,右边是一个举重的对话框,我们可以输入问题或请求,选择不同的模型,直接发送给它。
例如直接要求它生成一张微信公众号的封面图片,然后在对话中进行修改。
或者对一份英文的播客文档,翻译成中英双语逐字稿,并且总结对应的播客内容。
这些原本通过 ChatGPT 完成的工作,在 Codex 上的使用体验一样不赖。
而 Skill、Computer Use、定时任务,这些其他 Agent 常见的功能,也可以通过斜线直接唤起不同的指令或使用对应的技能。
Codex 的插件页面,还提供了点开即用的方式,针对一些常用的技能,像前段时间刚刚更新的 Chrome 插件,以及几乎是所有本地 Agent 产品都在主打的 Computer Use。
切换到技能界面,Codex 会将本地安装的 Skill 都放在一个管理界面,我们能搜索、创建不同的技能。
一般情况下,如果要求 AI 处理的内容,以及有一个本地的文件夹,Codex 的做法是可以直接使用现有文件夹作为项目的上下文。
如果一个问题不足以构成一个项目,直接开启一个「新对话」,也不会影响 Codex 的表现。
也就是说,早期的 ChatGPT 交互更像是一个问答机,一问一答,几秒钟出结果。但现在 Agent 和 AI 工作流的发展,我们越来越多的任务变成了「长线任务」,此时 Codex 和各类 Agent 会是更好的选择。
不用连接到飞书微信,手机上就用 ChatGPT
年初龙虾刚爆火的时候,它能接入到各种各样的聊天软件里,企业微信、飞书、QQ,甚至微信都在推进,通过手机 APP 就能控制电脑上的龙虾。
远程控制成了电脑本地 Agent 一项必不可少的功能。尽管能接入到微信、飞书,但这些聊天软件还是有一个硬伤,它们没办法开启多线程,永远只有一个机器人的对话窗口。
Codex 的解决办法是在 ChatGPT 的 APP 内放下了完整的 Codex,但所有关于 Codex 的项目都不在手机上运行。
它跑在我们的电脑或者远程服务器上。手机是一个「控制面板」,我们可以用它查看进度、给指令、审批操作,但实际的代码读取、测试执行、文件修改,全都发生在本地的电脑上。
我们可以在手机上查看并进入不同的 Codex 项目/对话,在手机上进行的对话会自动同步到电脑 Codex 应用上,不会丢失任何项目的上下文。
开启 Codex 移动版也非常简单,桌面端的 Codex 应用和手机端的 ChatGPT 用同一个账号登录,打开 Codex 一般会有首页弹窗提醒我们配置,按照电脑上的提示,认证设备之后,就能连接上。
上下滑动查看更多内容
我们在桌面上开的任务线程,手机上现在都能直接看到,并且实时更新。
最简单的就是让它读取一下电脑上的文件,前提是已经让 Codex 获取了本地电脑里对应文件夹的权限。
能直接读取电脑上的文件
我们直接要他看看下载文件夹里,有些什么内容,并显示其中一张截图。
手机上也能让 Codex 使用 FFmpeg 库来处理多媒体文件
接着让他把视频加速处理转成只有 30s 的版本,它都能利用本地电脑的能力来进行处理。
对电脑上的本地文件处理是基本操作了,在 Agent 任务上,有了这项功能,我们可以随时查看任务进度。
和第三方聊天工具只发一个「状态:运行中」不同,在手机上,我们能看到真实的执行内容,终端输出、截图、测试结果、文件差异对比,电脑上能看到的那些,手机上都有。
之前我们说 Agent 能执行长任务很好,但是过一会儿就要去点一个「同意」、「继续」,现在通过手机端 ChatGPT,我们也能在关键节点给出指令,不需要用电脑响应。
如果这个弹窗未来可以上灵动岛,那就更方便了。收到通知的时候,ChatGPT App 直接在灵动岛显示 ✅ 或者 ❌。
处理响应这些需要我们决定的节点,我们还可以主动发起新任务。
在手机的 Codex 界面里,可以开新的线程,就像在桌面上一样。描述你想做什么,任务就开始在你的电脑上跑了。
不过,如果要创建一个新项目,使用新的文件夹,这里需要注意,不单是输入文件夹目录名,而是需要将完整的文件夹路径都写上去。
当项目新建之后,Codex 也会在我们的本地电脑上创建一个同名文件夹。
对个人用户来说,随时查看任务进度、在关键节点给出指令、以及主动发起这三项功能,基本上已经把桌面端 Codex 的能力搬到了手机上。
我们不需要等回到电脑面前,也不需要重开任务,直接在手机上的 Codex 对话里说,它就能同步调整并执行。
桌面端会同步对应的项目,同时快速实现了一个桌面小宠物的 APP
而针对更专业的开发者,OpenAI 还更新了远程控制的 Remote SSH,即 Codex 现在可以直接连到公司的远程开发环境。
很多公司的开发不是在本地做的,而是在一台配好了所有依赖、权限、凭证的远程服务器上。
以前 Codex 要在这种环境里工作,需要一些绕路的办法。现在 Remote SSH 正式可用,Codex 可以直接以 SSH 连接的方式在远程机器工作。
这段时间以来,OpenAI 在奋力追赶 Anthropic 在 Claude Code 方面的工作,而 Anthropic 则是不断从社区去找到灵感,把开发者社区里一些有意思的小功能不断变成自己的产品卖点。
随着功能和形态都越来越成熟,身边已经没有几个人在说要装龙虾了。
OpenAI 的 Codedx 和 Anthropic 的 Claude Code,就这样一点一点慢慢把「龙虾」有的能力复制过来,接下来就是看谁做出的产品体验更好了。
对我们来说,这确实是一件好事。开源项目有自己的优点,但商业化运营的产品始终要更稳定和易用。而在 Claude Code 和 Codex 之间的选择,大概率又会是 Claude Code 号被封,Codex 胜。
我们正在招募伙伴
简历投递邮箱hr@ifanr.com
✉️ 邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)
热门跟贴