智东西4月17日报道,今天,OpenAI宣布更新Codex,新增了针对于Mac用户的光标级后台交互功能、内置应用内浏览器、集成gpt-image-1.5、新增90余款插件等,此外,该公司还升级了Codex的自动化能力,加强了记忆功能,支持复用对话线程与上下文,可自主排期并自动唤醒执行长期任务,并能基于上下文主动为用户提供后续操作建议。
▲OpenAI官宣更新(图源:X)
此次Codex更新的最大亮点,是OpenAI给每一位Mac用户配了个专属“AI打工人”,它能直接在用户的电脑上帮忙干活。即便用户在手动操作,它也能在后台默默同步忙活,完全不耽误用户正常使用其他软件。
据美国科技媒体VentureBeat报道,OpenAI的产品管理总监卡弗里・林奇(Kavvy Lynch)称:“(Codex)它可以在后台使用你电脑上的应用,而不是接管整台电脑的操作。”
可以理解为,属于Mac用户的专属AI助手来了。
开发者日常工作中大量时间被协调沟通与信息搜集占据,真正投入编程创作的精力相对有限。此次OpenAI对Codex进行升级,旨在通过让它更深度接入操作系统与开发者工具生态,从而解放开发者,使开发者们能优先将精力专注于真正需要创造力和思考的核心任务上。
Codex本次新增的各项功能已直接整合至用户现有的ChatGPT账号内,无需额外配置API密钥即可使用。等于说,以前用户可能得懂一点编程知识才能解决API的接入问题,而现在,用户可以跳过这类繁琐配置步骤,直接使唤Codex,让它生成想要的应用程序。
目前,更新后的Codex已上线,即日起所有通过ChatGPT登录Codex桌面应用的用户均可获取。该应用同时支持macOS与Windows系统,具体功能将分批次逐步开放。后台电脑操控功能在初期仅支持macOS系统,并将很快向欧盟与英国用户推出。
博文链接:
https://openai.com/index/codex-for-almost-everything/
一、新增Computer Use功能,Codex在后台就能帮你干完活
本次Codex更新的版本关键的技术是计算机使用(Computer Use)功能,这个功能能让Codex突破传统聊天机器人的限制,在你的设备全量应用中进行查看、点击和输入的操作。更重要的是,这一切均在后台完成。
也就是说,Codex现在可以像人一样看着屏幕操作软件。它能看懂、思考然后执行操作。此外,多个智能体可在Mac上同时运行,并不会影响你在其他程序中的正常操作。
Windows用户仍可使用并获得官方支持的核心Codex桌面应用,也可从Windows应用中提取信息并在Codex内展示,但此次更新的Codex上线初期暂不支持和MAC平台一样的光标级后台交互功能。
二、化身统一工作台,新增多场景功能借插件生态打通全工具链
除了系统级操控能力外,OpenAI继续加码,将Codex应用升级成类似于一个统一的工作台,覆盖从GitHub拉取请求审阅到远程基础设施管理等全流程。更新后的Codex及其应用也能够在更大范围的场景中工作。
为覆盖开发者全流程工作流,更新后的Codex新增了多项关键功能,其中包括:
1、内置浏览器:开发者可以直接在应用内浏览器页面上添加评论,为智能体提供更精准的指令。
2、视觉基础能力:通过集成gpt-image-1.5,结合屏幕截图和代码,有助于Codex在同一工作流程中创建产品概念、前端设计、模型和游戏的视觉效果。
3、扩展侧边栏:应用新增PDF、电子表格、幻灯片等非代码文件的丰富预览功能,同时配备摘要面板,用于追踪智能体计划与信息来源。
4、终端与SSH:更新后的Codex支持多终端标签页,并上线了SSH连接远程开发环境的阿尔法测试功能。
此外,为串联这些分散任务,OpenAI为Codex新增了90余款插件,包括Atlassian Rovo、CircleCI及GitLab Issues等开发工具,这些插件整合了技能、应用集成和MCP服务器,为Codex提供了更多跨工具收集上下文信息和执行相关操作的方式。
VentureBeat援引安布罗斯诺的观点称:“你可以通过@提及指定应用让Codex使用,若不指定,Codex也可自行判断该使用哪些应用。”
三、支持长期任务后台执行,增强记忆功能并可主动建议优化工作流
OpenAI还扩展了Codex的自动化功能。它支持复用现有对话线程并保留已构建的上下文信息。Codex能自动唤醒以继续执行跨天乃至跨周的长期任务,还可以自主安排后续任务操作。
简单说,Codex现在能记住之前的对话和任务进度。和以前“说一句动一下”的挤牙膏干活方式不同,这次更新后它能记住上下文,同时给自己的工作“排班”。比如晚上你睡觉了,它的上班时间到了,于是它便自动唤醒接着干活。
此外,Codex记住你的指令后,可跨天或者跨周自动调度,在后台持续执行并断点恢复,不用你每天重复发指令,它能一直执行到将任务做完。
以产品经理(PM)的日常工作为例,以往他们需要频繁在Slack、邮件与Notion文档间切换,并手动将信息同步给开发团队,复制粘贴工作量繁重。
而借助Codex的自动化能力,当Slack收到新需求、Gmail接收到邮件或者Notion文档发生更新时,它可自动抓取并整合相关信息,融入开发流程,省去PM频繁切换应用的繁琐操作,为其提升工作效率,节省部分精力。
按照这个逻辑,开发团队可以借此部署他们想要的智能体。用Codex自动打理各种杂事,不用自己手动一个个去打开同步。
值得一提的是,为了使前文提到的Codex自动化功能效率加快,OpenAI还推出了记忆功能预览版。
Codex会记住历史交互中的关键信息,比如记住用户偏好、历史修正内容与搜集到的信息,减少每次新会话中大量自定义指令的需求,以提高处理效率。
除了完成你的指令之外,Codex还会主动建议接下来可以继续做什么。通过结合上下文、查找已关联插件和记忆信息,它可以帮你规划一天的工作起点,或提示你上一个项目该从哪里继续。
比方说,Codex可以找出Google Docs里需要你处理的评论,从Slack、Notion和编码库中提取相关信息,为你生成按优先级排序的待办清单。
结语:技术不断升级,人机协同边界持续拓展
此次Codex的全面升级,是OpenAI在AI开发助手领域的一次能力延伸。通过为macOS打造Computer Use功能的agent逻辑,让AI从简单的对话交互向全流程自动化、上下文智能协同这一趋势演进。
不过,本次OpenAI推出的各项Codex新功能仍处于早期预览阶段,后续的体验与生态完善仍有待持续观察。
在这次Codex更新前,Anthropic Claude就于今年3月在其桌面端产品Claude Code与Claude Desktop中,推出了与Computer Use直接对标的能力体系,同时支持开箱即用,用户下载客户端就能体验。
当前,随着AI持续渗透操作系统与开发工具链,相关技术整体朝着更自动化的智能助理方向发展。在这一趋势下,开发者工作中的低效重复环节将被持续简化,人机协同的边界在未来或也将得到进一步拓展。
热门跟贴