当一家估值1570亿美元的公司说"我们在公开构建超级应用",它实际交付的却是另一套工具——这中间的落差,藏着OpenAI最真实的战略焦虑。
6月16日,OpenAI发布Codex重大更新。没有兑现传闻中的桌面超级应用,但111个新插件、内置浏览器、图像生成器和双轨记忆系统,共同指向一个被刻意模糊的目标:把开发者变成第一批"超级应用"的原住民。
伏笔一:计算机操控,但不吃光你的算力
Codex现在能直接操作你电脑上的其他应用。提示时可以点名指定程序,也可以让它自己判断最优工具。
这不是Claude Cowork首创的功能。OpenAI的差异化赌注押在一套自研的"秘密配方"上——让AI代理运行应用时,不至于拖垮整个系统,实现人机并行工作。
技术细节未公开,但逻辑很清晰:如果超级应用要整合ChatGPT、Codex和Atlas浏览器,它必须解决一个基础矛盾——AI代理的贪婪算力需求,与用户日常工作的流畅体验之间的冲突。
Codex负责人Thibault Sottiaux在发布会上说:「我们在公开构建超级应用。」这句话的潜台词是:开发者们,你们现在用的每一个功能,都是在为最终产品做压力测试。
伏笔二:111个插件,编织上下文捕获网
本次更新最显眼的数字:111个新插件。它们混合了技能模块、应用集成和模型上下文协议(MCP)服务器连接。
表面看是功能扩充,实际是数据管道铺设。MCP协议让Codex能接入开发者已有的工具链,从Jira到GitHub,从Slack到Notion——这些连接产生的上下文,将成为超级应用理解用户工作流的基础燃料。
一个细节:插件设计强调"收集上下文"而非"替代工具"。OpenAI没有试图复刻开发者已有的生产力栈,而是选择寄生其中。这种克制背后,是对用户迁移成本的清醒计算。
伏笔三:浏览器内置,但评论系统才是钩子
Codex新增了内置浏览器,附带一个关键设计:评论系统。你可以圈选网页或Web应用的特定区域,指示Codex做针对性调整。
演示案例很具体:调整图表边距,防止Y轴被截断。这种颗粒度的交互,暴露了一个产品判断——超级应用的核心竞争力,不在于"能做什么",而在于"做多细"。
对比Atlas浏览器的独立定位,Codex内置浏览器的价值在于闭环:发现、修改、验证,全部在同一代理会话内完成。当超级应用最终整合时,这种工作流惯性将成为用户留存的关键。
伏笔四:图像生成,但用途很"工程师"
gpt-image-1.5被塞进Codex,功能清单包括:产品概念图、原型设计、前端界面、简单游戏素材。
注意缺失的选项:没有强调社交媒体配图,没有营销海报模板。OpenAI对Codex图像能力的定位,严格限定在"开发工作流"范畴。
另一个被低估的功能:截图验证。Codex可以截取当前界面,自我检查是否符合用户指令。这在多步骤任务中至关重要——当代理执行链变长,幻觉和偏离的风险指数级上升。截图作为锚点,提供了一种廉价的现实校验机制。
图像生成+截图验证的组合,暗示了超级应用的交互范式:不是对话式的一问一答,而是可视化、可干预、可回滚的协作过程。
伏笔五:双轨记忆,从被动响应到主动推送
本次更新预览了两项记忆功能,构成一个完整的上下文管理策略。
第一轨:任务间记忆。Codex能调用过往任务的上下文,优化后续请求的处理速度和质量。这是纵向的时间维度——让AI"越用越懂你"。
第二轨:主动建议。基于积累的上下文,Codex会在适当时机推送行动建议。演示场景:早晨启动时,提示你回复同事在Google Doc上的评论。
这两条轨道的组合效果:把AI从"等待召唤的工具"重塑为"嵌入节奏的协作者"。Sottiaux的表述值得细读——「这次发布面向开发者。未来我们会扩展到更广泛受众。」
翻译一下:记忆系统先在开发者场景打磨,因为开发者对"AI越界"的容忍度更低、反馈更直接。一旦这套行为边界机制成熟,向普通用户推广的风险可控性更强。
超级应用的真正门槛
五个伏笔拼合后,OpenAI的困境浮出水面:它拥有构建超级应用的所有模块,却缺乏整合它们的操作系统。
ChatGPT是对话界面,Codex是代理引擎,Atlas是浏览窗口。三者的交互范式、上下文管理、权限模型各不相同。强行缝合,只会制造出弗兰肯斯坦式的怪物。
本次Codex更新的深层逻辑,是在"开发者超级应用"的限定场景内,试验统一的代理架构。111个插件是生态接口,双轨记忆是用户模型,计算机操控是系统权限,浏览器+图像生成是交互层——这些组件的协同方式,将决定最终整合版产品的形态。
一个被忽略的时间信号:OpenAI没有承诺超级应用的发布日期,但Codex的更新节奏明显加快。从独立编码工具到多代理平台,再到今天的"更大工作面",产品迭代方向始终指向同一个收敛点。
对科技从业者而言,这场实验的价值在于观察一家AI原生公司如何处理"第二曲线"困境——当第一款产品(ChatGPT)增长放缓,如何用新形态(超级应用)承接用户期待,同时避免自我蚕食。
历史参照不多。微软从Windows到Office的转型花了十年,苹果从iPod到iPhone的跃迁依赖硬件革命。OpenAI的赌注是:在软件层面,用代理架构的统一性,替代操作系统级别的整合。
这个赌注能否成功,取决于一个未被回答的问题:当Codex的记忆系统积累了足够多开发者的工作模式,这些洞察能否无损迁移到普通用户的日常场景?知识工作者的上下文(代码、文档、任务)与生活用户的上下文(日程、社交、消费)是否共享足够的基础结构?
1570亿美元估值背后,市场押注的是AI将重构所有软件交互。OpenAI选择用Codex作为超级应用的试验田,而非直接发布整合产品,说明它清楚重构的复杂度——这不是功能叠加,而是范式迁移。
对于正在评估AI工具栈的团队,Codex的更新提供了一个观察窗口:未来12-18个月,代理系统的竞争焦点将从"能调用多少工具"转向"能记住多少上下文"和"能在多大程度上预判需求"。111个插件是当下的卖点,双轨记忆才是长期的护城河。
数据收束:本次更新释放5个核心信号——计算机操控优化、111插件生态、浏览器闭环交互、图像生成+验证、双轨记忆系统。它们共同指向一个尚未命名的产品形态,而OpenAI的公开构建策略,把开发者变成了付费的测试用户和免费的架构顾问。
热门跟贴