你的社交媒体或许曾被 Sora 生成的各种抽象视频刷屏过。

大家拿着这款新出的应用玩得不亦乐乎,一会儿是花样滑冰运动员头上顶着一只猫表演三周跳,一会儿是一个人双腿张开站在两匹马上。

打开网易新闻 查看精彩图片

但是,这款登顶应用商店榜首、体验丝滑、功能完备的应用,并不是什么庞大的移动端团队熬夜肝出来的。

作为一家处于风暴眼中的 AI 巨头,要为旗舰产品 Sora 开发安卓版应用,通常需要一支完整的移动端团队耗费数月打磨。但在 OpenAI,故事有了新版本:4 名工程师,仅用 18 天完成内部版,28 天正式上线。

打开网易新闻 查看精彩图片

他们是怎么做到的?答案是他们拥有第五位「成员」——Codex。

Codex 的产品负责人 Alexander,将这位 AI 队友描述为「一位超级聪明的实习生」 。它不是普通的自动补全工具,它是一个真正的开放式编程智能体。它不会主动去刷 Slack 或者看监控数据(除非你要求它这么做),极其专注。

Sora 团队这次发现了一个特别取巧的办法:

因为 Sora 的 iOS 版已经发布,逻辑是可移植的。无论是 Swift 还是 Kotlin,底层的数据模型、网络调用、验证规则都是一样的。加之 Codex 非常擅长阅读 Swift 代码,转手就生成了语义完全一致的 Kotlin 代码。

不像人类工程师,Codex 对写单元测试有着「独树一帜的热情」 。它会不厌其烦地编写覆盖各种边缘情况的测试用例。虽然深度可能差点意思,但架不住它量大,广泛的覆盖范围直接把代码回归的风险降到了最低。

当持续集成(CI)失败时,工程师只需把报错日志丢给 Codex,它就能分析并提出修复方案。这种反馈循环极大地解放了人类的精力。

OpenAI 联合创始人 Andrej Karpathy 曾遇到过让他束手无策的 Bug,最终他将问题抛给 Codex,让它跑了一个小时,结果真的解决了问题。

到了项目最忙的时候,工程师可以使用「分身术」,同时启动多个 Codex 会话(Session)。一个负责播放器优化,一个负责搜索功能,另一个在重构错误处理模块。

这下,工程师不用「做完你的做你的」了,而是让 Codex 「好好做你的」。

每个「分身」都会定期汇报进展。一个可能会说:「我已经完成了这个模块的规划;这是我的方案」,而另一个则会提出一个关于新功能的改进方案。

值得一提的是,Codex 甚至开始参与自身训练的值守工作。很多用于管理训练流程、搭建核心基础设施的代码,都是 Codex 自己写的。它的代码审查机制使得它能发现很多错误,甚至揪出过一些相当关键的配置问题,做到了「三省吾身」。

如果代码都让 AI 敲了,工程师干什么?

OpenAI 的工程师 Aaron Friel 说道:「现在的工程师都变成 Manager 了,甚至可以说变成了 Director。」工程师可以给 Codex 分配任务,甚至让 Codex 创建子代理去干活,而你负责审核产出。

Sora 团队最初尝试过直接让 Codex「基于 iOS 代码构建 Sora Android 应用,开始」,结果很快就放弃了。虽然 Codex 生成的代码在技术上可以运行,但产品体验糟糕透了。这让他们意识到,Codex 虽然强大,但它不是魔法,也不是可以对着许愿的阿拉丁神灯。

为了让 Codex 能无人值守地运行长达 24 小时,工程师必须先与它沟通,制定一份详细的「实施计划」 。这就像一份小型设计文档,指明哪些文件要改、逻辑流向如何。工程师必须先想清楚了,再让 AI 动手。

在 OpenAI 内部,92% 的技术人员都在使用 Codex,使用它的工程师比不使用的产出的 PR 多出了 70%。甚至连 OpenAI 的非技术团队,比如产品经理和销售,也开始直接通过 Codex 查询代码库细节,不再需要找工程师开会了。

今年 2 月, Andrej Karpathy 发了一条推文,造了一个新词叫 Vibe Coding。但很快就对它「祛魅」了,因为 Vibe Coding 适合的是 Throwaway Weekend Projects(一次性周末项目),带来的很可能是指数级增长的代码屎山。

打开网易新闻 查看精彩图片

与随性的 Vibe Coding 不同,Vibe Engineering 强调的是一种「带着责任感的提速」。也就是说,资深工程师利用 LLM(大语言模型)加速工作,但会为最终的代码负责。

这时,一名工程师的技能和经验越多,与 LLM 和 Coding Agent 协作时获得的结果就会越快、越好。

OpenAI 开发者体验负责人 Romain Huet 指出,未来的能力瓶颈将转移到三个方向:设计与品味、判断力以及清晰的沟通。

正如 Alexander 所设想的,未来的开发模式或许是「对话驱动开发」(Chatter-driven development)。这有点像是在玩 Tinder、TikTok 和 Codex 的结合体,AI 抛出一堆想法和代码实现(Best of N),你左滑否定,右滑采纳。

被低估的瓶颈:你的打字速度

关于通用人工智能(AGI)何时到来,Alexander 给出了一个有趣的视角。他认为,目前阻碍 AI 爆发式增长的一个被低估的因素是人类的打字速度,以及人类同时处理多项任务、编写提示词(Prompt)的速度。

打开网易新闻 查看精彩图片

现在的情况是:「人类写提示词→ AI 写代码→人类检查代码。」

你可以让四个 Codex 会话同时工作,但你能同时清晰地描述四个不同的任务需求吗?你能同时审查四份代码变更并给出有价值的反馈吗?

为了突破这个瓶颈,OpenAI 正在尝试重构系统,让 Agent 能够主动提供帮助,而不是被动等待人类敲击键盘输入指令。

就像他们所畅想的,未来的 Codex 不再是那个需要你抽一鞭子才动一下的被动工具,而是能主动走过来对你说:「嘿,我看你正在写这个模块,我有几个更好的优化方案,你要不要看看?」

在这个新世界里,不论你是写代码的工程师,还是做设计的产品经理,我们都在变得「更技术」。

博客&播客链接:

https://openai.com/index/shipping-sora-for-android-with-codex/

h
ttps://shortcast.me/DOnfxtgupvJdrCeAm0Zi

欢迎加入 APPSO AI 社群,一起畅聊 AI 产品,获取,解锁更多 AI 新知

我们正在招募伙伴

简历投递邮箱hr@ifanr.com

✉️ 邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)

打开网易新闻 查看精彩图片