Jason Liu刚加入OpenAI Codex团队没多久,就把自己的"压榨AI"心得全写出来了。这位13k星开源库Instructor的作者,不仅公开送API额度,还详细拆解了如何让Codex在你洗澡的时候继续干活——自动跟进亚马逊退款、定时扫Slack接需求、开着Heartbeats持续运行。随着Codex周活用户4月底突破400万,这份"官方使用指南"来得正是时候。

结合这两天Codex刚更新的功能——Appshots截图直喂、Goal模式转正、锁屏后远程干活——你会发现一个趋势:现在比拼的不是单次对话多聪明,而是谁能持续工作更久,谁能真正"上岗"。

打开网易新闻 查看精彩图片

核心心法一:把单次对话变成长期员工

打开网易新闻 查看精彩图片

多数人用完Codex就关窗口,Jason的做法完全相反。他开着一堆跨月存活的巨型线程,用Command-1到Command-9一键跳转:管日程的一个、管开源项目的一个、监控社交平台的一个。几个月的对话历史、个人偏好、决策逻辑都沉淀在里面,Agent自动承接进度,不用每次都重新交代背景。

他下任务主要靠说,不是打字。口述能保留原始思路的模糊和跳跃,不用刻意优化Prompt。配合Steering功能,还能在Agent执行时插队追加指令,说完就走。

但真正让Codex从工具变员工的,是Heartbeats+@computer的组合。Heartbeats相当于定时任务调度,他的"Chief of Staff"线程每30分钟扫一遍Slack和Gmail,判断优先级,起草回复草稿但不发送,最终由人决定是否发出。

更复杂的例子是做动画:视频发到Slack审阅线程后,Codex每15分钟检查一次。同事提了反馈,就重新渲染新版本回复。因为Slack MCP服务器还不支持文件上传,Agent会自己调用@computer点"Add file"按钮传文件。他甚至在洗澡前让Codex盯着亚马逊客服排队,洗完出来退款已到账。类似流程现已扩展到Google Docs评论、GitHub PR Review等场景。

Jason最强调验证机制。他试过让Codex把Python的Rich库完整迁移到Rust,硬性要求是通过原库所有单元测试——测试通过即终止,失败就继续修。"没有验证机制的野心,顶多算个愿望。"而最新更新中,Goal模式已转正:明确最终目标和验收标准,Codex自主持续推进,短则几小时长则数天,中途可查进度、调方向或暂停。前提是任务存在清晰、可验证的反馈闭环。

核心心法二:记忆必须攥在自己手里

打开网易新闻 查看精彩图片

Jason几乎放弃了Codex的内置记忆系统。所有长期线程从Obsidian vault起步,分TODO、people、projects、agent、notes等板块。顶层AGENTS.md写明规则:人员信息、项目推进、待办变动都要同步更新知识库。

核心记忆数据存本地可控文件,随时查阅手动修改,版本对比查看变动,一键roll back。他的逻辑很直接:AI承载的记忆体量越大,越不该锁死在单一平台。文件完全属于用户,换工具、迁平台,拎着知识库就能走。

他也提到Codex自带的Chronicle功能,通过截取屏幕构建上下文。但这是需手动开启的实验预览,权限、速率、隐私均有短板,方向可行但不够成熟。文件系统仍是最可靠的记忆基础设施。

Codex工作台本身也在升级。侧边栏可直接渲染Markdown、筛选表格、阅览PDF与PPT,Agent还能通过内置浏览器用JavaScript控制网页,边看边标注。Jason经常在侧边面板同时打开Storybook审UI组件、Remotion Studio做动画、Slidev做演示。他最喜欢的交付形式是带JS和CSS的单文件index.html,不用部署,打开即跑。

Connectors和Skills被他当作可复用工作流模版。成功做完一件事就打包流程,下次直接调用。最新补上的远程能力更关键:电脑锁屏后Codex继续工作,手机端实时查看、审批、接管任务。

现在的情况是:你下班它加班,你锁屏它干活。超额KPI的来源,可能是AI的持续运转。而人自己,倒是越来越轻松了。