OpenAI 官方发布公告:5.4 sooner than you Think.

打开网易新闻 查看精彩图片

这除了在玩谐音梗,还透露出一个信号:

GPT-5.4,就快来了!
打开网易新闻 查看精彩图片

而据 The Information 报道,GPT-5.4 即将发布,带来了几个相当重要的升级。

百万上下文
打开网易新闻 查看精彩图片
百万上下文

GPT-5.4 将支持 100 万 token 的上下文窗口

这意味着 OpenAI 终于在长上下文能力上追上了 Gemini 和 Claude。之前 GPT 系列在这方面一直是短板,现在算是补上了。

至于 100 万 token 是什么概念?

你就理解为一整本的《哈利波特》系列全集,或者一个中大型代码仓库的全部代码

上下文焦虑,从此不再是个问题。

BTW, 甚至有传言称将会是 2M token.

极限推理模式

GPT-5.4 新增了一个**「极限推理模式」(Extreme Reasoning Mode)**,允许模型花更多时间、消耗更多算力来深度思考难题。

听起来像是 OpenAI 版的 "think harder",用更多 compute 换更好的推理质量。对科研和复杂问题求解来说,这个功能会很实用。

长时间任务

这次升级的另一个重点是长时间任务的处理能力

GPT-5.4 在执行耗时数小时的任务时表现更好了,能更好地记住用户请求的细节、权限边界,在多步骤工作流中犯错更少。

据 The Information 报道:

新模型在耗时数小时的任务上表现明显更好,能更好地记住用户请求的细节,知道哪些操作被允许、哪些不被允许,在多步骤工作流中出错更少。

这对 Codex 这样的编码工具来说尤其重要。Codex 需要 AI 自动完成复杂的、长时间运行的任务,如果模型中途「忘事」或者犯低级错误,那体验就废了。

为 Agent 而生

GPT-5.4 的升级方向很明确:为 Agent 和自动化而生。

更长的上下文、更强的推理、更好的长任务记忆、更低的错误率,这些能力加在一起,指向的就是一个能独立干活的 AI Agent。

而这也是 OpenAI 当前整体战略的一部分。从 Codex 到 Operator,OpenAI 在 Agent 赛道上的布局越来越密集。

5.3 刚发,5.4 又来

说到发布节奏,OpenAI 最近是真的快。

打开网易新闻 查看精彩图片

GPT-5.3 Instant 昨天刚发布,今天就预告 5.4 了。

对于 5.3,OpenAI 官方的描述是:More accurate, less cringe。

翻译一下就是:更准确,不那么「油腻」了。

打开网易新闻 查看精彩图片

显然 OpenAI 也听到了用户的吐槽。

ChatGPT 之前的回复风格被很多人诟病太「谄媚」,5.3 Instant 算是正式回应了这个问题。

Codex 登陆 Windows

同样是今天,OpenAI 还宣布 Codex 应用正式登陆 Windows 平台

打开网易新闻 查看精彩图片

之前 Codex 只支持 Mac,现在 Windows 用户也能用上原生的 Codex 体验了,包括:

打开网易新闻 查看精彩图片

多个 Agent 并行工作

  • 管理长时间运行的任务

  • 在一个地方 review 代码 diff

  • 原生支持 PowerShell 开发环境,不需要切换到 WSL 或虚拟机

  • 打开网易新闻 查看精彩图片
    月更节奏

    The Information 还提到,GPT-5.4 反映了 OpenAI 的一个重要策略转变:模型更新频率提高到每月一次。

    打开网易新闻 查看精彩图片

    OpenAI 从今年早些时候开始了这种月更节奏。原因很实际,之前那种攒大版本、搞大发布的模式,容易造成「期望过高、发布失望」的落差,GPT-5 发布时就出现过这种情况。

    现在改成小步快跑,每月迭代。

    不过话说回来,OpenAI 最近这么着急,也并不是没有原因:

    打开网易新闻 查看精彩图片

    App Store 也被踢下来了:

    打开网易新闻 查看精彩图片

    目前来看,从 5.3 到 5.4,或许将成为 OpenAI 最短的模型发布间隔:仅 1 - 2 周。

    而至于究竟什么时候发布,有一种可能是:

    在等 Deepseek V4……