OpenAI今晚放大招！奥特曼亲自上阵，GPT-5.6本周反杀

新智元

2026-06-02 16:40 ·北京 ·《新智元》官方网易号

新智元报道

【新智元导读】群雄争霸，AGI桂冠花落谁家？OpenAI今晚放大招，奥特曼亲自上阵

群雄争霸，AGI桂冠花落谁家？

OpenAI和Anthropic为争夺代码领域的霸主地位你来我往，战况激烈，从无冷场。

AGI Ranker最新Coding排行榜上，Claude Opus 4.8刚刚坐上王座。GPT-5.5的77.48分被踩在脚下，差距3.5分。

三个月内，编程王座几经易主。

第一次，Claude Opus 4.7登顶，Anthropic弹冠相庆。

第二次，GPT-5.5反超，OpenAI扳回一城。

第三次，Opus 4.8杀回来了，81.01分，Anthropic重新站上榜首。

Anthropic虽已秘密提交IPO申请，但先天算力不足，而OpenAI和谷歌DeepMind未尝不能再次赶上。

刚刚，OpenAI今晚直播预告，奥特曼或现身。

群雄逐鹿，OpenAI亮剑？

明天，OpenAI将于美国东部时间上午举行「Intelligence at Work」直播活动，奥特曼将出席。

随后，纳德拉将于美国东部时间下午发表Microsoft Build大会的开幕主题演讲。

微软预计也将在明天发布其自研的新模型。

Anthropic表示将很快推出Mythos级别的模型。

Polymarket预测GPT-5.6将在6月8日至14日之间发布的概率为68%。

这周对OpenAI来说至关重要。

Codex更新，硬刚Claude Code？

OpenAI将于明天发布一次重大的Codex更新。

数月开发，成果非凡。

Codex重大更新，不是小修小补。

据OpenAI内部透露，Codex团队为这次更新开发了数月，核心方向是让Codex从「代码补全工具」进化成「编程智能体」。

昨日，OpenAI确认，Codex及前沿模型现已在AWS Bedrock上全面可用，并将其描述为「更广泛扩展的开端」。

现在，Codex大更新随即发布，这看起来是协调一致的行动，而非巧合。

同时，奥特曼还在宣传OpenAI基金会关于社会韧性的相关工作。

这种软实力布局通常是在重大发布前后进行，而非发布中途。

此外还有个插曲：Anthropic昨天向美国证券交易委员会（SEC）秘密提交了S-1文件。

如今，这两家公司正同时竞相推进IPO和争夺智能编码领域的主导地位。

Anthropic提交S-1文件的次日早晨，OpenAI就发布了Codex的一个重要里程碑，这要么是绝佳的时机，要么就是绝佳的时机。

GPT-5.6爆料炸锅！

内部人士称模型本周即将发布，性能有望直逼Anthropic Mythos顶级水准，却只需2-3倍更低价格。

同步Codex重大升级，推理、前端生成、个性与智能体工作流全面进化，效率优化让长流程Agent真正落地，这可能是2026年最重磅AI发布！

- GPT-5.6预计将于本周发布，同时Codex也将迎来重大更新

- 它的价格大约低2–3倍，却能达到Anthropic Mythos级别的水平

- 它将在推理、前端生成、个性和智能体工作流方面带来重大改进

- 据知情人士透露，GPT-5.6本可以轻松被称为GPT-6

- 重点似乎是效率，旨在让智能体更快、更便宜，并在更长的工作流中更加实用

关于GPT-5.6的讨论并非凭空捏造，但与正式发布之间还差好几步。

据称，一个引用gpt-5.6的rollout-mapping条目短暂出现在OpenAI内部Codex日志中随后消失，而绝大多数条目指向的是GPT-5.5。

这符合金丝雀测试或有限内部探针的特征——它是进行中工作的迹象，而非发布，更不是功能列表。

Polymarket上有一个关于GPT-5.6是否会在某个日期前发布的市场。

截至2026年5月中旬，交易员认为在2026年6月30日前公开发布的概率约为80-89%。

这是大众对时间的押注，只是一个概率，不是OpenAI的承诺，类似市场之前也有出错的时候。

但看发布节奏规律：OpenAI快速连续发布了GPT-5.4、GPT-5.5、GPT-5.5 Instant。

延续这一节奏再发布一个小版本更新是合理推测。「基于规律的合理推测」是三个信号中最弱的——它只能说明GPT-5.6值得期待，并不能证明它已存在或何时发布。

但有网友透露，OpenAI胸有成竹，志在必得：

GPT-5.6并非应对性发布。OpenAI志在取胜，而非追赶。

据我所知，GPT-5.6在某些方面的目标是比GPT-5.5提升12%到15%。相比许多人测得的Opus 4.7到4.8之间约6.5%的平均提升幅度，这一步幅可谓巨大。

GPT-6才是真正的动作。

该模型不仅旨在回应Anthropic的Mythos系列，更要以显著优势超越它。

这就是为什么OpenAI没有在Opus 4.8之后匆忙跟进。

Anthropic的算力困局

最强模型，最浅口袋

Anthropic的处境很微妙。

手里的牌面是顶级的。

Opus 4.8登顶Coding榜，Mythos在网安领域碾压对手，Claude Code在开发者社区的口碑持续走高。

模型能力这一项，Anthropic目前不虚任何人。

但模型能力不是唯一的战场。

Anthropic的算力来源高度依赖亚马逊和谷歌的云基础设施。

它没有OpenAI背后的微软Azure那种级别的独占算力协议，也没有谷歌DeepMind那种和硬件团队同在一个屋檐下的垂直整合优势。

IPO是Anthropic补上这块短板的关键一步。秘密提交申请已经确认，但钱什么时候到、到多少、够不够在算力军备竞赛中跟上节奏，都是未知数。

Anthropic手里有最强的模型，但口袋里没有最深的钱。

Mythos的定价策略也暴露了这个矛盾。

6倍于Opus的Token价格，说明Anthropic在用高定价来覆盖高推理成本。这在短期内可以靠能力领先撑住，但一旦竞品用更低的价格做到接近的能力，高价策略就变成了高价包袱。

IPO能不能在OpenAI追上来之前，给Anthropic续上算力的弹药？

这是整个AGI决赛最大的悬念之一。

AGI的计时赛

代码能力排行榜的王座以周为单位易手。

这件事本身，在AI历史上从未发生过。

过去的技术竞赛，领先者的优势以年计。

搜索引擎领域，谷歌领先了二十年。

移动操作系统，iOS和安卓的格局十几年没有本质变化。

但在AGI竞赛的最前沿，两家公司的差距已经压缩到了3.5分——一个季度内三次易手。

这意味着决定胜负的不再是模型本身。

当模型能力趋近时，算力、资本、生态、速度、定价策略、甚至IPO时机，每一个非技术因素都在成为胜负手。

Anthropic有最强的模型，但需要IPO来补算力。OpenAI有最深的口袋，但需要GPT-5.6来夺回王座。谷歌有最大的基础设施，但Gemini的Coding分数正在被拉开。

人类历史上第一次，两家公司以周为单位争夺「最接近通用智能」的桂冠。

今晚OpenAI亮剑之后，排行榜上的数字会不会再变一次？

81.01分的王座，还能坐多久？

参考资料：

https://x.com/GoCocoaAI/status/2061646776168296497

https://wavespeed.ai/blog/posts/gpt-5-6-canary-leak-what-we-know/

https://manifold.markets/Jack1/gpt-56-released-by

https://codersera.com/blog/gpt-5-6-release-date-whats-new-2026/

https://x.com/Eduardopto/status/2061148305858408734?s=20

编辑：大卫

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴