新智元报道
【新智元导读】群雄争霸,AGI桂冠花落谁家?OpenAI今晚放大招,奥特曼亲自上阵
群雄争霸,AGI桂冠花落谁家?
OpenAI和Anthropic为争夺代码领域的霸主地位你来我往,战况激烈,从无冷场。
AGI Ranker最新Coding排行榜上,Claude Opus 4.8刚刚坐上王座。GPT-5.5的77.48分被踩在脚下,差距3.5分。
三个月内,编程王座几经易主。
第一次,Claude Opus 4.7登顶,Anthropic弹冠相庆。
第二次,GPT-5.5反超,OpenAI扳回一城。
第三次,Opus 4.8杀回来了,81.01分,Anthropic重新站上榜首。
Anthropic虽已秘密提交IPO申请,但先天算力不足,而OpenAI和谷歌DeepMind未尝不能再次赶上。
刚刚,OpenAI今晚直播预告,奥特曼或现身。
群雄逐鹿,OpenAI亮剑?
明天,OpenAI将于美国东部时间上午举行「Intelligence at Work」直播活动,奥特曼将出席。
随后,纳德拉将于美国东部时间下午发表Microsoft Build大会的开幕主题演讲。
微软预计也将在明天发布其自研的新模型。
Anthropic表示将很快推出Mythos级别的模型。
Polymarket预测GPT-5.6将在6月8日至14日之间发布的概率为68%。
这周对OpenAI来说至关重要。
Codex更新,硬刚Claude Code?
OpenAI将于明天发布一次重大的Codex更新。
数月开发,成果非凡。
Codex重大更新,不是小修小补。
据OpenAI内部透露,Codex团队为这次更新开发了数月,核心方向是让Codex从「代码补全工具」进化成「编程智能体」。
昨日,OpenAI确认,Codex及前沿模型现已在AWS Bedrock上全面可用,并将其描述为「更广泛扩展的开端」。
现在,Codex大更新随即发布,这看起来是协调一致的行动,而非巧合。
同时,奥特曼还在宣传OpenAI基金会关于社会韧性的相关工作。
这种软实力布局通常是在重大发布前后进行,而非发布中途。
此外还有个插曲:Anthropic昨天向美国证券交易委员会(SEC)秘密提交了S-1文件。
如今,这两家公司正同时竞相推进IPO和争夺智能编码领域的主导地位。
Anthropic提交S-1文件的次日早晨,OpenAI就发布了Codex的一个重要里程碑,这要么是绝佳的时机,要么就是绝佳的时机。
GPT-5.6爆料炸锅!
内部人士称模型本周即将发布,性能有望直逼Anthropic Mythos顶级水准,却只需2-3倍更低价格。
同步Codex重大升级,推理、前端生成、个性与智能体工作流全面进化,效率优化让长流程Agent真正落地,这可能是2026年最重磅AI发布!
- GPT-5.6预计将于本周发布,同时Codex也将迎来重大更新
- 它的价格大约低2–3倍,却能达到Anthropic Mythos级别的水平
- 它将在推理、前端生成、个性和智能体工作流方面带来重大改进
- 据知情人士透露,GPT-5.6本可以轻松被称为GPT-6
- 重点似乎是效率,旨在让智能体更快、更便宜,并在更长的工作流中更加实用
关于GPT-5.6的讨论并非凭空捏造,但与正式发布之间还差好几步。
据称,一个引用gpt-5.6的rollout-mapping条目短暂出现在OpenAI内部Codex日志中随后消失,而绝大多数条目指向的是GPT-5.5。
这符合金丝雀测试或有限内部探针的特征——它是进行中工作的迹象,而非发布,更不是功能列表。
Polymarket上有一个关于GPT-5.6是否会在某个日期前发布的市场。
截至2026年5月中旬,交易员认为在2026年6月30日前公开发布的概率约为80-89%。
这是大众对时间的押注,只是一个概率,不是OpenAI的承诺,类似市场之前也有出错的时候。
但看发布节奏规律:OpenAI快速连续发布了GPT-5.4、GPT-5.5、GPT-5.5 Instant。
延续这一节奏再发布一个小版本更新是合理推测。「基于规律的合理推测」是三个信号中最弱的——它只能说明GPT-5.6值得期待,并不能证明它已存在或何时发布。
但有网友透露,OpenAI胸有成竹,志在必得:
GPT-5.6并非应对性发布。OpenAI志在取胜,而非追赶。
据我所知,GPT-5.6在某些方面的目标是比GPT-5.5提升12%到15%。相比许多人测得的Opus 4.7到4.8之间约6.5%的平均提升幅度,这一步幅可谓巨大。
GPT-6才是真正的动作。
该模型不仅旨在回应Anthropic的Mythos系列,更要以显著优势超越它。
这就是为什么OpenAI没有在Opus 4.8之后匆忙跟进。
Anthropic的算力困局
最强模型,最浅口袋
Anthropic的处境很微妙。
手里的牌面是顶级的。
Opus 4.8登顶Coding榜,Mythos在网安领域碾压对手,Claude Code在开发者社区的口碑持续走高。
模型能力这一项,Anthropic目前不虚任何人。
但模型能力不是唯一的战场。
Anthropic的算力来源高度依赖亚马逊和谷歌的云基础设施。
它没有OpenAI背后的微软Azure那种级别的独占算力协议,也没有谷歌DeepMind那种和硬件团队同在一个屋檐下的垂直整合优势。
IPO是Anthropic补上这块短板的关键一步。秘密提交申请已经确认,但钱什么时候到、到多少、够不够在算力军备竞赛中跟上节奏,都是未知数。
Anthropic手里有最强的模型,但口袋里没有最深的钱。
Mythos的定价策略也暴露了这个矛盾。
6倍于Opus的Token价格,说明Anthropic在用高定价来覆盖高推理成本。这在短期内可以靠能力领先撑住,但一旦竞品用更低的价格做到接近的能力,高价策略就变成了高价包袱。
IPO能不能在OpenAI追上来之前,给Anthropic续上算力的弹药?
这是整个AGI决赛最大的悬念之一。
AGI的计时赛
代码能力排行榜的王座以周为单位易手。
这件事本身,在AI历史上从未发生过。
过去的技术竞赛,领先者的优势以年计。
搜索引擎领域,谷歌领先了二十年。
移动操作系统,iOS和安卓的格局十几年没有本质变化。
但在AGI竞赛的最前沿,两家公司的差距已经压缩到了3.5分——一个季度内三次易手。
这意味着决定胜负的不再是模型本身。
当模型能力趋近时,算力、资本、生态、速度、定价策略、甚至IPO时机,每一个非技术因素都在成为胜负手。
Anthropic有最强的模型,但需要IPO来补算力。OpenAI有最深的口袋,但需要GPT-5.6来夺回王座。谷歌有最大的基础设施,但Gemini的Coding分数正在被拉开。
人类历史上第一次,两家公司以周为单位争夺「最接近通用智能」的桂冠。
今晚OpenAI亮剑之后,排行榜上的数字会不会再变一次?
81.01分的王座,还能坐多久?
参考资料:
https://x.com/GoCocoaAI/status/2061646776168296497
https://wavespeed.ai/blog/posts/gpt-5-6-canary-leak-what-we-know/
https://manifold.markets/Jack1/gpt-56-released-by
https://codersera.com/blog/gpt-5-6-release-date-whats-new-2026/
https://x.com/Eduardopto/status/2061148305858408734?s=20
编辑:大卫
热门跟贴