编译 | 郑丽媛

出品 | CSDN(ID:CSDNnews)

OpenAI 又更新了,而且这次节奏快得让整个行业有点来不及喘气。

就在今天凌晨,OpenAI 正式发布 GPT-5.5,官方给它的定位相当直接:迄今最聪明、最直觉、最适合真实工作的模型。比起上个月才亮相的 GPT‑5.4,这个新版本不仅仅是聪明了一点——它在编程、知识工作、科学研究甚至网络安全上都跨了一大步。

打开网易新闻 查看精彩图片

更关键的是,OpenAI 联合创始人兼总裁 Greg Brockman 在媒体电话会上放出一个信号:GPT‑5.5 让公司离他们心心念念的“超级应用(Super App)”又近了一步。

如果你还记得,Sam Altman 和 Greg Brockman 之前就多次提到过想把 ChatGPT、Codex 和 AI 浏览器揉成一个统一服务,专门给企业客户当“万能工具箱”。有趣的是,“超级应用”也是 Elon Musk 的执念——他早就想把 X(原 Twitter)搞成同样的东西。

看来,这两个老同事在“大一统 App”这个赛道上也要正面刚上了。

打开网易新闻 查看精彩图片

又快又省:GPT‑5.5 的“脑力”升级

相比上个月发布的 GPT‑5.4,GPT‑5.5 在智能水平上再上一个台阶,但速度丝毫没有妥协。OpenAI 首席科学家 Jakub Pachocki 直言:“短期来看,我们能观察到相当显著的改进;中期来看,改进会极其显著。实际上,我认为过去两年的进展反而出奇地慢。”

具体来说,GPT‑5.5 在实际服务中保持了与 GPT‑5.4 相同的单 token 延迟,但完成同样任务所需的 token 数量大幅减少。这意味着它更聪明,也更经济。例如,在 Artificial Analysis 的编程指数中,GPT‑5.5 仅用竞争对手一半的成本就达到了最顶尖的智能水平。

打开网易新闻 查看精彩图片

Greg Brockman对此形象总结道:“GPT‑5.5是一个更快、更敏锐的思考者,消耗的 token 却比 5.4 更少。这意味着,更多的前沿 AI 能力可以同时服务于企业和消费者——这正是我们的目标之一。”

打开网易新闻 查看精彩图片

迄今最强的代理编程模型”

OpenAI将 GPT‑5.5 定位为“迄今最强的编程模型”,一系列基准测试结果相当硬核:

● Terminal‑Bench 2.0(复杂命令行工作流):准确率 82.7%,业内顶尖。

● SWE‑Bench Pro(真实 GitHub 问题解决):58.6%,一次性端到端解决的问题数超过以往任何模型。

● Expert‑SWE(OpenAI 内部评估长期编码任务的基准,中位预估人类需要 20 小时):同样超越 GPT‑5.4。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

更让人印象深刻的是,GPT‑5.5 在 Codex 环境中已经能承担从实现、重构到调试、测试、验证的全流程工程工作。有早期测试者反馈,它理解系统整体结构的能力明显变强:能判断为什么某功能失败、修复该落在哪里、以及代码库中还有哪些地方会受影响。

Every 公司 CEO Dan Shipper 评价道:“这是我用过的第一个具备真正概念清晰度的编程模型。”他甚至做了一个实验:给 GPT‑5.5 一个已经出故障的应用状态,看它能否复现公司顶级工程师后来采用的修复方案——结果GPT‑5.4 做不到,但 GPT‑5.5 做到了

MagicPath 的 CEO Pietro Schirano 也分享了一个案例:GPT‑5.5 只用了大约 20 分钟,就一次性将一个包含数百个前端和重构变更的分支合并到另一个同样变动巨大的主分支中。英伟达一位提前使用该模型的工程师甚至说:“没了 GPT‑5.5,感觉像断一条手臂。

打开网易新闻 查看精彩图片

知识工作与科研:不止于码农

OpenAI 首席研究官 Mark Chen 强调,GPT‑5.5 的进步远不止于编程。在知识工作领域,如生成文档、表格、幻灯片、运营研究、财务建模,它同样比前代更强。当与 Codex 的“计算机使用”能力结合时,GPT‑5.5 几乎可以像人一样“看到屏幕、点击、输入、导航”,在不同工具间精确切换。

据官方介绍,OpenAI 内部已经在真实工作流中大规模使用。目前公司超过 85% 的员工每周都会用 Codex,涵盖财务、公关、市场、数据科学等职能。例如:

● 公关团队用 GPT‑5.5 分析了六个月的演讲请求数据,搭建了一个自动化 Slack 代理,低风险请求全自动处理,高风险请求再转人工。

● 财务团队用它审核了 24771 份 K-1 税务表格,总计 7 万多页,比前一年快了整整两周。

● 市场团队有人把每周业务报告生成自动化,每周省下 5 到 10 个小时。

在科学研究方面,GPT‑5.5 的表现同样令人眼前一亮。它在 GeneBench(遗传学多阶段数据分析)和 BixBench(生物信息学真实世界数据分析)上都取得了领先成绩。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

更惊人的是,一个内部版本的 GPT‑5.5 甚至帮助发现了关于拉姆齐数的新证明,这是组合数学中一个极为艰深的领域——该证明后来在 Lean 中得到了验证,成为 GPT‑5.5 不仅能写代码、还能贡献原创数学论证的里程碑案例。

除此之外,杰克逊基因组医学实验室的免疫学教授 Derya Unutmaz 用 GPT‑5.5 Pro 分析了一个 62 样本、近 28,000 个基因的数据集,生成了一份详细的研究报告。他说:“这项工作原本需要我的团队花费数月。

打开网易新闻 查看精彩图片

推理效率的秘密:模型帮模型“打工”

一个有趣的细节是,GPT‑5.5 在服务效率上的提升,居然也借用了模型自己的能力

OpenAI 透露,为了让 GPT‑5.5 保持与 GPT‑5.4 相同的延迟,他们重新设计了整个推理系统,并专门与 NVIDIA GB200/GB300 NVL72 系统进行了协同设计和训练。

其中一项关键优化是负载均衡和分区算法。过去,系统会将请求拆成固定数量的块来均衡负载,但这种方式不能适应所有流量模式。于是,他们让 Codex 分析了数周的生产流量,并编写了自定义启发式算法来优化分区和负载分配——这一改进直接将 token 生成速度提高了 20% 以上。

用 OpenAI 自己的话说:“模型帮助改进了服务它的基础设施。”

打开网易新闻 查看精彩图片

再次对标 Anthropic:网络安全大战升级

随着模型能力增强,安全风险也在上升。为此 OpenAI 在 GPT‑5.5 上部署了迄今为止最严格的防护措施,包括针对高级生物学和网络安全能力的专项测试。在公司的“准备框架”中,GPT‑5.5 的生物/化学和网络安全能力都被评定为“高风险”级别,但尚未达到“关键风险”。

打开网易新闻 查看精彩图片

针对网络安全,OpenAI 采取了“信任访问”模式。从 Codex 开始,经过验证、满足特定信任信号的用户可以获得更少限制的 GPT‑5.5 网络安全能力访问。负责保护关键基础设施的组织也可以申请使用类似 GPT‑5.4‑Cyber 的模型来加固内部系统。

此次 OpenAI 发布 GPT‑5.5 自然也绕不开老对手 Anthropic。在媒体会上有记者提问:GPT‑5.5 会不会有类似 Anthropic 最近发布的网络安全工具 Mythos 的能力(Mythos 最近因未经授权访问事件引发争议)?

对此,OpenAI 技术人员 Mia Glaese 回应说:“GPT-5.5 将显著提升 OpenAI 在数字防御方向的模型部署能力,OpenAI 在网络安全领域有强大且长期的策略,并且已经完善了一种稳健的方法来安全地推出模型。”

打开网易新闻 查看精彩图片

定价与可用性:更贵,但更省 token

GPT‑5.5 从 4 月 24 日起逐步开放。在 ChatGPT 中,Plus、Pro、Business、Enterprise 用户均可使用;GPT‑5.5 Pro 则面向 Pro、Business、Enterprise 用户。

在 Codex 中,GPT‑5.5 对 Plus、Pro、Business、Enterprise、Edu 和 Go 套餐用户开放,上下文窗口 400K,还有快速模式(速度快 1.5 倍,成本 2.5 倍)。

API 也即将上线:

● GPT‑5.5:每百万输入 token5 美元,每百万输出 token30 美元,上下文窗口 1M。

● GPT‑5.5-Pro:每百万输入30 美元,每百万输出180 美元

虽然 GPT‑5.5 单价比 GPT‑5.4 高,但OpenAI强调,由于 token 效率大幅提升,大多数用户的实际开销反而可能更低

最后,如果只把 GPT-5.5 看成是一次模型升级,可能低估了这次发布。此次发布最重要的信息可能不是参数提升,也不是 benchmark 分数,它真正透露的趋势是:过去 AI 公司卖的是模型能力;未来 AI 公司卖的,可能是完整工作结果。

正如Greg Brockman 所说:“这个模型代表着我们所期待未来计算方式的一次实质性进展,当然这只是其中一步,未来还会有很多步。”通过 GPT-5.5 的发布,OpenAI 正越来越明确地展示自己的终局路线:

不只是提供一个最强模型,而是打造一个整合聊天、编程、浏览器、办公、企业服务的 AI 超级平台。

原文链接:https://openai.com/index/introducing-gpt-5-5/

「粉丝专属回馈:60+ 顶级大厂 AI 实战 PPT 限时领!」

2026 奇点智能技术大会·上海站圆满落幕!整整两天,CSDN 与奇点智能研究院携手,把“AI 正在如何重塑软件开发”彻底摊开讲透了。

这不仅仅是一场会议,更是一份关于未来的答案。从 NVIDIA、微软、Google 的全球视野,到华为、阿里、腾讯、京东、网易、快手、昆仑万维的本土实践;从月之暗面、阶跃星辰、MiniMax 的独角兽洞察,再到北大、智源、奇点智能研究院的前沿探索。

Agent 正在成为新入口,软件形态正在被重写。

错过了现场?没关系!为回馈粉丝,我们特将本次大会的高质量演讲 PPT 完整打包。

领取方式: 在公众号后台私信发送 「奇点」 二字,即可一键获取全套干货。