幻觉减半，废话砍三成！被骂一年，OpenAI 终于把 ChatGPT 改对了

新浪财经

2026-05-06 20:13 ·北京 ·优质财经领域创作者

来源：市场资讯

（来源：AI信息Gap）

GPT-5.5 Instant，上线了。

替换掉了 GPT-5.3 Instant，成为 ChatGPT 新的默认模型。几亿人打开 ChatGPT 默认用的就是它，包括免费用户。

最大的变化，一个数字。幻觉减少 52.5%。

我们之前聊过 GPT-5.5 的提示词变化，那是 GPT-5.5 Thinking 和满血版 API 的事。今天这个 Instant 是「日常版」，专门给 ChatGPT 用的。

在医学、法律、金融这些高风险领域的测试里，GPT-5.5 Instant 比上一代幻觉（编造事实）少了一半。用户以前标记过的「答错了」对话，拿出来重新测，不准确的回答减少了 37.3%。

OpenAI 官方博客放了一个数学例子，有点意思。

一道带根号的方程问题，用户的解题过程里有一步算错了。GPT-5.3 Instant 一开始说「没问题」，后来把答案代回原方程，发现不对，直接宣布「无解」。

原地放弃。

GPT-5.5 Instant 第一次也没看出来。但它多走了一步，回头检查了代数式展开过程，找到具体哪一步算错了，然后用公式重新解出了正确答案。

一个发现错了会放弃，一个发现错了会往回查。

这就是「幻觉减半」背后的东西。很重要。

来看你们最关心的，「跑分」。

竞赛数学 AIME 2025 从 65.4% 涨到 81.2%，提升最大。博士级科学题 GPQA 从 78.5% 涨到 85.6%，多模态推理 MMMU-Pro 从 69.2% 涨到 76.0%，图表推理 CharXiv 从 75.0% 涨到 81.6%。

文档解析的错误率也从 14.6% 降到了 12.5%。

值得一提的是，选了 Instant 不代表只用 Instant。遇到复杂问题，ChatGPT 会自动切换到 GPT-5.5 Thinking 进行深度推理。

自动路由不占 Thinking 的周用量（虽然你也用不完，Plus 3000 条/周）。

Thinking 推理的时候，ChatGPT 会先显示一段「计划」告诉你它打算怎么做。你可以中途打断调整方向，不用等它全想完再重来。

GPT-5.5 Instant 废话更少了。

它的回复比上一代少用 30.2% 的词，行数减少 29.2%。同样的问题，同样的信息量，篇幅缩短将近三分之一。

OpenAI 提到了一个词，「gratuitous emojis」。

意思是，「别硬塞表情包了」。

以前 ChatGPT 回答问题总喜欢加几个 emoji 表情助兴。现在收敛了。

它也不再动不动追问你了。以前你问一个简单问题，它回答完还要加一句「你还想了解什么？」现在不问了，回答完就停。

这一点在 Claude Opus 4.7 的提示词里也有提及。

ChatGPT 记忆新加了一个功能，叫「记忆来源」（Memory Sources）。

以前 ChatGPT 只是记住你的信息，但你不知道它在回答时引用了什么。现在回复旁边会显示一个「Sources」按钮，点开能看到这次回答引用了哪条记忆、哪段历史对话。

看到过时的或者有问题的记忆，直接删掉或修改。

小细节，分享对话的时候，记忆来源不会暴露给对方。

GPT-5.5 Instant 是 OpenAI 第一个在网络安全和生物领域被列为「高能力」（High Capability）的 Instant 级模型。

以前这个等级是推理模型的专属。现在一个给所有人免费用的日常模型，也到了需要同等安全防护的程度。

系统安全文档是这样描述的。

GPT-5.5 Instant 还没到能独立开发零日漏洞攻击链的水平，那是「关键能力」门槛。但它在网络安全领域的能力已经比 GPT-5.4 强了不少。

GPT-5.5 Instant 已经向所有 ChatGPT 用户推送，还没看到的耐心等待就行。

API 模型 ID gpt-5.5-chat-latest。

来看 ChatGPT 最新额度。

GPT-5.5 Instant，免费用户每 5 小时 10 条，超了自动降级到 mini 模型，上下文窗口 16K。ChatGPT Plus 和 Go 每 3 小时 160 条，上下文窗口 32K。ChatGPT Pro 不限量，上下文窗口 128K。

GPT-5.5 Thinking，付费可选。ChatGPT Plus 和 Business（老 Team 订阅）每周 3000 条爽用，几乎用不完，上下文窗口 256K。ChatGPT Pro 不限量，上下文窗口 400K。

GPT-5.5 Pro 只有 Pro、Business、企业和教育用户能用。

记忆增强和个性化功能目前只对网页版 Plus 和 Pro 用户开放，手机端很快跟进。

GPT-5 系列从发布到现在，被骂了快一年。网上 5000 多人联名要求换回老模型，70% 和信任有关的讨论都是负面的。

骂得最多的就两件事。瞎编乱造、废话太多。

Sam Altman 这次虽然没有「感受到原子弹爆炸」，但看得出来他同样很激动。

5.5 Instant 全改了。已经搬到 Claude 的朋友们，可以考虑回来了。

我是木易，Top2 + 美国 Top10 CS 硕，现在是 AI 产品经理。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴