来源:市场资讯
(来源:AI信息Gap)
GPT-5.5 Instant,上线了。
替换掉了 GPT-5.3 Instant,成为 ChatGPT 新的默认模型。几亿人打开 ChatGPT 默认用的就是它,包括免费用户。
最大的变化,一个数字。幻觉减少 52.5%。
我们之前聊过 GPT-5.5 的提示词变化,那是 GPT-5.5 Thinking 和满血版 API 的事。今天这个 Instant 是「日常版」,专门给 ChatGPT 用的。
在医学、法律、金融这些高风险领域的测试里,GPT-5.5 Instant 比上一代幻觉(编造事实)少了一半。用户以前标记过的「答错了」对话,拿出来重新测,不准确的回答减少了 37.3%。
OpenAI 官方博客放了一个数学例子,有点意思。
一道带根号的方程问题,用户的解题过程里有一步算错了。GPT-5.3 Instant 一开始说「没问题」,后来把答案代回原方程,发现不对,直接宣布「无解」。
原地放弃。
GPT-5.5 Instant 第一次也没看出来。但它多走了一步,回头检查了代数式展开过程,找到具体哪一步算错了,然后用公式重新解出了正确答案。
一个发现错了会放弃,一个发现错了会往回查。
这就是「幻觉减半」背后的东西。很重要。
来看你们最关心的,「跑分」。
竞赛数学 AIME 2025 从 65.4% 涨到 81.2%,提升最大。博士级科学题 GPQA 从 78.5% 涨到 85.6%,多模态推理 MMMU-Pro 从 69.2% 涨到 76.0%,图表推理 CharXiv 从 75.0% 涨到 81.6%。
文档解析的错误率也从 14.6% 降到了 12.5%。
值得一提的是,选了 Instant 不代表只用 Instant。遇到复杂问题,ChatGPT 会自动切换到 GPT-5.5 Thinking 进行深度推理。
自动路由不占 Thinking 的周用量(虽然你也用不完,Plus 3000 条/周)。
Thinking 推理的时候,ChatGPT 会先显示一段「计划」告诉你它打算怎么做。你可以中途打断调整方向,不用等它全想完再重来。
GPT-5.5 Instant 废话更少了。
它的回复比上一代少用 30.2% 的词,行数减少 29.2%。同样的问题,同样的信息量,篇幅缩短将近三分之一。
OpenAI 提到了一个词,「gratuitous emojis」。
意思是,「别硬塞表情包了」。
以前 ChatGPT 回答问题总喜欢加几个 emoji 表情助兴。现在收敛了。
它也不再动不动追问你了。以前你问一个简单问题,它回答完还要加一句「你还想了解什么?」现在不问了,回答完就停。
这一点在 Claude Opus 4.7 的提示词里也有提及。
ChatGPT 记忆新加了一个功能,叫 「记忆来源」(Memory Sources)。
以前 ChatGPT 只是记住你的信息,但你不知道它在回答时引用了什么。现在回复旁边会显示一个「Sources」按钮,点开能看到这次回答引用了哪条记忆、哪段历史对话。
看到过时的或者有问题的记忆,直接删掉或修改。
小细节,分享对话的时候,记忆来源不会暴露给对方。
GPT-5.5 Instant 是 OpenAI 第一个在网络安全和生物领域被列为「高能力」(High Capability)的 Instant 级模型。
以前这个等级是推理模型的专属。现在一个给所有人免费用的日常模型,也到了需要同等安全防护的程度。
系统安全文档是这样描述的。
GPT-5.5 Instant 还没到能独立开发零日漏洞攻击链的水平,那是「关键能力」门槛。但它在网络安全领域的能力已经比 GPT-5.4 强了不少。
GPT-5.5 Instant 已经向所有 ChatGPT 用户推送,还没看到的耐心等待就行。
API 模型 ID gpt-5.5-chat-latest。
来看 ChatGPT 最新额度。
GPT-5.5 Instant,免费用户每 5 小时 10 条,超了自动降级到 mini 模型,上下文窗口 16K。ChatGPT Plus 和 Go 每 3 小时 160 条,上下文窗口 32K。ChatGPT Pro 不限量,上下文窗口 128K。
GPT-5.5 Thinking,付费可选。ChatGPT Plus 和 Business(老 Team 订阅)每周 3000 条爽用,几乎用不完,上下文窗口 256K。ChatGPT Pro 不限量,上下文窗口 400K。
GPT-5.5 Pro 只有 Pro、Business、企业和教育用户能用。
记忆增强和个性化功能目前只对网页版 Plus 和 Pro 用户开放,手机端很快跟进。
GPT-5 系列从发布到现在,被骂了快一年。网上 5000 多人联名要求换回老模型,70% 和信任有关的讨论都是负面的。
骂得最多的就两件事。瞎编乱造、废话太多。
Sam Altman 这次虽然没有「感受到原子弹爆炸」,但看得出来他同样很激动。
5.5 Instant 全改了。已经搬到 Claude 的朋友们,可以考虑回来了。
我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。
热门跟贴