打开网易新闻 查看精彩图片

OpenAI 正式把 ChatGPT 的默认模型换成了 GPT-5.5 Instant。这次更新重点解决两大痛点:模型胡编乱造(幻觉)大幅减少,回复也变得更干练、不废话。

新模型取代了之前的 GPT-5.3 Instant,通过 API 调用时对应名称是“chat-latest”。OpenAI 内部测试显示,在处理医疗、法律、金融等高风险的提示时,GPT-5.5 Instant 的幻觉声称比前代减少了 52.5%。而在用户曾标记为事实出错的困难对话里,不准确表述下降了 37.3%。举个例子,遇到代数题,新模型能直接纠正用户计算错误并给出正确答案,而旧模型做不到。

多个硬核基准测试也验证了提升:

  • 2026 年 AIME 数学竞赛准确率从 65.4% 飙升到 81.2%

  • 博士级科学推理测试 GPQA 从 78.5% 提高到 85.6%

  • 科学图表推理 CharXiv 从 75.0% 升至 81.6%

  • 跨文本图像专业题 MMMU-Pro 从 69.2% 涨到 76.0%

  • 复杂文档结构化提取 OmniDocBench 错误率从 14.6% 降到 12.5%

打开网易新闻 查看精彩图片

回复风格也做了大手术。OpenAI 表示,新模型更简洁但信息量不缩水,不再有多余的追问、泛滥的表情包和过度花哨的格式。它能在给出相同质量信息的前提下,大幅减少废话和无效排版。另外,如果用户开启相关功能,GPT-5.5 Instant 能更好地利用历史对话、上传的文件,甚至已连接的 Gmail 账户上下文。它判断何时提供个性化帮助的能力更强,也能更快地搜到过往对话记录。

全新功能“记忆来源”也来了。当回复引用了储存的上下文(比如笔记或之前的聊天),你可以点击查看具体是哪些信息影响了这次回答。这些条目可以标记为“相关”或“不相关”,还能直接编辑或删除。不过 OpenAI 也提醒,记忆来源未必展示所有影响因素——模型搜索到的部分对话可能不会显示出来。官方计划后续逐步完善这个视图。而且,记忆来源在对话共享时不会跟着传出去,临时对话也不会读取或更新记忆。

GPT-5.5 Instant 现在正实时向所有 ChatGPT 用户推出。付费用户未来三个月内仍可以在设置里手动切回旧版 GPT-5.3 Instant,之后它就退役了。基于历史对话、文件和 Gmail 的增强个性化功能,会先在网页端面向 Plus 和 Pro 用户开放,移动端稍后跟上。免费版、Go、Business 和 Enterprise 预计未来几周内也能用上。记忆来源功能会先覆盖网页版所有消费级用户,再推送到移动端。部分个性化功能可能存在地区限制。顺便一提,OpenAI 最近还发了个更强的高阶模型 GPT-5.5 Thinking,它在网安任务上可以对标 Claude Mythos,并取代了专门的 Codex 编码模型。不过作为日常默认的,就是这款新来的 GPT-5.5 Instant。