今天,OpenAI 发布了 GPT-5.1,一个常规升级,不是很重要

这个更新,会优先推送给付费用户,然后向所有人推送

现在的 ChatGPT 首页变成了这样
打开网易新闻 查看精彩图片
现在的 ChatGPT 首页变成了这样

本次更新主要针对两个模型,并同步发布了安全评估报告:

  • GPT-5.1 Instant: 基础模型,核心是提升对话体验和增加自适应推理。抗越狱能力增强

  • GPT-5.1 Thinking: 高级推理模型,核心是实现动态推理时间和优化表述。安全评估显示,在处理骚扰、仇恨言论等内容时有轻微退步

打开网易新闻 查看精彩图片
GPT-5.1:我是 GPT-5 上的小版本升级 GPT-5.1 Instant

Instant 是最常用的基础模型,核心改进两点:对话风格和自适应推理,风格上,更接近日常对话

(吐槽:GPT-5 的语言风格一言难尽)

按 OpenAI 自己的说法,GPT-5.1 首次加入了自适应推理:遇到复杂问题时可自行决定增加思考,提升回答准确性

但在目前网页版上,这个模型似乎完全没有推理

可能模型还没更新好 GPT-5.1 Thinking
打开网易新闻 查看精彩图片
可能模型还没更新好 GPT-5.1 Thinking

高级推理模型,核心改进是效率的动态调整

模型能根据问题难度分配思考时间:简单问题响应更快,复杂问题则投入更多时间进行深度推理

GPT-5.1 在最快任务上大约快两倍,在最慢任务上多耗时 71%
打开网易新闻 查看精彩图片
GPT-5.1 在最快任务上大约快两倍,在最慢任务上多耗时 71%

此外,回答的表述更清晰,减少了专业术语的使用

个性化与自定义

新增了专业 (Professional)坦率 (Candid)古怪 (Quirky)等预设风格

同时,开放了对简洁度、热情度、emoji 频率等参数的自定义。所有设置会即时在全部对话中生效

在设置页面,你可以看到 安全与评估
打开网易新闻 查看精彩图片
在设置页面,你可以看到 安全与评估

OpenAI 同步发布了 GPT-5.1 的 System Card 附录,关键信息如下:

  • 安全基准: 整体安全性能与 GPT-5 持平。但gpt-5.1-thinking在处理涉及骚扰、仇恨言论和违禁色情内容时,出现了“轻微退步 (light regressions)”。

  • 新增评测维度: 安全评估范围扩大,新增了针对“心理健康”和“情感依赖”的专项测试。

  • 越狱能力: 在 StrongReject 越狱测试中,gpt-5.1-instant的表现优于前代,gpt-5.1-thinking则与前代持平。

  • 风险框架: 延续了 GPT-5 的评估,GPT-5.1 在生化领域仍被视为高风险,并继续应用相应安全措施。在网络安全和 AI 自我完善方面,模型没有达到高风险阈值的可能性。

打开网易新闻 查看精彩图片
  • 推送节奏:付费用户先行,然后是免费和未登录用户。

  • API:本周晚些时候更新。Instant对应gpt-5.1-chat-latestThinking对应gpt-5.1

  • 旧模型:GPT-5 将为付费用户保留三个月。

打开网易新闻 查看精彩图片
现有的模型