今天,OpenAI 发布了 GPT-5.1,一个常规升级,不是很重要
这个更新,会优先推送给付费用户,然后向所有人推送
本次更新主要针对两个模型,并同步发布了安全评估报告:
•GPT-5.1 Instant: 基础模型,核心是提升对话体验和增加自适应推理。抗越狱能力增强
•GPT-5.1 Thinking: 高级推理模型,核心是实现动态推理时间和优化表述。安全评估显示,在处理骚扰、仇恨言论等内容时有轻微退步
Instant 是最常用的基础模型,核心改进两点:对话风格和自适应推理,风格上,更接近日常对话
(吐槽:GPT-5 的语言风格一言难尽)
按 OpenAI 自己的说法,GPT-5.1 首次加入了自适应推理:遇到复杂问题时可自行决定增加思考,提升回答准确性
但在目前网页版上,这个模型似乎完全没有推理
高级推理模型,核心改进是效率的动态调整
模型能根据问题难度分配思考时间:简单问题响应更快,复杂问题则投入更多时间进行深度推理
此外,回答的表述更清晰,减少了专业术语的使用
个性化与自定义
新增了专业 (Professional)、坦率 (Candid)、古怪 (Quirky)等预设风格
同时,开放了对简洁度、热情度、emoji 频率等参数的自定义。所有设置会即时在全部对话中生效
OpenAI 同步发布了 GPT-5.1 的 System Card 附录,关键信息如下:
•安全基准: 整体安全性能与 GPT-5 持平。但
gpt-5.1-thinking在处理涉及骚扰、仇恨言论和违禁色情内容时,出现了“轻微退步 (light regressions)”。•新增评测维度: 安全评估范围扩大,新增了针对“心理健康”和“情感依赖”的专项测试。
•抗越狱能力: 在 StrongReject 越狱测试中,
gpt-5.1-instant的表现优于前代,gpt-5.1-thinking则与前代持平。•风险框架: 延续了 GPT-5 的评估,GPT-5.1 在生化领域仍被视为高风险,并继续应用相应安全措施。在网络安全和 AI 自我完善方面,模型没有达到高风险阈值的可能性。
•推送节奏:付费用户先行,然后是免费和未登录用户。
•API:本周晚些时候更新。
Instant对应gpt-5.1-chat-latest,Thinking对应gpt-5.1。•旧模型:GPT-5 将为付费用户保留三个月。
热门跟贴