4月23日,OpenAI正式发布GPT-5.5,这是其最新也是最智能、最直观的模型,被定位为“一种新型智能,用于真实工作”,标志着AI从对话助手向自主完成复杂任务的“代理型”工具迈出重要一步。 OpenAI表示,GPT-5.5在理解用户意图、自主规划和执行多步骤任务方面显著提升。它擅长编写和调试代码、在线研究、数据分析、创建文档和表格、操作软件,并在多个工具间切换直至任务完成。用户无需逐一指导每个步骤,只需给出模糊的多部分任务,模型就能自主规划、使用工具、检查结果并持续推进。 在性能上,GPT-5.5实现了智能水平的大幅跃升,同时保持了与GPT-5.4相当的每token延迟,并在实际任务中显著减少token消耗,效率更高。它在代理编码、计算机使用、知识工作和早期科学研究等领域表现尤为突出。 根据官方基准测试,GPT-5.5在Terminal-Bench 2.0上达到82.7%的准确率,在GDPval上获得84.9%胜率或平局,在OSWorld-Verified上达到78.7%,多项指标领先于前代模型及Claude Opus 4.7、Gemini 3.1 Pro等竞品。GPT-5.5 Pro版本在复杂任务中表现更强,适合高难度知识工作。 OpenAI强调,本次发布配备了迄今最强的安全防护措施,经过全面安全评估、红队测试和近200家早期合作伙伴反馈。目前,GPT-5.5已向ChatGPT Plus、Pro、Business和Enterprise用户以及Codex用户开放,GPT-5.5 Pro同步向Pro及以上用户推出。API版本即将上线。 Sam Altman表示:“GPT-5.5来了!希望它对你有用,我个人很喜欢它。”他强调OpenAI坚持迭代部署、民主化和帮助用户获胜的理念。 GPT-5.5的发布进一步加速了AI在软件工程、科学研究和日常办公中的落地,被视为OpenAI向“代理AI”基础设施迈进的关键一步。
4月23日,OpenAI正式发布GPT-5.5,这是其最新也是最智能、最直观的模型,被定位为“一种新型智能,用于真实工作”,标志着AI从对话助手向自主完成复杂任务的“代理型”工具迈出重要一步。 OpenAI表示,GPT-5.5在理解用户意图、自主规划和执行多步骤任务方面显著提升。它擅长编写和调试代码、在线研究、数据分析、创建文档和表格、操作软件,并在多个工具间切换直至任务完成。用户无需逐一指导每个步骤,只需给出模糊的多部分任务,模型就能自主规划、使用工具、检查结果并持续推进。 在性能上,GPT-5.5实现了智能水平的大幅跃升,同时保持了与GPT-5.4相当的每token延迟,并在实际任务中显著减少token消耗,效率更高。它在代理编码、计算机使用、知识工作和早期科学研究等领域表现尤为突出。 根据官方基准测试,GPT-5.5在Terminal-Bench 2.0上达到82.7%的准确率,在GDPval上获得84.9%胜率或平局,在OSWorld-Verified上达到78.7%,多项指标领先于前代模型及Claude Opus 4.7、Gemini 3.1 Pro等竞品。GPT-5.5 Pro版本在复杂任务中表现更强,适合高难度知识工作。 OpenAI强调,本次发布配备了迄今最强的安全防护措施,经过全面安全评估、红队测试和近200家早期合作伙伴反馈。目前,GPT-5.5已向ChatGPT Plus、Pro、Business和Enterprise用户以及Codex用户开放,GPT-5.5 Pro同步向Pro及以上用户推出。API版本即将上线。 Sam Altman表示:“GPT-5.5来了!希望它对你有用,我个人很喜欢它。”他强调OpenAI坚持迭代部署、民主化和帮助用户获胜的理念。 GPT-5.5的发布进一步加速了AI在软件工程、科学研究和日常办公中的落地,被视为OpenAI向“代理AI”基础设施迈进的关键一步。

JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图