日前,OpenAI正式发布最新一代旗舰大模型系列GPT-5.5,并表示这是其迄今为止最智能、最直观易用的模型,是一种用于实际工作的新型智能,标志着计算机工作方式的革新。
据OpenAI方面介绍,GPT-5.5能快速理解用户意图,自主规划并执行多步骤复杂任务,包括在处理模糊问题时展现出更强的自主性,“你无需精心管理每个步骤,只需将复杂且包含多个部分的任务交给GPT-5.5,然后信任它能够自行规划、使用工具、检查工作、应对各种不确定性并持续推进”。
据悉,GPT-5.5在智能体编码、计算机应用、知识工作和早期科学研究等领域均实现显著提升。
以智能体编码为例,OpenAI方面表示,GPT-5.5是其迄今为止最强大的智能体编码模型。OpenAI公布的相关评测结果显示,GPT-5.5在Terminal-Bench 2.0中得分82.7%、较GPT-5.4的75.1%有明显提升,在Expert-SWE中得分73.1%、高于GPT-5.4 的68.5%,在SWE-Bench Pro中得分58.6%。
而在科研场景,OpenAI将GPT-5.5定位为能够参与研究全流程的协作者,而非仅仅提供信息检索。据了解,GPT-5.5在GeneBench、BixBench等评测中的表现均优于GPT-5.4。此外OpenAI方面透露,一个搭配定制工具的GPT-5.5内部版本协助发现了一个关于拉姆齐数的新数学证明,并已在形式化证明工具Lean中得到验证。
OpenAI方面强调,GPT-5.5在提升智能的同时,并未牺牲响应速度。据了解,GPT-5.5在实际应用中的每token延迟与GPT-5.4相当,同时智能水平却更高。此外,GPT-5.5完成相同Codex任务所需的Token数量也有显著减少。
据了解,目前GPT-5.5已面向ChatGPT Plus、Pro、Business和Enterprise用户推出,GPT-5.5-Pro则面向ChatGPT Pro、Business和Enterprise用户推出。相关API服务即将上线,其中GPT-5.5输入定价为每百万Token 5美元,GPT-5.5-Pro输入定价为每百万Token 30美元。
【本文图片来自网络】
热门跟贴