鞭牛士报道,12月6日消息,据外电报道,周四,在「OpenAI 12 天」活动的现场演示中,OpenAI 宣布推出新版 ChatGPT,其使用限制更高,每月收费 200 美元,并推出「o1」的完整版本,「o1」是该公司于 9 月推出的所谓推理模型的完整版本。

与 o1-preview 不同,o1 现在可以处理图像和文本(类似于 GPT-4o),据报道它比 o1-preview 快得多。

在一个关于罗马皇帝的演示问题中,o1 花了 14 秒回答,而 1 个预览花了 33 秒。

据 OpenAI 称,o1 犯重大错误的次数比 o1-preview 少 34%,而思考速度快 50%。一旦部署完成,将 GPU 转换为新模型,该模型的速度也会变得更快。

目前尚不完全清楚新的ChatGPT Pro订阅是否值得每月 200 美元的费用,但该公司明确表示,用户将可以使用功能更强大的 o1 版本,即o1 Pro 模式,该版本将进行更深入的推理搜索,并在回答问题之前提供对更困难问题的更强大的思考能力。

今天,我们推出了 ChatGPT Pro,这是一项每月 200 美元的计划,可让您大规模访问 OpenAI 的最佳模型和工具。该计划包括无限制访问我们最智能的模型 OpenAI o1,以及 o1-mini、GPT-4o 和 Advanced Voice。它还包括 o1 pro 模式,这是 o1 的一个版本,它使用更多的计算来更深入地思考,并为最困难的问题提供更好的答案。未来,我们预计将为该计划添加更强大、计算密集型的生产力功能。

这项新服务似乎针对的是那些可能受益于更高速率限制和更多计算时间来得出答案的人。

OpenAI 在其新闻稿中写道: ChatGPT Pro 为研究人员、工程师和其他每天使用研究级智能的个人提供了一种方法来提高他们的生产力并处于人工智能进步的前沿。

在 X 上,经常进行人工智能实验的 Ethan Mollick写道:我玩了 o1 和 o1-pro 一段时间。它们非常好,但有点奇怪。它们大多数时候也不适合大多数人。你真的需要解决一些特别困难的问题才能从中获得价值。但如果你遇到了这些问题,这是一件大事。

OpenAI 声称可靠性有所提高

OpenAI 大力宣传专业模式的可靠性得到提升,该模式内部评估的依据是它是否能在四次尝试中四次正确解决问题,而不是一次尝试。

OpenAI 写道:在外部专家测试人员的评估中,o1 pro 模式能够产生更可靠、更准确、更全面的响应,尤其是在数据科学、编程和案例法分析等领域。

即使没有专业模式,OpenAI 也指出,在流行的数学和编码基准测试(AIME 2024 和 Codeforces)上,其性能比 o1 预览模型有显著提升,在博士级科学基准测试(GPQA Diamond)上也有更微小的改进。

在这些基准测试中,o1 和 o1 专业模式之间的分数增幅要小得多。

一旦 o1 的完整版本广泛推出,媒体可能会对其进行更多报道——它应该在今天推出,全球的 ChatGPT Plus 和 Team 用户都可以使用。企业和教育用户将于下周开始使用。