凌晨 1 点,OpenAI 悄悄上线了o1模型

打开网易新闻 查看精彩图片

相比过去的 GPT 系列,o1模型不仅具备超强的推理能力,还可以像人类一样仔细思考

你没听错!AI 不再是那种"秒答"的小助手,而是升级成一个深思熟虑”的大脑

o1 模型到底有多强?

大家都知道 GPT-4 强大,但o1模型直接超越了 GPT 系列,以更强的推理能力登场。

打开网易新闻 查看精彩图片

之前 OpenAI 推出的 GPT 模型已经很能干了,比如帮我们写文章、编程、回答各种问题。而这次,o1让 AI 变得更聪明,尤其在处理复杂问题时简直堪称神器。

根据 OpenAI 的测试,o1模型在一些高难度的数学和科学问题上达到了令人难以置信的准确度。在 2024 年的美国数学邀请赛(AIME)中,o1模型的正确率高达 83%,直接进入了美国前 500 名数学高手的行列。而GPT-4o 的正确率仅为 13%,差距简直巨大!

打开网易新闻 查看精彩图片

另外,o1在编程比赛中的表现也相当亮眼,尤其是在 Codeforces 上,它的Elo 评分达到了 1807高于 93% 的竞争对手,这简直是 AI 编程能力的又一次飞跃。要知道,GPT-4o 在这方面的 Elo 评分只有 808,对比之下,o1 不仅速度快,准确率也高得惊人。

打开网易新闻 查看精彩图片

o1 模型的“深思熟虑”

一直以来,AI 模型的发展都受到推理能力的局限,但 OpenAI 的 o1 模型似乎彻底打破了这个瓶颈。它不再像以往的模型那样只靠海量数据进行“死记硬背”,而是引入了强化学习机制。用通俗的话说,o1 会在给出答案之前“思考”。它会在响应问题之前形成一个“思维链”,这让它在复杂问题上表现得像个真正的思考者。

这就好比你问一个人难题,他不会马上回答,而是先沉思片刻,整理思路再做出回复。而 o1 的思维链和推理能力,在OpenAI的测试中表现出色,甚至超过了很多博士级别的专家。

这可是一个真正的飞跃!这也让OpenAI CEO 奥特曼在发布会上直言:“虽然 o1 还有缺陷,但第一次使用它时,你一定会被它震撼到。”

打开网易新闻 查看精彩图片

更贵、更慢,但更聪明的 o1

虽然o1模型的能力非常强大,但它也有一些明显的不足。

首先,它的推理速度比较慢。

与 GPT 系列不同,o1需要花费10 到 20 秒来生成答案。这意味着,如果你想让o1来回答一些简单的问题,它可能会显得“有点笨拙”,因为它需要花更多时间去“思考”。

打开网易新闻 查看精彩图片

其次,o1 的使用成本也非常高。

据 OpenAI 透露,在 API 中,o1-preview每 100 万个 token 的输入费用为 15 美元,输出费用高达 60 美元,比 GPT-4o 高出3到4倍。这对于一些小型企业或个人开发者来说,可能会带来不小的经济负担。

打开网易新闻 查看精彩图片

虽然速度慢、价格高,但o1的推理能力确实让它在应对复杂问题时无可替代。如果你是编程、科学研究、数学推理等领域的从业者,o1将会是你最强的帮手。

o1-mini价格友好的选择

为了让更多用户能够体验到o1的强大,OpenAI 还发布了o1-mini版本。相比o1-preview,o1-mini的推理能力稍微弱一点,但它更加高效、价格也更加亲民。

打开网易新闻 查看精彩图片

这个版本专门为STEM(科学、技术、工程、数学)领域进行了优化,尤其在编程任务中表现不俗。

o1-mini在数学竞赛中的表现也很出色,得分与o1-preview相差不大,但它的使用成本更低。如果你是一个开发者,想要体验o1的强大推理能力,那么o1-mini可能是一个不错的选择。

打开网易新闻 查看精彩图片

o1将如何改变未来?

目前,ChatGPT Plus 和 Team 用户已经可以通过 ChatGPT 使用o1-preview和o1-mini。不过,每位用户每周只能发送 30 条o1-preview消息,或 50 条o1-mini消息。

打开网易新闻 查看精彩图片

对于企业和教育用户,OpenAI 计划下周开放这两个模型的使用权限。如果你是开发者,还可以通过 API 使用o1进行应用开发。不过,API 的使用速率有限,每分钟只能发 20 次请求。

打开网易新闻 查看精彩图片

未来,OpenAI 还计划为o1增加更多功能,比如网络浏览、文件和图片上传等。随着这些功能的逐步推出,o1的应用场景将会更加广泛,不仅在科学、编程、教育等领域有巨大的潜力,甚至可能在更多日常生活中得到应用。