作者|子川

来源|AI先锋官

在毫无预兆的情况下,Open ai最新大模型它来了!!!

今天凌晨,Open ai宣布最新模型OpenAI 发布了 o1 系列模型,包括 o1-preview 和 o1-mini。

打开网易新闻 查看精彩图片

不过更强的o1正式版模型并未发布。

此次发布的o1 系列模型就是之前内部代码为“草莓”模型。

打开网易新闻 查看精彩图片

目前,o1模型已经逐步向所有ChatGPT Plus和 Team用户开放!

赶紧去看一下自家的ChaTGPT是否已经成功上车。

打开网易新闻 查看精彩图片

下面就带大家全面了解此次发布的o1模型。

此次o1模型在推理能力方面表现尤为突出。相关评估如下图所示:

打开网易新闻 查看精彩图片

还未发布的o1正式版在国际数学奥林匹克竞赛(IMO)的资格考试中得分83%,o1 预览版,是56.7%,对比之下GPT-4o仅正确解决了13%的问题。

这个成绩相当于进入全国前 500 名学生的水平,甚至超过了美国数学奥林匹克的入围标准

在竞争性编程问题 (Codeforces) 中。GPT4o准确率仅为11.0%,而o1 预览版为62%,o1正式版,更是达到了89%。

而在博士级科学问题 (GPQA Diamond),GPT4o的准确率是56.1%,人类专家水平是69.7%,而o1达到了78%。

同时o1模型在机器学习基准测试中、理化生等考试中、化物生的博士级科学问题上显著超越GPT-4o。

也是有史以来,第一次取得如此成绩的模型。

打开网易新闻 查看精彩图片

面对这么强的模型,奥特曼做出了相应的调整。

o1预览版每周30条,o1-mini每周50条。

没错,你没看错,一周只能发30条信息。。。

对于 API 用户,o1预览版每百万输入15美元,每百万输出60美元。

价格太恐怖了!!!

打开网易新闻 查看精彩图片

o1-mini则会便宜一些,每百万输入3美元,每百万输出12美元。

打开网易新闻 查看精彩图片

如果你的等级在 Tire5 (支付金额>1000 美金),已经可以通过接口进行调用o1系列模型啦。

此前就有了解到,o1模型将会被阉割。但没想不到阉割的如此严重。

打开网易新闻 查看精彩图片

小编会感觉o1模型只是一个半成品,就被奥特曼急匆匆的推出台前。

o1-preview模型支持长达128k 上下文,最大32k的输出。而o1-mini支持128k的上下文以及最大64k的输出。

打开网易新闻 查看精彩图片

当然,此次o1模型的最大特点就是思考时长,和之前测试者透露的相同,目前o1花费在思考上的时间是几秒到十几秒。

不过,关于o1模型具体的表现还有待发酵。

这么贵的草莓会更好吃吗?

此次推出的o1系列模型是否会将其他模型远远甩出身后?

我们拭目以待!!!

扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。

往期文章回顾