Openai o1系列模型：博士级理科水平，但阉割严重像半成品，且太贵

AI先锋官

2024-09-13 08:54 ·北京

作者｜子川

来源｜AI先锋官

在毫无预兆的情况下，Open ai最新大模型它来了！！！

今天凌晨，Open ai宣布最新模型OpenAI 发布了 o1 系列模型，包括 o1-preview 和 o1-mini。

不过更强的o1正式版模型并未发布。

此次发布的o1 系列模型就是之前内部代码为“草莓”模型。

目前，o1模型已经逐步向所有ChatGPT Plus和 Team用户开放！

赶紧去看一下自家的ChaTGPT是否已经成功上车。

下面就带大家全面了解此次发布的o1模型。

此次o1模型在推理能力方面表现尤为突出。相关评估如下图所示：

还未发布的o1正式版在国际数学奥林匹克竞赛（IMO）的资格考试中得分83%，o1 预览版，是56.7%，对比之下GPT-4o仅正确解决了13%的问题。

这个成绩相当于进入全国前 500 名学生的水平，甚至超过了美国数学奥林匹克的入围标准

在竞争性编程问题 (Codeforces) 中。GPT4o准确率仅为11.0%，而o1 预览版为62%，o1正式版，更是达到了89%。

而在博士级科学问题 (GPQA Diamond)，GPT4o的准确率是56.1%，人类专家水平是69.7%，而o1达到了78%。

同时o1模型在机器学习基准测试中、理化生等考试中、化物生的博士级科学问题上显著超越GPT-4o。

也是有史以来，第一次取得如此成绩的模型。

面对这么强的模型，奥特曼做出了相应的调整。

o1预览版每周30条，o1-mini每周50条。

没错，你没看错，一周只能发30条信息。。。

对于 API 用户，o1预览版每百万输入15美元，每百万输出60美元。

价格太恐怖了！！！

o1-mini则会便宜一些，每百万输入3美元，每百万输出12美元。

如果你的等级在 Tire5 （支付金额>1000 美金），已经可以通过接口进行调用o1系列模型啦。

此前就有了解到，o1模型将会被阉割。但没想不到阉割的如此严重。

小编会感觉o1模型只是一个半成品，就被奥特曼急匆匆的推出台前。

o1-preview模型支持长达128k 上下文，最大32k的输出。而o1-mini支持128k的上下文以及最大64k的输出。

当然，此次o1模型的最大特点就是思考时长，和之前测试者透露的相同，目前o1花费在思考上的时间是几秒到十几秒。

不过，关于o1模型具体的表现还有待发酵。

这么贵的草莓会更好吃吗？

此次推出的o1系列模型是否会将其他模型远远甩出身后？

我们拭目以待！！！

扫码邀请进群，我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型，顺便学一些AI搞钱技能。

往期文章回顾

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴