两天前还是传闻的OpenAI推理功能模型,现在已经加速上线了。这个代号为“草莓”的模型,如今正式命名为“OpenAI o1”,并迅速发布。虽然目前只推出了预览版和迷你版,但这已经足够引起业界广泛关注。

o1模型凭借全新的训练方式,带来了颠覆性的进步。相比之前的GPT模型,它不仅能回答更复杂的编程、数学和科学问题,还能在回答之前进行“思考”。这让它的推理速度和准确性都比人类要快得多,特别是在处理编程任务时尤为高效。对于那些想要在这些领域解决复杂问题的人,o1模型无疑是个强大工具。

新发布的迷你版主要面向编程应用场景,虽然功能相对简单,但价格更亲民。而对于普通用户来说,只要是ChatGPT Plus或Team的付费会员,现在就可以通过界面中的下拉菜单手动选择这两种新模型。免费用户虽然要等一段时间,但未来也会有机会接触迷你版。

然而,开发者使用o1模型的成本可不低。根据OpenAI的定价,o1-preview的收费高达GPT-4o的三倍,输出的费用更是高达四倍。不过,这高昂的费用背后,是o1通过奖励和惩罚机制的强化学习训练,彻底改变了AI处理问题的方式。

相比传统的GPT模型,o1不仅能模拟现有的数据范式,还能通过“思路链”的方式逐步推理,像人类一样一步步解答问题。通过这种方式,它能有效解决复杂的编程和数学难题,甚至在一场国际奥数竞赛中,取得了高达83%的正确率,而GPT-4o仅为13%。

不过,o1模型的优点不仅限于编程和数学,它在处理更复杂的逻辑推理任务时,也能大展身手。汤森路透的副总裁Pablo Arredondo在测试后表示,o1在分析法律摘要和解决法学院入学考试中的逻辑题时,表现明显优于之前的模型。

更令人兴奋的是,o1的推理能力随着“思考”时间的增加而变得更强。这意味着在处理复杂任务时,模型可以花更多时间去考虑问题的各个部分,从而做出更加精准和全面的解答。安全性方面,o1也有显著提升,能够更好地遵循安全准则,在“越狱测试”中表现也优于之前的版本。

但即便如此,o1仍然有一些明显的不足。例如,当前的版本无法浏览实时网页,也无法上传文件或图片,这在某些场景下限制了它的能力。此外,它依然可能产生“幻觉”,即AI会编造答案,尤其是在处理陌生问题时,这一点和之前的GPT模型类似。

尽管如此,OpenAI依然对未来充满信心。他们计划在未来逐步推出o1的更新版本,提升其推理能力,甚至让它能处理长达数小时甚至数天的推理任务。此外,还将逐步增加网页浏览、文件上传等功能,以期让它变得更加全面和强大。

随着AI领域竞争的加剧,o1模型的发布正值OpenAI寻求巨额融资的关键时刻。未来,随着更多公司加入推理AI的开发竞赛,OpenAI如何进一步推动o1的广泛应用,将成为它面临的最大挑战之一。

总的来说,o1模型无疑是AI推理能力上的重大突破,它不仅让复杂问题的解决变得更加高效,还为编程、数学等领域的应用带来了全新的可能性。未来,我们可以期待它在更多领域的广泛应用。

我们看到昨天美股一度表现低迷,但在OpenAI新模型发布后,科技板块出现了拉升,英伟达涨近2%。

此前一个交易日,老黄说英伟达新品仍供不应求,带动了英伟达股价大涨超8%,而后OpenAI及时助攻,带动科技板块连续上涨!

纳指四连涨站上72日线,标普500四连涨后离历史新高仅差1%左右的距离!

吴哥坚定认为AI的宏伟叙事仅是拉开帷幕,未来将更加精彩!

打开网易新闻 查看精彩图片