智东西
编译 杨蕊伃
编辑 漠影
智东西9月14日消息,据VentureBeat昨日报道,美国大模型独角兽OpenAI发布了增强推理能力的大语言模型,包括o1-preview和更简化的o1-mini(OpenAI草莓模型深夜突袭!理化生达博士生水平,比GPT-4o强多了,ChatGPT可用)。据悉,这两个新模型将为开发者提供强大的推理能力,特别是在科学、技术、工程和数学(STEM)领域。
目前,这两个模型已向ChatGPT Plus用户以及使用OpenAI付费API的开发者开放。因此,开发者现在可以在现有的第三方应用和服务中测试这些模型,或者利用它们构建新的应用和服务。
o1-Preview和o1-mini模型目前专注于文本处理,在编码和文书起草上表现出色,还能够进行计划生成、风险评估、创建应用程序和游戏、自动完成提案请求、策略化参与等,但在内容快速响应方面还有待提升。
不过,o1系列模型并不是多模态的,在某些应用场景下并不能完全替代GPT-4o,如图像输入、函数调用等。
据悉,o1系列模型目前仅向“Tier 5”级别的用户群体开放,且暂时不支持批量请求,每分钟最多处理20个请求,不太适用于需要快速连续响应的应用场景。
其中,o1-preview模型在提供广泛的“世界知识”方面表现出色,是OpenAI目前提供的最昂贵的AI模型。
开发人员可以通过OpenAI的公共API以及微软Azure OpenAI Service、Azure AI Studio和GitHub Models来访问这些新的OpenAI o1模型。
一、多模态功能缺失:o1系列模型仅支持文本处理,无法完全取代GPT-4o
新的o1模型采用了一种“推理”机制,OpenAI称,它们会“尝试多种策略,识别错误,并进行完整的思考过程”。OpenAI的API技术负责人Michelle Pokrass在接受VentureBeat的视频电话采访时,分享了模型开发背后的一些理念。
Michelle Pokrass称:“在我们的测试中,这些模型在一些最具挑战性的基准测试中表现的像博士生一样。”OpenAI的产品负责人Nikunj Handa也向VentureBeat表达了他对o1模型家族的看法。他认为,o1模型在处理“推理相关问题”方面“比GPT系列表现得要好得多”。
o1-preview和o1-mini模型目前仅支持文本输入和输出,这意味着它们在功能上还无法完全取代GPT-4o。GPT-4o是OpenAI当前最先进模型,它不仅能够处理文本,还支持多模态输入和输出,包括分析文件附件和生成图像。因此,对于需要这些高级功能的第三方开发人员来说,GPT-4o仍然是更合适的选择。
根据Pokrass和Handa的说法,o1系列模型并不是多模态的。此外,这些模型目前还不能浏览网页,因此无法获取2023年10月之后的新信息。不过,用户可以通过文本输入来提供最新知识,供模型参考和分析。
在生成输出时,它们的速度也较慢,有时需要超过一分钟,在某些情况下甚至可能需要几分钟。
▲用户反映o1-preview模型生成速度有时候有点慢(图源:X截图)
一些获得早期访问权限的开发者反馈,这些模型在编码和起草法律文件等任务上的性能有所提高。因此,对于愿意尝试并为更高效能支付额外费用的开发者而言,o1-preview和o1-mini模型仍然是值得考虑的选择。
就像OpenAI在其o1-preview和o1-mini推理模型的API文档中所说:“对于需要图像输入、函数调用或快速响应的应用程序,GPT-4o及其mini是合适的选择。然而,如果您的目标是开发需要深度推理并能容忍较长响应时间的应用程序,o1模型可能是更好的选择。”
二、o1系列限制每分钟最多20个请求
o1-preview和o1-mini模型最初仅向“Tier 5”用户开放,这是指那些通过API消费达到1000美元,并且至少在30天前就已经向公司支付过费用的用户。
OpenAI称,新o1模型系列目前处于预览阶段,与其他模型相比,它们有特定的使用限制。o1模型的限制是每分钟最多20个请求,这意味着它们不适合需要快速连续响应的应用场景。此外,o1模型目前不支持批量请求,这与OpenAI的其他模型不同,后者可以将请求集中处理,通常在24小时内返回结果,且成本较低。
据OpenAI的API技术负责人Michelle Pokrass介绍,o1-preview模型提供了更多STEM之外学科的“世界知识”,是目前提供的最昂贵的OpenAI AI模型。其价格为每输入100万个token 15美元,每输出100万个token 60美元。相比之下,GPT-4o的价格为每输入100万个token 15美元,每输出100万个token 4美元。这意味着,o1-preview模型的价格比GPT-4o高出200%到300%。
对比之下,o1-mini模型的价格较为经济,其费用为每输入100万个token 3美元,每输出100万个token 12美元,这比o1-preview模型便宜了80%。
Pokrass说:“当然,我们将在接下来的几周和几个月内调整定价,以将其调整到合适的水平。”
▲OpenAI各种领先模型的定价明细
三、o1系列模型能做什么:生成计划、评估风险、创建游戏、请求提案、增长黑客……
在处理上下文方面,o1系列模型的限制与GPT-4o以及其他OpenAI的顶级模型相当,能够处理最多128000个token,这包括了输入和输出。
o1-preview模型在单次输出或响应中最多可以生成32768个token,而o1-mini可以生成双倍的数量,即65536个token。
此外,部分开发人员在o1-previews和o1-mini发布后就开始考虑如何使用它,并对其进行测试,看看它能做什么,不能做什么。
基于这项工作,以下是o1-preview和o1-mini模型迄今为止最有趣的一些用途。
1、生成计划和白皮书:一些用户报告称,o1模型系列能够生成详尽的行动计划和完整的文档,比如仅凭简单提示就能生成引用充分的白皮书。
▲o1-preview能生成关于企业生成式AI用例的白皮书(图源:X截图)
2、规划、基础设施和风险评估:AI影响者和企业顾问Allie K.Miller在X上分享了一系列的OpenAI o1-preview模型的输出示例,这些示例展示了该模型在多个领域的应用能力,包括优化员工的组织日程安排、评估合并风险、设计更高效的仓库,以及平衡城市电网等任务。
3、快速创建应用程序和游戏:OpenAI的o1-preview模型似乎是对Anthropic的Claude系列,尤其是其Artifacts功能的直接竞争,因为它同样为用户提供了一种强大且快速的方式来生成自己的交互式应用程序和游戏。
▲o1和Cursor Composer能创建应用程序(图源:X截图)
4、自行完成提案请求(RFP):承包商,特别是那些为政府机构提供服务的,对提案请求(RFP)非常熟悉。RFP是机构以标准化格式征求合同投标的一种方式,这个过程既繁琐又耗时。宾夕法尼亚大学沃顿商学院的教授Ethan Mollick在X上发布消息称,o1-preview模型能够自主填写RFP,尽管它仅限于文本输入,并且不接受文件上传。
5、策略化参与和增长黑客:EasyGen是一款用于自动生成LinkedIn帖子的Chrome应用程序,其创始人Ruben Hassid在X上发布了一段演示视频,展示了o1-preview模型如何能够生成一个全面且合理的计划,以使用Reddit来帮助他的公司发展。
然而,网络通知初创公司Engagespot的首席技术官Anand Sukumaran认为,GPT-4o在编写简单程序时速度更快。
结语:OpenAI将继续优化o1及GPT系列模型,给用户提供更多的应用构建选择
VentureBeat作者认为,尽管o1系列可能并不适合部分开发人员,但它的推出对于那些有实验空间并希望开发新应用程序和服务的开发人员来说,无疑是一个激动人心的时刻。
OpenAI还承诺将继续推进o1系列及其GPT系列的能力,这意味着那些希望在这家AI公司的平台上构建应用程序的开发者将拥有丰富的选择。
随着这些模型的不断优化和升级,它们将在诸如文学、艺术等更多领域展现出应用潜力。
来源:VentureBeat
热门跟贴