o1模型前进一步又退了两步，OpenAI承认GPT4o仍是最佳选择|openai|人工智能|大模型|推理|算法

成本与效率：o1 模型的经济负担

OpenAI 在周四推出了全新的 o1模型，这是首款让 ChatGPT 在回答问题之前进行 “思考 ”的 AI。这款代号为 “Strawberry”的模型备受关注，但它是否真能达到预期的高效表现？

相比之下， o1 模型虽然在处理复杂问题上显示出其推理能力，却也暴露出一些不足。其运行成本是 GPT-4o 的四倍，缺乏后者的工具支持、多模态功能和快速响应能力。甚至 OpenAI也在官方帮助页面上推荐，对于多数情况下， GPT-4o 依然是更优选择，并指出 o1 在处理简单问题上的表现并不理想。

多步骤推理的潜力与限制

纽约大学的人工智能研究教授拉维德 ·施瓦茨 ·齐夫对此评价道： “虽然它在某些领域表现出色，但并未呈现出全方位的进步。 ”因此， o1 模型应专注于解决那些它真正擅长的复杂问题。当前大多数人使用 AI 主要不涉及这类复杂问题，因为现有的 AI 模型尚未在此领域做到精准有效。

然而， o1 模型的推出无疑是向这一目标迈出的重要一步。 OpenAI 的 o1 模型引入了一种独特的 “ 多步骤推理 ” 技术，通过先 “ 思考 ” 后回答，将复杂问题拆解成可管理的小步骤，评估每一步的正确性。虽然这种方法并非全新，研究界和一些平台如 You.com 已经探索了多年，但其实用性是近期才得到增强的。

市场反应与专家观点：o1 模型的接受度

Workera 的首席执行官兼斯坦福大学兼职讲师 Kian Katanforoosh 提到： “在 AI 社区中，这种能力让人兴奋不已。结合强化学习算法和语言模型技术，我们可以训练出逐步推理的 AI，这种 AI 能够从复杂的大问题中逐步倒推找出解决方案。 ” 然而， o1 模型的使用成本较高。它不仅收费标准包括输入和输出代币，还包括了一个不公开的计算过程，即模型在内部处理和拆解问题的步骤，因此使用者实际支付的代币可能超出直观预期。

自从去年 11 月关于 OpenAI 董事会罢免 Sam Altman 的报道后，围绕其推理模型 “Strawberry”便布满了猜测。一些声音甚至猜测这可能是朝着（ AGI）迈进的一步，尽管 Altman 已明确否认 o1 模型是 AGI。他通过推特降低了人们对此次发布的期待，指出 o1 模型仍存在缺陷和局限性，其初次使用的印象可能比长期使用更加深刻。

o1 模型是否值得投入？

这种对新技术的高预期与实际体验之间的差距在 AI 领域并不少见。 OpenAI 的过度炒作部分超出了它的控制范围，如 ReWorkd 的研究工程师 Rohan Pandey 所指出，该公司利用 OpenAI 模型开发了一个网络爬虫工具，希望 o1 能够解决 GPT-4 未覆盖的特定复杂问题。而这种期望反映了行业对 o1 的普遍看法，即它不太可能带来像 GPT-4 那样的革命性进步。

Brightwave 的 CEO Mike Conover 表达了一个更为温和的观点，他认为尽管人们期待技术能实现飞跃性的发展， o1 的出现并未清晰标示这一点。

随着人工智能模型的成本普遍下降， o1 的较高价格引发了市场上的关注。这引出了一个问题：这样一个强大但昂贵的工具是否值得投资？尤其是在当前人工智能模型中， o1 是少数几个标价上涨的例子之一。这种情况下，评估其成本效益变得尤为重要