OpenAI发布全新o1模型，奥特曼称目前“最强大”！研究员：回复思考时间变长|jerry|o1模型|openai|人工智能|奥特曼|研究员

本文来源：时代财经

9月13日凌晨，OpenAI发布全新AI大模型，较上一代的推理能力有显著提升。

OpenAI研究负责人Jerry Tworek向媒体透露，“o1是使用一种全新的优化算法和专门为其定制的新训练数据集进行训练的”，它设置了奖励和惩罚机制，通过强化学习的技术训练模型自行解决问题，它利用类似人类通过逐步解决问题方式的“思维链”处理问题。这种新的训练方法也使得模型更加准确。

OpenAI研究员Noam Brown在社交平台上提到OpenAI o1更多细节时则指出，o1系列经过强化学习训练，在通过自己的思维链做出反应前会思考，思考时间越长，推理任务表现越好。“这为大模型缩放（scaling）开辟了新维度，我们不再受预训练的瓶颈限制，现在也可以扩展推理计算了。”

o1发布后，OpenAI创始人Sam Altman（山姆·奥特曼）在社交媒体上激动地表示，“这是我们迄今为止最强大、最一致的一系列模型。”

新模型的强悍，甚至让OpenAI不惜推掉了过去GPT系列的命名，重新命名为o系列。而OpenAI o1发布，也标志着AI行业，正式进入了一个全新的纪元。

关于OpenAI o1的命名，OpenAI方面的介绍是：对于复杂推理任务来说，这是一个重要的进展，代表了人工智能能力的新水平。鉴于此，我们将计数器重置为 1，并将这一系列命名为 OpenAI o1。

据报道，对开发者来说，访问o1的成本比之前要高出很多：通过API使用o1预览版，输入每百万token要收费15美元，输出每百万收费60美元。相比之下，GPT-4o的百万token输入收费只有5美元，输出为15美元。

ChatGPT Plus和团队用户即日起便可以访问o1预览版和o1-mini，而企业和教育用户将在下周初获得访问权限。OpenAI表示，计划让ChatGPT的所有免费用户都能访问o1-mini，但尚未确定发布日期。

Noam Brown表示，o1模型并不总是比GPT-4o好，有时在个人写作和编辑文本时人们可能会偏好GPT-4o，在计算机编程、数据分析和数学计算领域则可能会偏好OpenAI o1。

“我们注意到这个模型的幻觉更少了，” Jerry Tworek说，但“幻觉”问题仍然存在，并未完全解决。

此外，Noam Brown还提到，OpenAI o1在回答前会思考几秒，但OpenAI的目标是让未来的版本思考几个小时、几天甚至几周，虽然推理成本会更高，但用户也可能会获得更多，例如在研发新抗癌药等领域。

产品迭代的同时，OpenAI的商业化也在加速。据科技媒体the Information报道，ChatGPT付费用户数已经突破1100万，有100万用户属于高价商业计划用户。OpenAI首席运营官Brad Lightcap曾表示，庞大的用户基数为OpenAI带来了丰厚的收入——每月逾2.25亿美元，年收入则有27亿美元。

（时代财经何珊珊整合自第一财经、上观、格隆汇等）