OpenAI披露o1模型更多细节，并非GPT-4o升级|gpt-4|openai|preview|算法

继不久前OpenAI方面发布OpenAI o1（以下简称为o1）系列大模型的o1-preview（预览版）和o1-mini版本后。日前，OpenAI方面在AMA（Ask Me Anything）活动中披露了o1系列模型的更多细节，并将其比喻为“拥有超能力的外星人”。

据OpenAI方面介绍，o1在响应之前会像人类一样花更多时间进行思考，并能够通过训练来学会完善思维过程、尝试不同的策略，甚至认识到自己的错误。例如在解答编程问题的过程中，o1将在回答前会把整个回答的流程全部思考一边、再生成代码。

同时OpenAI方面透露，o1系列模型并非GPT-4o的升级版，而是在强化了“推理”能力的同时，做出了成本与性能方面的权衡。例如o1使用了与GPT-4o相同的分词器，两者在输入token上保持一致，但o1能够处理比GPT-4o更长、更开放的任务，并减少了对输入分块的需求。此外，o1系列模型还将在未来支持更大的输入上下文窗口。

对此OpenAI方面表示，“我们的大规模强化学习算法精心设计了训练流程，使得模型在高效利用数据的同时，能够熟练运用思维链进行深度思考。我们发现，随着强化学习训练时间的增加以及模型在测试时分配更多思考时间，o1的性能持续显著提升。值得注意的是，这种扩展方法的限制与大语言模型预训练中的挑战有很大不同，我们正继续深入探索这些新界限”。

针对目前已发布的两款o1系列模型，OpenAI方面表示，在一些个性化写作任务中，o1-preview的表现与GPT-4o相当、甚至略胜一筹。但需要注意的是，o1-preview还不具备上传文件和图像等功能，以及浏览网页获取信息的能力。对此OpenAI方面承诺，将在未来的更新中推出支持工具、结构化输出和系统提示等功能，并计划在后续的版本中加入函数调用、代码解释器和网页浏览等能力。

而o1-mini则是在o1-preview的体积和速度上进行了优化，据称尽管o1-mini在世界知识等领域可能有局限，但其在STEM（科学、技术、工程、数学）任务及代码相关任务上表现出色，甚至能够探索比o1-preview更多的思维链。此外，o1-mini目前使用的是截至2023年10月的训练数据，未来将使用更新的数据集训练、以扩充其对世界知识的理解。

据了解，目前ChatGPT Plus和ChatGPT Team用户均可访问上述两款o1系列模型，ChatGPT Enterprise和ChatGPT Edu用户也将在当地时间9月16日后获得访问权限。但需要注意的是，o1-mini每周有50次的提示词限制，并且所有提示词均计入相同的配额。对此OpenAI方面表示，未来将逐步提高API访问级别和速率限制，并在限制放宽后提供批量定价优惠。同时在价格方面，o1系列模型的定价预计将遵循每1至2年降价的趋势。

此外OpenAI方面还进一步透露，未来用户或将有望控制o1模型的思考时间以及token限制。同时其正在推进o1系列模型的流式传输支持和API中的推理进度反馈，个性化微调支持也已在产品路线图中。此外o1模型还已经内置了多模态能力，有望在多模态理解任务（MMLU）上达到最先进的水平。

【本文图片来自网络】