继不久前OpenAI方面发布OpenAI o1(以下简称为o1)系列大模型的o1-preview(预览版)和o1-mini版本后。日前,OpenAI方面在AMA(Ask Me Anything)活动中披露了o1系列模型的更多细节,并将其比喻为“拥有超能力的外星人”。
据OpenAI方面介绍,o1在响应之前会像人类一样花更多时间进行思考,并能够通过训练来学会完善思维过程、尝试不同的策略,甚至认识到自己的错误。例如在解答编程问题的过程中,o1将在回答前会把整个回答的流程全部思考一边、再生成代码。
同时OpenAI方面透露,o1系列模型并非GPT-4o的升级版,而是在强化了“推理”能力的同时,做出了成本与性能方面的权衡。例如o1使用了与GPT-4o相同的分词器,两者在输入token上保持一致,但o1能够处理比GPT-4o更长、更开放的任务,并减少了对输入分块的需求。此外,o1系列模型还将在未来支持更大的输入上下文窗口。
对此OpenAI方面表示,“我们的大规模强化学习算法精心设计了训练流程,使得模型在高效利用数据的同时,能够熟练运用思维链进行深度思考。我们发现,随着强化学习训练时间的增加以及模型在测试时分配更多思考时间,o1的性能持续显著提升。值得注意的是,这种扩展方法的限制与大语言模型预训练中的挑战有很大不同,我们正继续深入探索这些新界限”。
针对目前已发布的两款o1系列模型,OpenAI方面表示,在一些个性化写作任务中,o1-preview的表现与GPT-4o相当、甚至略胜一筹。但需要注意的是,o1-preview还不具备上传文件和图像等功能,以及浏览网页获取信息的能力。对此OpenAI方面承诺,将在未来的更新中推出支持工具、结构化输出和系统提示等功能,并计划在后续的版本中加入函数调用、代码解释器和网页浏览等能力。
而o1-mini则是在o1-preview的体积和速度上进行了优化,据称尽管o1-mini在世界知识等领域可能有局限,但其在STEM(科学、技术、工程、数学)任务及代码相关任务上表现出色,甚至能够探索比o1-preview更多的思维链。此外,o1-mini目前使用的是截至2023年10月的训练数据,未来将使用更新的数据集训练、以扩充其对世界知识的理解。
据了解,目前ChatGPT Plus和ChatGPT Team用户均可访问上述两款o1系列模型,ChatGPT Enterprise和ChatGPT Edu用户也将在当地时间9月16日后获得访问权限。但需要注意的是,o1-mini每周有50次的提示词限制,并且所有提示词均计入相同的配额。对此OpenAI方面表示,未来将逐步提高API访问级别和速率限制,并在限制放宽后提供批量定价优惠。同时在价格方面,o1系列模型的定价预计将遵循每1至2年降价的趋势。
此外OpenAI方面还进一步透露,未来用户或将有望控制o1模型的思考时间以及token限制。同时其正在推进o1系列模型的流式传输支持和API中的推理进度反馈,个性化微调支持也已在产品路线图中。此外o1模型还已经内置了多模态能力,有望在多模态理解任务(MMLU)上达到最先进的水平。
【本文图片来自网络】
热门跟贴