品玩12月16日讯,据 360 智脑官方消息,360 自研 AI 大模型 360gpt2-o1 正式上线
360gpt2-o1 使用树搜索构建思维链,并引入了反思机制,使用强化学习训练,模型具备自我反思与纠错的能力。该模型是继今年 10 月推出的 360 智脑大模型 360gpt2-pro 之后的重要更新,模型在数学以及各种复杂逻辑推理任务上实现了显著提升。
在多项基础数学评测(如MATH、高考数学)以及权威数学竞赛(包括AIME24、AMC23)中,360gpt2-o1 均取得了显著的成绩,不仅超越了前代模型 360gpt2-pro,也优于 GPT-4o 模型。
热门跟贴