无论是机器人、自动驾驶,还是具身智能体,它们都需要在现实世界中做出符合物理定律的正确决策。这背后的核心能力,即为“物理推理”。

如今,上海 AI Lab 团队在实现通用物理智能的道路上取得了关键里程碑——P1-235B-A22B 成为首个在国际物理奥林匹克竞赛(IPhO 2025)中达到金牌水平的开源模型,并在 2024/2025 年度的 13 场国际及区域性物理竞赛中斩获 12 枚金牌。

更重要的是,当进一步结合智能体框架 PhysicsMinions 后,P1-235B-A22B 超过了 Gemini-2.5-Pro、GPT-5 等闭源模型,在 IPhO 2025 中综合排名第一。

据官方博客介绍,P1 系列模型获得国际物理奥林匹克竞赛金牌,核心在于其“强化学习 + 多智能体协同进化”的训练体系。

1️⃣ 以高质量的奥赛级题库为基础,通过多阶段强化学习不断强化模型的推理能力,涉及两项关键策略:

-逐步扩展上下文窗口:让模型能处理更长的推理链,解决复杂题时减少信息截断带来的错误;
-通过率过滤机制:在训练数据中筛除过难或过易题目,使学习曲线平稳、效率更高。

这一过程让 P1 模型实现了在基座语言模型的基础上长期、持续的性能提升。

2️⃣ PhysicsMinions 多智能体系统旨在突破单模型的上限,让不同模块分工协作、相互校正。主要涉及以下两个模块:

-逻辑模块:生成初始解决方案,并通过自我改进和自我反思逐步改进解答。
-审核模块:执行双阶段验证:物理验证器检查物理一致性(比如常数、单位),而通用验证器检查逻辑、推理和计算。

通过这种协同进化协作,PhysicsMinions 能够持续提升复杂物理问题的推理质量和鲁棒性。

此外,除了物理领域,P1 系列模型在数学、编程等其他推理任务上也同样展现出色,凸显了 P1 系列模型的强大泛化能力。

#大模型 #人工智能 #物理 #物理奥赛 #国际物理奥林匹克竞赛 #科技

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片