开源AI首获物理奥赛金牌！上海AI Lab推出「物理推理」模型P1

学术头条

2025-11-18 18:23 ·北京

无论是机器人、自动驾驶，还是具身智能体，它们都需要在现实世界中做出符合物理定律的正确决策。这背后的核心能力，即为“物理推理”。

如今，上海 AI Lab 团队在实现通用物理智能的道路上取得了关键里程碑——P1-235B-A22B 成为首个在国际物理奥林匹克竞赛（IPhO 2025）中达到金牌水平的开源模型，并在 2024/2025 年度的 13 场国际及区域性物理竞赛中斩获 12 枚金牌。

更重要的是，当进一步结合智能体框架 PhysicsMinions 后，P1-235B-A22B 超过了 Gemini-2.5-Pro、GPT-5 等闭源模型，在 IPhO 2025 中综合排名第一。

据官方博客介绍，P1 系列模型获得国际物理奥林匹克竞赛金牌，核心在于其“强化学习 + 多智能体协同进化”的训练体系。

1️⃣ 以高质量的奥赛级题库为基础，通过多阶段强化学习不断强化模型的推理能力，涉及两项关键策略：

-逐步扩展上下文窗口：让模型能处理更长的推理链，解决复杂题时减少信息截断带来的错误；
-通过率过滤机制：在训练数据中筛除过难或过易题目，使学习曲线平稳、效率更高。

这一过程让 P1 模型实现了在基座语言模型的基础上长期、持续的性能提升。

2️⃣ PhysicsMinions 多智能体系统旨在突破单模型的上限，让不同模块分工协作、相互校正。主要涉及以下两个模块：

-逻辑模块：生成初始解决方案，并通过自我改进和自我反思逐步改进解答。
-审核模块：执行双阶段验证：物理验证器检查物理一致性（比如常数、单位），而通用验证器检查逻辑、推理和计算。

通过这种协同进化协作，PhysicsMinions 能够持续提升复杂物理问题的推理质量和鲁棒性。

此外，除了物理领域，P1 系列模型在数学、编程等其他推理任务上也同样展现出色，凸显了 P1 系列模型的强大泛化能力。

#大模型 #人工智能 #物理 #物理奥赛 #国际物理奥林匹克竞赛 #科技

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴