近日,北京通用人工智能研究院、北京大学相关团队组成的科研团队,成功开发出全球首个同时具备自主出题、自动解题能力的通用人工智能系统“通矩模型”,这一突破标志着我国在自动化推理和具身智能的逻辑核心领域实现关键技术自研自控,在性能上达到国际顶尖水平,在功能多样性和效率方面实现飞跃。相关成果近日发表于国际学术期刊《自然·机器智能》。
在人工智能领域,奥林匹克数学竞赛一直被视为衡量机器逻辑思维与空间想象力的重要标准。其中,平面几何问题因其独特的数值精度与空间直觉的结合,被认为是自动化推理的关键环节。长期以来,AI在该领域主要面临两大挑战:一是“组合爆炸”,几何推理往往需要寻找并添加精妙的辅助线,每增加一个点或圆,搜索空间(即探索模型中所有可能的解决方案)都会呈指数级增长;二是“高质量数据匮乏”,现有的几何题目库规模较小,难以支持大规模模型训练。
2024年初,谷歌DeepMind团队开发出神经符号系统AlphaGeometry,虽然在解题能力上取得了重要进展,但其主要依赖于大规模离线合成数据和庞大的计算资源。与之相比,我国自主研发的“通矩模型”不仅是一个能解题的“优等生”,更是一位能从无到有、创造出具备数学审美价值的题目的“金牌教练”。
据介绍,“通矩模型”系统的技术核心在于神经符号引导树搜索架构。与传统大模型的“暴力搜索”不同,团队将复杂的几何世界抽象地建模为有限树上的马尔可夫过程(即依据系统当前的状态推断系统下一个最大可能性的状态),使几何图形的构建变成一个有序的随机演化过程,从而避免了无效的重复尝试。为了解决几何证明中困扰学界已久的“路径爆炸”难题,团队创新性地引入了“规范化表示”技术,能够自动识别、合并对称或同构的拓扑结构,将庞杂的搜索空间压缩几个数量级。在AI寻找解题“灵感”的过程中,系统还通过价值函数来模拟人类的数学审美。
相比DeepMind 开发的AlphaGeometry需要依赖庞大的算力集群进行训练和推理,“通矩模型”仅需一张普通的国产消费级显卡,即可在最多38分钟内解决近25年来所有的国际数学奥林匹克竞赛的几何难题。目前,由该系统自主生成的3道几何新题已正式入选2024年全国中学生数学联赛(北京赛区)及美国精英奥赛,这是AI原创题目首次进入高规格人类数学竞赛,实现了真实场景应用。
论文共同通讯作者、北京大学心理与认知科学学院助理教授朱毅鑫表示:“‘通矩模型’通过‘小数据、大任务’的范式转换,证明了人工智能可以不再单纯依赖‘暴力计算’,而是通过理解逻辑底层的对称性与美感,实现自主的科学发现。”
据了解,该成果由北京通用人工智能研究院主导,并集结了北京大学多个相关院系的科研力量,充分体现了我国在通用人工智能基础研究领域“学—研—产”深度融合的正向研发优势。未来,团队将继续沿着“小数据,大任务”的研究范式拓展通用人工智能模型,推动中国人工智能实现新突破。
(来源:人民日报客户端)
热门跟贴