编辑 | 心悦
数学中有一个朴素又深刻的问题,被称为亲吻数问题(Kissing Number Problem, KNP):在一颗中心球周围,最多能紧贴放置多少颗相同的球?
在一维和二维情况下,答案可以简单求解是 2 和 6。但当维度增加到 3 维,问题就变得复杂起来,一度让科学巨匠艾萨克・牛顿和苏格兰数学家大卫・格雷戈里为其争论。1694 年,牛顿认为三维空间亲吻数问题的答案是 12,格雷戈里认为是 13。这个谜团持续了近三百年,直到 1952 年,数学界才证明牛顿是对的。传奇数学家保罗・埃尔德什曾言,离散几何或许就始于这场著名的「12 对 13」之争。
亲吻数问题的意义远不止于数学本身,在物理、信息论、材料科学等领域,它皆有深刻的应用价值。例如,在信息编码中,用最少的比特数压缩最多的信息,就与亲吻数和球体堆积这类问题相通。2022 年,数学家马林娜・维亚佐夫斯卡还因对球体堆积问题的贡献,获得了菲尔兹奖。
然而,在高维空间中堆叠球体,随着维度增加,可能的排列方式会呈爆炸式增长。人类在这种巨大组合空间中的处理能力非常有限,几何直觉也往往并不可靠,甚至可能完全违背实际情况。
过去近 50 年中,亲吻数构造仅有 7 次实质性进展,而且每一次突破几乎都依赖完全不同的数学技巧,难以形成可复制的研究路径。
当传统数学方法遭遇瓶颈,人工智能为这一世界级经典难题带来了方法论层面的转折。
近期,上海科学智能研究院(下称上智院)、北京大学、复旦大学的联合研究团队设计出一套名为PackingStar 的强化学习系统。该系统将高维堆积问题转化为余弦矩阵(描述球心之间几何关系的矩阵)上的多智能体博弈学习任务,从而使人工智能得以探索远超人类直觉的复杂空间,并在连续 7 个维度上刷新了亲吻数世界纪录。
从数学难题到多智能体游戏
一个偶然的机会,PackingStar 项目组长马成栋关注到亲吻数问题,被其简洁的表述、明确的答案,以及数学命题独有的客观可验证性所吸引。他敏锐地意识到:这一经典的高维几何问题,或许可以通过强化学习的方法进行全新的探索与求解。
为了找到亲吻数问题的通用研究路径,PackingStar 团队首先回到了问题本身,分析最基本的约束和前提。
亲吻数问题本质上是一个「加球」问题,而问题的关键在于:在球尽可能多的前提下,下一个球可以放在哪个位置?
这就相当于在坐标空间中做选择题,顺着这个思路,团队顺利求解八维以下的亲吻数问题,但有一些注定无法被解决的限制。比如,数值误差会随着球数越来越多而不断地传播、累积,以至于误差本身都足以破坏整个堆积结构。
那么,有没有可能简化这个选择题?
在亲吻数问题中,两个球体的原点之间可以形成连线,而两条连线之间角度的余弦值是有规律的。团队意识到,这些余弦值会收敛到一个有限的集合中。
这个发现至关重要,因为它让研究团队从「逐个求解球体坐标」这一难以并行、计算量巨大的思路中跳脱出来,将整个问题的建模从坐标空间转向余弦空间,这是前人未曾探索过的路径。
研究团队引入了余弦值矩阵(Cosine Matrix),将一个非常复杂的高维几何问题变成了余弦值矩阵填充问题。
当前人工智能擅长的就是依托大规模并行计算架构,快速处理大量数据,从中找到特定模式和规律。引入余弦值矩阵使所有计算都被重构为矩阵上的并行运算,并且几乎不引入精度误差,这天然适配了大规模 GPU 的计算逻辑,充分释放了 AI 模型的潜力。
在这个矩阵填充问题中,每一步需要从待选动作集中选取一个条目来填充余弦值矩阵,直到整个矩阵无法再被填充,即在高维空间中学出一组最优的策略。这个过程是不是看起来很熟悉?没错,这符合强化学习的工作原理,也恰好印证了马成栋此前的猜想。
研究团队把余弦值矩阵填充任务设计成一个游戏,用强化学习来训练智能体去玩这个游戏。在这个游戏中,智能体作为玩家,通过不断选择填充动作、接收环境反馈,逐步学会在复杂的组合空间中做出更优的决策。
然而,这个游戏并不简单,每一步的动作空间都异常巨大并且变化不定,奖励也非常稀疏,动作策略很难被表征和学习,研究团队尝试了大量方法来修减候选动作空间。此外,不同的「加球」顺序可能会得到完全相同的结构,重复探索会影响学习效率,最终导致 AI 难以学出好的策略。
在维数达到 14 维时,研究团队发现经过千百次实验,仍然没有复现出数学家的结果(1932)。这一度使研究陷入僵局,让研究团队感到非常沮丧。
突破的契机,竟源于研究人员与 AI 之间一场特殊的「较量」。
当 AI 在高维空间中探索时,团队里的青年科学家也在并行地审视着这个难题。他们发现如果手动删掉一些球,就可以复原 14 维的经典结果 1932,也就是说有一些球加进来之后会破坏整个结构。这意味着 AI 应该学会识别并剔除这些球。
「我们像是与 AI 展开了一场『智力拉锯战』。在 AI 探索这个高维难题时,我们也在搜索同一个地方的宝藏。如果我们在某一步比 AI 表现得更好,就会尝试把这种人类独有的直觉转换成算法,再次注入 AI 的血液」,数学系出身的团队核心成员陶兆巍说。
于是,团队意识到单一智能体不足以完成这项任务,必须引入一种能够识别并剔除「问题球」的修正机制,由此设计了另一个智能体,专门模拟人类通过直觉与经验进行手动修正的操作。两个智能体形成了相互协同又彼此制衡的「合作博弈」关系:
填充智能体负责探索与构建:通过快速填充余弦值矩阵,填充智能体构造出高维空间中球体堆积的初步形态,并通过强化学习不断优化生成策略,但仅依靠填充智能体会产生大量次优填充。
修剪智能体负责评估与优化:次优填充就意味着球体堆积结构不够合理,这时修剪智能体就负责识别并去除次优填充,再将余弦值矩阵交由填充智能体重新填充,反复迭代,最终得到最优解。
这种双智能体协同的设计,既融合了人类的结构性直觉,又发挥了 AI 的搜索与学习能力,巧妙的帮助 AI 压缩了探索空间,提高了样本质量,成为 PackingStar 工作中最为精妙的方法创新。
至此,困扰数学界的高维亲吻数问题,被成功转化为一个「多智能体游戏」。
有趣的是,研究团队惊喜地发现,在不同高维复杂结构中(例如 2000 个球和 2400 个球的结构),存在着一些完全相同的、具有良好几何特性的核心子模块。这一发现提示,这些低维且具有普适性的「子结构」或许可以作为破解高维问题的基石,将原本混沌无序的高维空间结构化,从而使其变得可分析、可驾驭。
正是基于这一思路,研究团队提取了一个关键的子结构,并以其为基础,实现了 25 至 31 维的突破。
工程优化加速科学发现
尽管数学难题可以被转化为多智能体强化学习任务,但高维问题固有的复杂性并未因此消失。随着维度的增加,搜索空间呈指数级膨胀,系统所需的计算量也随之急剧攀升。当维度上升至 18 维、19 维时,团队构建的 PackingStar 系统会出现学习效率的明显下降,探索的步伐在庞大的可能性空间中逐渐放缓。
实际上,这不是亲吻数问题才有的困境。很多科学智能(AI for Science)问题都需要在指数级增长的解空间中寻找最优解,因而在研究的扩展阶段普遍遭遇类似的「维度瓶颈」。
为了让 PackingStar 项目顺利推进,上智院首先从整体 GPU 算力池中专项抽调出稳定可靠的算力资源供其使用。而比资源更关键的,是团队的融合 —— 让工程侧的「精兵强将」与算法团队深度合作,让他们共同理解问题、拆解瓶颈,实现工程优化。
工程优化也是过去一年 AI 领域热议的话题,业内开始探索在 AI Infra 层面为模型优化出「额外学习空间」:通过算子优化、调度策略升级等方式,提升 AI Infra 的整体效率。在核心算法实现突破之后,工程层面的深度优化已成为推动研究边界继续延伸的键。
在 PackingStar 项目中,工程团队通过优化底层算子,大规模加速了搜索。原本 PackingStar 系统直接调用了一些 CUDA 原生算子,但通过性能分析,研究团队发现其内存访问模式会对大量中间变量进行显存拷贝与冗余读写,GPU 的有效利用率较低。为此,他们重写了定制化的 CUDA Kernel,直接在 GPU 上计算并原位写入数据。这样一来,核心计算链路的端到端吞吐效率就提升了数倍。
另一方面,计算过程中有些操作对精度要求很高,有些则不需要那么高的精度。研究团队为此设计了混合精度机制去逼近每一个精度级别的极限,从而大幅提高了计算效率。
我们可以这么理解工程加速的意义:计算和智能密不可分。能够在给定问题下迅速做出最优选择,本身就是智能的重要体现;当搜索速度提升数倍,原本需要三年完成的工作,就可能在一年内完成。
除了提升计算效率,确保程序可靠稳定地运行对 PackingStar 这种长周期任务也是非常重要的。千卡集群上,一次中断就可能让数天的计算进度归零。如果程序在集群上频繁崩溃,即使单次执行速度再快也是反复运行失败。
因此,工程团队为 PackingStar 构建了容错机制 —— 自动 Checkpointing 系统,使程序可以定时滚动存档,并在出现故障后自动回溯恢复,确保数据零丢失、任务断点可续传。
这么一顿操作下,PackingStar 的搜索效率提升数倍,累计节省超 10 万 GPU 卡时。相关算子与方法已在上智院牵头建设的星河启智科学智能开放平台上沉淀为可复用能力,为更多科学问题提供智算基础。
人工智能和科学行至今日,工程优化已不再是配角,而是科学突破的基础设施 —— 以其稳定性和效率来对冲科学发现的不确定性,加速科学发现。
世界级难题的系统性突破
PackingStar 不是唯一一个尝试用 AI 求解亲吻数问题的研究。Google DeepMind 的 AlphaEvolve 曾刷新 11 维空间中的下界(从 592 提升至 593),对原有构型进行了局部调整与修补,但未能给亲吻数问题提供新的求解路径。
PackingStar 的不同之处在于:它不是基于已有几何直觉做简单拓展,而是选择重新定义问题本身 —— 将高维几何难题转化为 AI 模型所擅长的代数计算问题。这不是工具层面的替换,而是开创了全新的方法论,带来了 AI for Math 范式的一次前移。
今天,在维基百科上,25 至 31 维空间的亲吻数下界,标注着同一个名字:PackingStar。这意味着,一套强化学习系统,一次性在连续 7 个维度上刷新了世界纪录,还在广义亲吻数问题上完成了一系列维度的纪录突破,取得了系统性而非单点突破。
同时,研究团队还在一些维度获得了更深层的发现。例如,在 12-15 维中,团队发现多个持平纪录的「非对称构型」。这超越了人类的几何直觉。传统的高维球体堆积的构造往往高度依赖于结构的对称性,而非对称构型是借助 AI 探索发现的新颖排列方式。
这就像是 AI 为我们打开了一扇观察高维空间的新窗口,也提醒我们,高维空间远比我们想象的更为复杂多样。
PackingStar 取得的突破很快引起了当代离散几何与编码理论领域的领军人物、MIT 教授 Henry Cohn 的高度关注。在 Cohn 的建议下,PackingStar 团队针对广义亲吻数问题展开了研究。
广义亲吻数将研究从「一个单位球面周围能放置多少个与之相切的单位球」扩展到「多个单位球面周围能放置多少个与之相切的单位球」。PackingStar 团队在此方向上取得了多项突破,例如,在 14 维与 17 维情况下,打破了「两球亲吻数」的最佳构造纪录;在 12 维、20 维与 21 维情况下,打破了「三球亲吻数」的最佳构造纪录。
值得注意的是,这些由 AI 生成的结构,数学多样性极为丰富,包含着数学家从未想到过的构造方式:有些是低维结构的巧妙拼装,有些是基于特殊规则的张量积,有些则对应于已知结构的新的分解方式。这不仅丰富了广义亲吻数研究,还为数学家 Cohn 提供了新的思路。
人类和机器共探科学的浪漫
PackngStar 项目的意义,远不止于为亲吻数问题找到新解,它更是一次完整的 AI for Math 路径验证:从问题拆解、算法设计到工程优化,证明了人工智能可以为数学注入从无到有的「规模化探索」的能力。
这个过程不是 AI 的单打独斗,而是依托人类与 AI 互促进化的科研范式:人工智能在远超人类直觉所及的空间中学习如何求解问题,人类随后对其产生的结果进行解读与抽象,从中提炼新的数学规律 —— 两股力量循环往复、彼此反哺,最终凝结为人机协作的完整闭环。
作为「科学的语言」,数学为物理、化学等众多学科提供了基本的描述和分析工具 —— 当人工智能能够介入数学发现、在严谨的公理体系中与人类协同推理,它便会在更多科学领域发挥更大作用。
今天的科学智能,正经历一场深层跃迁:从依赖既有数据和信息解决已定义问题,走向围绕复杂科学问题构建探索系统。人工智能已成为与科学家并肩的探索者 —— 当科学家有了好的想法,人工智能能够以其大规模探索能力,帮助科学家高效地探索未知宇宙。
这本身,就是一种人类和机器共同探索科学的浪漫。
当科学发现不再依赖单点英雄的横空出世,而是成为人机协同、平台支撑、跨界融合下的系统涌现,我们正在见证:科学发现,从天才的灵光一闪,转变为人机共舞的必然成果。
为了回答牛顿三百年前的一个问题,一群中国青年让 AI 学会了创造高维几何结构。科研纪录短片《Packing Star》,带你回到 1694 年,也带你遨游数学宇宙。
(PackingStar 团队的科研青年们,从左至右为:刘明灏、李鹏宇、马成栋、陶兆巍、陈浩钧、毛子皓)
热门跟贴