强化学习新发现：AI找到更快的矩阵乘法算法

报错免疫体

2026-05-22 00:23 ·北京

矩阵乘法是计算机最基础的运算之一，从神经网络训练到图形渲染都在用它。但过去五十年，人类数学家只找到过几次提速方案。现在，AI自己发现了新路径。

DeepMind的研究团队用强化学习系统AlphaTensor，在有限域和整数域中找到了比经典算法更快的矩阵乘法方案。具体来说，4×4矩阵相乘，人类最快需要49次标量乘法，AI降到了47次。5×5矩阵从98次降到96次。数字看起来小，但放大到亿级规模的AI训练，省下的计算量相当可观。

这事的技术路线值得细说。团队把矩阵乘法当成一个三维张量分解问题，用强化学习在庞大的搜索空间里找最优解。状态空间有多大？比围棋复杂得多。AlphaTensor自己跟自己下"张量分解游戏"，每一步都在压缩计算步骤。训练用了数百万局自我对弈，最终筛选出可验证的优化方案。

不过争议也有。批评者指出，这些优化只在特定规模有效，通用性存疑。而且AI找到的算法结构怪异，人类数学家很难理解其数学原理。实用派则认为，哪怕黑箱，能省算力就是价值。双方的分歧其实是老问题：我们是要可解释的数学优雅，还是要工程上的实际收益？

我的判断是，这更像一个信号而非终点。矩阵乘法被研究了几十年，人类直觉已接近瓶颈，AI的系统性搜索恰好补上了这块短板。但它不会取代数学家——AlphaTensor能发现"是什么"，却说不清"为什么"。真正的突破可能发生在人机协作之后：AI提供候选方案，人类提炼通用规律。

对从业者来说，更现实的启示是算力焦虑的缓解路径。当模型规模膨胀遇到物理极限，算法层面的压榨空间可能比想象中更大。DeepMind已经开源了部分结果，接下来看芯片厂商和框架团队怎么跟进适配。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴