矩阵乘法是计算机最基础的运算之一,从神经网络训练到图形渲染都在用它。但过去五十年,人类数学家只找到过几次提速方案。现在,AI自己发现了新路径。
DeepMind的研究团队用强化学习系统AlphaTensor,在有限域和整数域中找到了比经典算法更快的矩阵乘法方案。具体来说,4×4矩阵相乘,人类最快需要49次标量乘法,AI降到了47次。5×5矩阵从98次降到96次。数字看起来小,但放大到亿级规模的AI训练,省下的计算量相当可观。
打开网易新闻 查看精彩图片
这事的技术路线值得细说。团队把矩阵乘法当成一个三维张量分解问题,用强化学习在庞大的搜索空间里找最优解。状态空间有多大?比围棋复杂得多。AlphaTensor自己跟自己下"张量分解游戏",每一步都在压缩计算步骤。训练用了数百万局自我对弈,最终筛选出可验证的优化方案。
打开网易新闻 查看精彩图片
不过争议也有。批评者指出,这些优化只在特定规模有效,通用性存疑。而且AI找到的算法结构怪异,人类数学家很难理解其数学原理。实用派则认为,哪怕黑箱,能省算力就是价值。双方的分歧其实是老问题:我们是要可解释的数学优雅,还是要工程上的实际收益?
我的判断是,这更像一个信号而非终点。矩阵乘法被研究了几十年,人类直觉已接近瓶颈,AI的系统性搜索恰好补上了这块短板。但它不会取代数学家——AlphaTensor能发现"是什么",却说不清"为什么"。真正的突破可能发生在人机协作之后:AI提供候选方案,人类提炼通用规律。
打开网易新闻 查看精彩图片
对从业者来说,更现实的启示是算力焦虑的缓解路径。当模型规模膨胀遇到物理极限,算法层面的压榨空间可能比想象中更大。DeepMind已经开源了部分结果,接下来看芯片厂商和框架团队怎么跟进适配。
热门跟贴