数学的上帝粒子！一个运算符能导出所有基本函数

机器之心Pro

2026-04-14 18:56 ·河北 ·《机器之心》官方网易号

机器之心编辑部

仅用一个简单二元运算符加上常数 1，就能推导出现代科学计算器上的所有基本函数了？

最近，计算机科学领域被一个新研究打破了认知。

人们认为，这种能将复杂数学系统极度简化的底层突破极具革命性。该论文的作者 Andrzej Odrzywołek 来自波兰雅盖隆大学（Uniwersytet Jagielloński）。

论文标题：All elementary functions from a single operator
论文链接：https://arxiv.org/pdf/2603.21852v2

在数字电路的世界里，有一个广为人知的奇迹：NAND 门。只需要这一种双输入逻辑门，就能搭建出任何布尔电路。整个计算机的底层逻辑，全部可以由同一种基本单元堆叠而成。

1913 年 Henry Sheffer 发现的「Sheffer 竖线」，揭示了一个令人震撼的事实：看似纷繁复杂的数字逻辑世界，本质上只有一个原子。

那数学呢？

论文作者 Andrzej Odrzywołek 尝试将繁杂的数学运算符彻底拆解，并且成功找到了数学的「上帝粒子」

这可能是解构现有数学运算的开始。

尝试「拆解计算器」

论文的方法是：从一张标准的科学计算器功能清单出发 —— 包含 36 个原语（命名常量、一元函数和二元运算符），然后逐一进行「消融测试」：每次移除一个元素，检验剩余集合是否仍能重建所有原始功能。

这个过程并非一帆风顺。论文将缩减过程记录为一个递减序列：

Calc 3：6 个原语（取反、倒数、exp、ln、加法），首次超越了 Wolfram Language 的指令集
Calc 2：进一步缩减至 3 个原语（exp、ln、减法）
Calc 1：换了一条路，使用二元幂运算及其逆（二元对数）作为基础，需要 e 或 π 作为终端常量
Calc 0：将常数 e 吸收进 exp 函数本身，仅剩 3 个原语

每一步缩减都让「单一运算符可能存在」的猜想变得更加可信。最终，在 Calc 0 的启发下，研究者开始枚举初等二元函数作为候选单运算符，配合同样生成的常数逐一测试。

经过大量失败和若干误报之后，他找到了答案：

这个被命名为EML（Exp-Minus-Log）的双输入运算符，配合常数 1，构成了完整的初等函数基础

换句话说，一台只有两个按钮 ——EML 和 1—— 的计算器，能完成今天任何科学计算器所能做的一切。

EML 并非唯一解。论文还报告了它的两个「近亲」：

EML 生万物

理解 EML 的威力，关键在于看它如何逐层构建出那些我们熟悉的数学对象。

上图展示了完整的「系统发育树」（phylogenetic tree）：从 EML 这个「最后共同祖先」（LUCA）出发，螺旋展开，每一个箭头代表一次 EML 组合操作，逐步衍生出全部 36 个原语。粗箭头标记的是直接由 EML 和 1 构成的表达式，细箭头则依赖中间产物。

在形式语言层面，EML 表达式的文法简洁到令人难以置信：

这意味着每一个初等函数表达式，本质上都是一棵由完全相同的节点构成的满二叉树

不同函数所需的树深度差异很大：指数函数只需深度 1，而乘法则需要深度 8。大多数常用数学函数落在深度 5–9 的区间。这种深度的参差反映了不同函数在 EML 表示下的「编码距离」。

从数学到机器学习

EML 可能在机器学习领域有着影响力巨大的潜在应用。

现代符号回归（Symbolic Regression）方法试图从数据中发现闭式表达式（closed-form formula），但其搜索空间通常涉及多种异构算子，包含加减乘除、三角函数、指数对数等等。算子集选少了可能不完备，选多了又会让搜索空间爆炸。

EML 提供了一种全新的思路：既然所有初等函数都可以用同一种节点表示，那么搜索空间就变成了统一的二叉树结构

实验结果：

深度 2：100% 成功率，随机初始化即可精确恢复目标函数
深度 3–4：约 25% 成功率
深度 5：低于 1%（448 次尝试中未见成功）
深度 6：未观察到成功恢复

但当权重从正确值附近加入高斯噪声时，优化器在 100% 的运行中都能收敛回精确值，即使对于深度 5–6 的树也是如此。这说明 EML 树的正确参数盆地（basin of attraction）确实存在，但问题在于随机初始化很难进入这一范围。

一旦训练成功，权重的「硬化」（hardening）过程会将浮点参数 snap 到精确的二进制值（0 或 1），此时均方误差降至机器精度量级（~10⁻³²），意味着模型精确恢复了闭式表达式。

这带来了一种可能性：可解释的符号发现

传统神经网络的内部机制是不透明的黑箱，而 EML 树在训练成功后可以直接被「读」出来，每一棵训练好的树都对应一个人类可读的数学公式。

论文作者在文章结尾坦言，EML 可能只是冰山一角。初等函数这个看似庞杂的家族，其内部的统一性远超我们的想象。

这一只有两个按钮的计算器，也许比我们以为的要强大得多。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴