机器之心编辑部
仅用一个简单二元运算符加上常数 1,就能推导出现代科学计算器上的所有基本函数了?
最近,计算机科学领域被一个新研究打破了认知。
人们认为,这种能将复杂数学系统极度简化的底层突破极具革命性。该论文的作者 Andrzej Odrzywołek 来自波兰雅盖隆大学(Uniwersytet Jagielloński)。
- 论文标题:All elementary functions from a single operator
- 论文链接:https://arxiv.org/pdf/2603.21852v2
在数字电路的世界里,有一个广为人知的奇迹:NAND 门。只需要这一种双输入逻辑门,就能搭建出任何布尔电路。整个计算机的底层逻辑,全部可以由同一种基本单元堆叠而成。
1913 年 Henry Sheffer 发现的「Sheffer 竖线」,揭示了一个令人震撼的事实:看似纷繁复杂的数字逻辑世界,本质上只有一个原子。
那数学呢?
论文作者 Andrzej Odrzywołek 尝试将繁杂的数学运算符彻底拆解,并且成功找到了数学的「上帝粒子」
这可能是解构现有数学运算的开始。
尝试「拆解计算器」
论文的方法是:从一张标准的科学计算器功能清单出发 —— 包含 36 个原语(命名常量、一元函数和二元运算符),然后逐一进行「消融测试」:每次移除一个元素,检验剩余集合是否仍能重建所有原始功能。
这个过程并非一帆风顺。论文将缩减过程记录为一个递减序列:
- Calc 3:6 个原语(取反、倒数、exp、ln、加法),首次超越了 Wolfram Language 的指令集
- Calc 2:进一步缩减至 3 个原语(exp、ln、减法)
- Calc 1:换了一条路,使用二元幂运算及其逆(二元对数)作为基础,需要 e 或 π 作为终端常量
- Calc 0:将常数 e 吸收进 exp 函数本身,仅剩 3 个原语
每一步缩减都让「单一运算符可能存在」的猜想变得更加可信。最终,在 Calc 0 的启发下,研究者开始枚举初等二元函数作为候选单运算符,配合同样生成的常数逐一测试。
经过大量失败和若干误报之后,他找到了答案:
这个被命名为EML(Exp-Minus-Log)的双输入运算符,配合常数 1,构成了完整的初等函数基础
换句话说,一台只有两个按钮 ——EML 和 1—— 的计算器,能完成今天任何科学计算器所能做的一切。
EML 并非唯一解。论文还报告了它的两个「近亲」:
EML 生万物
理解 EML 的威力,关键在于看它如何逐层构建出那些我们熟悉的数学对象。
上图展示了完整的「系统发育树」(phylogenetic tree):从 EML 这个「最后共同祖先」(LUCA)出发,螺旋展开,每一个箭头代表一次 EML 组合操作,逐步衍生出全部 36 个原语。粗箭头标记的是直接由 EML 和 1 构成的表达式,细箭头则依赖中间产物。
在形式语言层面,EML 表达式的文法简洁到令人难以置信:
这意味着每一个初等函数表达式,本质上都是一棵由完全相同的节点构成的满二叉树
不同函数所需的树深度差异很大:指数函数只需深度 1,而乘法则需要深度 8。大多数常用数学函数落在深度 5–9 的区间。这种深度的参差反映了不同函数在 EML 表示下的「编码距离」。
从数学到机器学习
EML 可能在机器学习领域有着影响力巨大的潜在应用。
现代符号回归(Symbolic Regression)方法试图从数据中发现闭式表达式(closed-form formula),但其搜索空间通常涉及多种异构算子,包含加减乘除、三角函数、指数对数等等。算子集选少了可能不完备,选多了又会让搜索空间爆炸。
EML 提供了一种全新的思路:既然所有初等函数都可以用同一种节点表示,那么搜索空间就变成了统一的二叉树结构
实验结果:
- 深度 2:100% 成功率,随机初始化即可精确恢复目标函数
- 深度 3–4:约 25% 成功率
- 深度 5:低于 1%(448 次尝试中未见成功)
- 深度 6:未观察到成功恢复
但当权重从正确值附近加入高斯噪声时,优化器在 100% 的运行中都能收敛回精确值,即使对于深度 5–6 的树也是如此。这说明 EML 树的正确参数盆地(basin of attraction)确实存在,但问题在于随机初始化很难进入这一范围。
一旦训练成功,权重的「硬化」(hardening)过程会将浮点参数 snap 到精确的二进制值(0 或 1),此时均方误差降至机器精度量级(~10⁻³²),意味着模型精确恢复了闭式表达式。
这带来了一种可能性:可解释的符号发现
传统神经网络的内部机制是不透明的黑箱,而 EML 树在训练成功后可以直接被「读」出来,每一棵训练好的树都对应一个人类可读的数学公式。
论文作者在文章结尾坦言,EML 可能只是冰山一角。初等函数这个看似庞杂的家族,其内部的统一性远超我们的想象。
这一只有两个按钮的计算器,也许比我们以为的要强大得多。
热门跟贴