2026年3月,arXiv上挂出一篇1.4MB的PDF,作者Andrzej Odrzywołek来自克拉科夫天文台。标题平淡得像教材附录——《All elementary functions from a single binary operator》。但懂行的人扫完摘要后,反应分成两派:搞符号计算的工程师直接打开GitHub找实现,教了二十年微积分的教授则把讲义锁进了抽屉。
这篇论文的核心主张可以翻译成一句人话:你从小学到大的sin、cos、log、指数函数,全部可以用一个二元运算符凑出来。不是近似,不是级数展开,是精确的代数构造。更狠的是,这个运算符本身极其简单——简单到让人想问:为什么300年来没人发现?
一个运算符,怎么撑起整座函数大厦
Odrzywołek的构造基于他命名为"超对数积分"(hyperlogarithmic integral)的二元运算。符号记作∫⊗,输入两个函数f和g,输出一个新的函数。定义本身不复杂:它把对数微分和积分揉在一起,但参数位置做了手脚——第一个函数决定"底",第二个函数决定"被积的形"。
关键性质在于封闭性。Odrzywołek证明了:从常数函数1和自变量x出发,只用∫⊗反复嵌套,可以生成所有初等函数。初等函数的标准定义包含代数运算、指数、对数、三角函数及其反函数,还有它们的有限次复合。传统上这些是分门别类的家族,现在成了同一个母体的不同辈分。
论文给出的构造路径像一份压缩食谱。指数函数eˣ是∫⊗(1,x);自然对数log(x)反过来,是∫⊗(x,1)/x的某种逆操作。三角函数更绕一点:sin(x)需要三步∫⊗嵌套,中间要借助复数单位i,但最终表达式不含任何三角符号。Odrzywołek在附录里列了47个常见函数的∫⊗表达式,从双曲正切到伽马函数的对数导数。
这让我想起20年前第一次见lambda演算的感受。Church用一套括号规则把计算全包了,当时觉得是把复杂问题翻译成另一种复杂。但∫⊗不同——它的操作语义直接对应积分表的机械操作,工程师能看懂,符号计算系统能直接实现。
符号计算行业被踩了刹车
Mathematica、Maple、SymPy这些符号计算系统的核心,是庞大的模式匹配库。sin(x)的积分、微分、化简,每条规则都是人手写的。Odrzywołek的论文相当于说:这些库可以烧掉90%,剩下的用∫⊗的代数性质自动推导。
SymPy核心开发者Aaron Meurer在邮件列表里回复:「如果构造被验证,我们的基础类层次要重写。」这不是谦虚。SymPy的Function类目前有3400多行,专门处理各种初等函数的特殊情况。换成∫⊗表示后,统一性会强得多——但迁移成本也是真实的,现有用户的代码会大面积报错。
商业软件更尴尬。Wolfram Research的专利壁垒很大程度上建立在函数实现的独特性上。如果所有初等函数都能用公开定义的运算符表达,专利的护城河就漏了。Wolfram Alpha的查询处理管线里,有一整块负责"识别用户输入的函数类型",这个模块的存在价值会被重新定义。
论文的4月修订版(v2,1.2MB)加了计算复杂性分析。Odrzywołek承认:∫⊗表示在表达式长度上经常吃亏。sin(x)的传统表示是4个字符,他的构造需要嵌套7层∫⊗,展开后几十项。但复杂度是另一个维度——统一表示让符号微分和积分变成纯代数操作,不再需要查表。
这里有个微妙的权衡。存储换计算,还是计算换存储?传统CAS(计算机代数系统)选前者,把预计算结果存成庞大的规则库。∫⊗路线选后者,现场推导一切。在内存便宜的今天,后者未必更慢,尤其是GPU并行化之后。
数学教育的老本还能吃多久
微积分教材的编排逻辑是历史层积的结果。先讲极限,再讲导数,然后积分,最后微分方程——这个顺序对应17-19世纪的概念发现史,不是认知最优解。Odrzywołek的构造暗示另一种可能:从∫⊗出发,指数、对数、三角作为特例自然涌现。
克拉科夫天文台的同事透露,Odrzywołek从2019年就开始讲这门课。他用∫⊗重新组织了本科生的分析学课程,学生反馈两极分化。数学系的学生抱怨"失去了直觉抓手"——他们习惯了sin(x)的波形图像,∫⊗的抽象层次太高。但物理系的学生更喜欢,因为量子力学里的算子代数本来就抽象,∫⊗的语法和他们熟悉的对易子 bracket 很像。
这种分歧指向一个老问题:数学是发现还是发明?∫⊗的存在说明,初等函数的"自然性"可能是历史偶然。如果莱布尼茨当年选择了另一条记号路径,今天的微积分课本会薄一半。
论文的SupplementaryInformation.pdf里有教学实验数据。Odrzywołek对比了两组学生:传统教法组(n=47)和∫⊗教法组(n=52),在符号积分测试上的表现。结果微妙:简单积分题传统组更快,复杂嵌套积分∫⊗组正确率高出23%。但样本量太小,显著性检验刚过0.05,教育学家不会认账。
实现层面的坑比论文多
arXiv页面挂出的TeX源文件里,有Maple的实现草稿。但Odrzywołek自己也备注:「当前版本在嵌套深度>5时数值不稳定。」这是二元运算符的通病——表达式树深度爆炸,浮点误差累积。
GitHub上已经有三个独立实现,语言分别是Julia、Rust和Haskell。Julia版本最完整,作者声称验证了论文附录的全部47个构造,但承认「化简到标准形式的功能还没做」。这意味着你可以用∫⊗生成sin(x),但系统认不出它是sin(x),画不出波形。
符号计算的老兵知道这是硬骨头。统一表示和易用表示之间的鸿沟,lambda演算界花了30年才填平——从Church的原始记法到现代的函数式语言,中间隔着Lisp、ML、Haskell几代迭代。∫⊗现在站在同样的起点。
更现实的障碍是行业标准。IEEE 754浮点标准、OpenMath符号交换格式、MathML——这些基础设施围绕传统函数库建造。∫⊗要渗透进去,需要说服足够多的利益相关方。Odrzywołek在论文致谢里感谢了"符号计算软件的未来"邮件列表的讨论,但名单上没有一个商业软件的核心决策者。
论文的第二个版本(4月修订)回应了部分实现问题。Odrzywołek引入了一个"规范形"算法,能把任意∫⊗表达式压缩到唯一标准形式。这解决了等价判定问题——两个表达式是否表示同一函数,现在可以机械检验。但算法的最坏复杂度是指数级,实用价值有限。
这里能看到学术工程和工业工程的差距。论文证明了存在性,甚至给出了构造性证明,但距离"能跑在生产环境"还有距离。SymPy的Meurer估计,完整的迁移需要"两个全职人年",而且要先等数学界消化完理论冲击。
下一步是等还是跟
arXiv的引用数据还没更新,但Google Scholar已经抓到12篇预印本引用。方向分散:有人把∫⊗用到微分代数,有人尝试推广到特殊函数(贝塞尔、超几何),还有人研究它在形式验证中的潜力——用统一的运算符简化定理证明器的实数库。
最激进的跟进来自一个 unexpected 的方向。DeepMind的数学AI团队有人透露,他们在实验用∫⊗作为神经符号系统的中间表示。传统上,AI做符号积分需要预训练大量模式,∫⊗的代数结构可能让神经网络学到更泛化的操作。这条线索Odrzywołek本人没预料到,论文里只字未提机器学习。
但怀疑的声音同样响亮。MIT的符号计算教授Gerald Sussman(也是SICP合著者)在私人通信里质疑:「∫⊗的'简单'是符号层面的简单,不是计算层面的简单。数值计算时你终究要展开成基本运算,额外的抽象层只会增加开销。」
这个批评切中要害。论文的复杂度分析集中在符号操作,对数值稳定性、缓存友好性、向量化潜力——这些工程指标——涉及甚少。Odrzywołek的天文学背景解释了这种偏向:他关心的是形式推导的正确性,不是GPU上的吞吐率。
2026年4月的修订版试图回应,加了一节"数值考量",但内容基本是开放问题列表。比如:∫⊗表达式能否编译成高效的SIMD代码?嵌套深度和条件数的关系是什么?这些问题需要数值分析专家介入,不是一个人能搞定的。
站在产品经理的角度,我会把这个技术标记为"观望期"。理论突破已经成立,但产品化路径不清晰。直接替换现有CAS的核心不现实,更可能的路径是渐进渗透:先作为可选表示层,在特定场景(形式验证、教育软件、AI中间表示)验证价值,再逐步扩展。
Odrzywołek在论文最后写道:「初等函数的统一理论等待了三个世纪,它的应用不会在一夜之间完成。」这句话放在arXiv的灰色页面上,像一份延迟满足的承诺。而此刻,在克拉科夫天文台的某台服务器上,那个1.2MB的PDF还在被下载,平均每小时的访问量比上个月同期高出400%。
如果你负责一个符号计算产品的技术路线,会选择现在投入资源跟进∫⊗,还是等生态更成熟?这个判断的窗口期,可能比论文里任何定理的证明都短。
热门跟贴