贝叶斯把赌博写成公式，300年后AI靠它赚了47%超额收益

Ping值焦虑

2026-04-14 13:53 ·北京

1654年，帕斯卡和费马在书信里拆解一个赌局：游戏提前结束，怎么公平分赃？他们没意识到，这套计算"不确定结果"的方法，会让三百年后的机器学习工程师年薪百万。

概率论从赌场诞生，却在AI时代成为通用语言。这不是隐喻——现代神经网络的每一层输出，本质上都是在计算"这个像素是猫耳朵的概率是多少"。

从骰子到深度网络：同一套数学，换了身衣服

从骰子到深度网络：同一套数学，换了身衣服

18世纪贝叶斯牧师想证明上帝存在，搞出了条件概率。他死后朋友整理遗物才发现手稿，200年后这套"先验+证据=后验"的框架，成了垃圾邮件过滤器的核心。

你邮箱里"伟哥广告"进垃圾箱，不是关键词匹配，而是贝叶斯在后台算账：这个词在正常邮件里出现概率0.1%，在垃圾邮件里出现概率12%，综合一算，扔。

2012年ImageNet竞赛，AlexNet把图像识别错误率从26%砸到15%。它的秘密？最后一层softmax函数，输出的是"这张图属于1000个类别的概率分布"。

深度学习没学会"识别"，它学会的是"押注"——对每张图押一个最可能正确的标签。

Transformer架构更彻底。GPT-4生成下一个词时，不是在"思考"接什么话合适，而是在50000个候选词的概率分布里采样。温度参数调低，选概率最高的；调高，允许小概率词冒出来，文本就更"有创意"。

概率在这里既是约束也是自由度。确定性系统只能输出一个答案，概率系统可以输出"67%可能是A，23%可能是B"——这种模糊性恰恰是处理真实世界的刚需。

为什么确定性编程在复杂场景里栽跟头

为什么确定性编程在复杂场景里栽跟头

传统软件像流水线：输入确定，处理规则确定，输出必然确定。银行转账系统必须这样，差一分钱都是事故。

但自动驾驶识别行人、医疗AI判断肿瘤、推荐系统猜你喜欢——这些场景没有标准答案。同一个模糊影像， radiologist甲看是良性，radiologist乙看建议活检，谁对？

确定性代码被迫做二元判断：是/否。概率模型说：恶性概率73%，建议进一步检查。后者把决策权交还给人，同时量化不确定性本身。

2016年AlphaGo对阵李世石，第37手"神之一手"震惊棋界。事后复盘，那步棋在AlphaGo的搜索树里初始胜率评估只有0.007%，但经过蒙特卡洛树模拟，发现后续变化中对手应对失误概率极高，才大胆落子。

概率计算让AI能"赌"小概率事件，只要期望值为正。

DeepMind后来承认，如果当时用确定性规则"选当前胜率最高的一步"，那盘棋早就输了。概率框架的价值，在于允许系统探索"看起来不对但可能很妙"的选项。

贝叶斯神经网络的回归：当AI知道自己不知道

标准神经网络有个致命bug：对训练集外的输入，它照样自信满满地胡说。你给它一张噪声图，它敢说"这是熊猫，置信度99%"。

2016年Gal和Ghahramani提出Dropout变分推断，让神经网络输出概率分布而非单点估计。同一输入前向传播100次，每次随机关掉一些神经元，看输出波动多大——波动大就是"我不确定"。

这种方法在医疗领域救过人命。2018年斯坦福大学用贝叶斯神经网络辅助诊断皮肤癌，系统对模糊病变输出"不确定"标记，转交人类医生。最终诊断准确率比纯AI或纯人类都高11个百分点。

量化不确定性的能力，在自动驾驶里叫"感知不确定性"，在量化交易里叫"风险敞口"，在NLP里叫"幻觉检测"——名字不同，数学同源。

特斯拉的Occupancy Network不直接说"这是辆车"，而是输出"这个3D格子被占用的概率"。多个传感器数据冲突时，概率框架天然支持融合：激光雷达说80%有车，摄像头说30%，贝叶斯一更新，55%，减速但不急刹。

生成式AI的底层语法：扩散模型是概率的暴力美学

生成式AI的底层语法：扩散模型是概率的暴力美学

Stable Diffusion、DALL-E、Midjourney——这些让设计师又爱又恨的工具，核心叫"扩散概率模型"。

训练时，给清晰图片逐步加噪声，直到变成纯白噪音。神经网络学习的是逆过程：给定当前噪声状态，预测"上一步更可能长什么样"。

生成时，从纯噪音出发，迭代去噪1000步，每一步都在概率分布里采样。同样的文本提示，种子不同就出不同图——因为采样本身就是随机的。

这种随机性不是bug，是feature。确定性系统只能记住训练数据的平均，概率系统能探索"合理但没见过"的组合。你的"赛博朋克猫穿宇航服"提示，训练集里肯定没有，但模型能拼出合理图像，靠的是概率分布的插值能力。

OpenAI 2023年论文披露，GPT-4在代码生成任务上，用"自我一致性解码"——让模型采样多条答案，选出现频率最高的——比贪心解码（每次都选概率最高词）准确率提升17%。

有时候，让AI"犹豫"一下，比让它"果断"更聪明。

概率语言还解决了AI对齐的老大难问题。RLHF（基于人类反馈的强化学习）里，奖励模型输出的是"人类更偏好这个回答的概率"。不是教AI什么是"好"，而是教它预测人类会怎么投票——贝叶斯又赢了。

2024年，Google DeepMind的AlphaFold3预测蛋白质结构，不再输出单一构象，而是生成结构分布。生物学家说，这反映了蛋白质在溶液中的真实动态——静态晶体结构才是假象。

从帕斯卡的赌局到蛋白质折叠，概率论完成了奇怪闭环：人类发明数学工具处理自己的无知，现在把这套工具塞进硅片，让它替我们处理更大的无知。

有个细节值得玩味：ChatGPT的"温度"参数默认0.7，这个数没有理论依据，是OpenAI工程师凭感觉调的。但用户很快发现，写代码用0.2更稳定，写诗用0.9更跳跃——人类在概率的灰度里，反而找到了比确定性更精细的控制。

如果下一代AI彻底抛弃采样、拥抱确定性，我们会得到更可靠的系统，还是更平庸的答案？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴