数学悖论系列之四（概率悖论)|伯努利|伯特兰|定理|数学悖论|概率悖论|贝叶斯

数学悖论系列之四（概率悖论)

四、概率悖论(paradoxes in probability)

（一）概率悖论概述

由于概率的应用,出现了许多难题.这些问题从容易解决的简单案例到引起大量哲学讨论的其他案例不等。在思考概率悖论主题时,很有用的方法是检验一类被称为伯特兰悖论（Bertrand paradox）的谜题,以及其他人提出的一些变体。这些原则在它们可以说是依赖的原则方面有所不同,因此在容易解决方面也有很大不同。悖论的概念被考虑,这产生了一种方法来分类所谓的概率悖论。每一个伯特兰的悖论都是以其他方式来计算可能性。这将这些悖论与构成经典概率解释基础的无差别原则联系起来。经典的概率解释表明,一个事件的概率是等可能性中有利情况的比率,这是无差异原则给出的。

概率中的悖论经常出现，因为人们对概率的内涵有不正确的理解，或者因为措辞模糊，导致多种解释。更具体地说，看待一些问题的直观方式使得对一个问题的可能结果的不完整列举看起来似乎实际上是完整的。

从概率中的难题和悖论发展成数学概念，有助于给出一个规范的解决方案以及促进数学家们的进一步思考。悖论的主题有均等可能性、期望、相对频率和个人概率。这些主题涵盖了先验理论、频率理论和主观理论的通常方法。而对概率的一种哲学立场的限制——无论是客观主义者还是主观主义者——限制了理解，并且不能发展良好的应用。

概率论为处理机会和不确定性提供了一种定量的计算方法。它是我们可用的最成功的分析工具之一，经常被用来纠正关于机会的错误观念。这些修正有一种似是而非的气氛，因为它们给出的结果至少在最初是相当出乎意料的。

由于悖论产生于从概率论到常见误解的纠正。虽然概率演算可以有益地应用于大量的问题，但在某些情况下它会失败——这些被认为是概率论中的悖论。

概率论中的悖论可以大致分为对互斥性的不恰当评估、对概率独立性的不恰当评估和对预期重要性的不恰当评估。

（二）著名的三个概率悖论

1.伯特兰悖论（the Bertrand paradox）

伯特兰悖论是概率论中的一个问题，由法国数学家约瑟夫·伯特兰(Joseph Bertrand，1822-1900)在其1889年的著作《概率计算》中首次提出。它提出了一个看起来非常简单的物理问题，但除非其过程被更清楚地定义，否则会导致不同的概率。

伯特兰的问题是找出圆上任意一条弦比其内接等边三角形的一边长的概率。这个问题是伯特兰的名字命名的，他在1889年研究了这个问题。

这个悖论的经典解决方案取决于弦的选择模式。只有预先确定了选择程序，这个问题才有明确的答案。因为选择过程没有限制，所以没有任何理由选择一种方法而不是另一种方法。此外，如果一个人决定用物理实验来解决这个问题，他会再次遇到悖论，因为可以设计不同的实验，每个实验都给出上述不同答案中的一个。

正如我们将会看到的，伯特兰的问题有(至少)三个答案，这取决于人们如何解释随机弦这个短语。缺乏唯一的答案在当时被认为是一个悖论，因为它被认为(天真地，事后看来)应该有一个单一的自然答案。

伯特兰悖论表明，如果你没有很好地定义概率，那么产生随机变量的机制也不会很好地定义就会导致了一个悖论——一个混乱、矛盾的局面：所有解决方案都有效，然而它们不可能同时都有效——这就是悖论。然而，悖论的原因是初始问题不确定；我们没有被赋予任何选择弦的规则，所以这为多种解释敞开了大门。但如果你仔细定义你的概率空间，那么悖论就不存在——“悖论”仅仅是当所讨论的集合无限大时，试图给“随机选择”的概念赋予一个有效意义的结果。

很明显，许多计算答案的尝试都包括与某种真实世界情况相关的假设。这个问题之所以有几种不同的答案，仅仅是因为没有一种单一的物理情况是假设性描述的确定类比——不同的人想象不同的物理情况，每种情况都有自己的方式。

总而言之，这并不是一个真正的悖论，它只是一个仅在物理情况方面有意义的问题，但物理情况的确切细节没有定义。数学悖论是数学中的结果或观察结果(看起来)是矛盾的、不直观的、不可理解的，或者只是简单的怪异。尤其是概率中的悖论，可以作为一个教训，即问题需要以精确的方式提出——伯特兰悖论就是其中之一。

基于在一个圆中构建一个随机弦，伯特兰悖论涉及一个单一的数学问题，有三个合理但不同的解决方案(也可以用统一的方式定位随机线：用泊松线的数量生成所谓的泊松线过程)。这与其说是一个悖论，不如说在问这样一个问题:你所说的随机到底是什么意思？

(1)随机端点

通过随机选择圆周上的两个端点并将它们连接在一起以创建弦来定义弦。想象一下三角形现在被旋转以使一个角与弦的一端匹配，如图29所示。从图中可以看出，弦的另一个端点决定了这个弦是否比三角形的边长。

图 29

弦2的另一个端点与三角形的两个远角之间的圆弧接触，并且比三角形的边长。然而，弦1和弦3的另一个端点在起点和三角形的远角之间的圆弧上，可以看出它们比三角形的边短。

很容易看出，弦比三角形边长的唯一方法是它的远端点位于三角形两个远角之间的圆弧上；由于三角形的角将圆的圆周一分为三(均等)，所以远端点有1/3的机会位于这个圆弧上。因此，弦比三角形的边长的概率是1/3。

(2)随机半径

在该解决方案中，不是通过它的端点来定义我们的弦，而是通过在圆上画一个半径并通过这个半径构造一个垂直弦来定义它。现在让我们再想象一下：旋转三角形，使一边平行于我们的弦(因此也垂直于半径)。（见图30）

图 30

从图中我们可以看出，如果弦在比三角形的边更靠近圆的中心的点(如弦1)穿过半径，那么它比三角形的边长；而如果它在更靠近圆的边的点(如弦2)穿过半径，那么它就更短。根据基本几何学，三角形的边平分半径(将半径切成两半)，所以弦有1/2的机会更靠近圆的中心。因此弦有1/2的可能性比三角形的边长。

(3)随机中点

对于第三种解决方案，假设弦由其圆内中点的位置来定义。在图31中，三角形内接一个较小的圆。从图中可以看出，如果弦的中点落在这个较小的圆内，就像弦EF一样，那么弦比三角形的边长。

图 31

相反，如果弦的中点在较小的圆之外，那么它小于三角形的边。因为小圆的半径是大圆的1/2，所以它的面积是大圆的1/4。因此，随机弦中点位于较小圆内的概率为1/4。所以，弦比三角形边长的概率为1/4。

(4)其他解决方案

从前面三个小节可知，在圆上随机绘制弦的三种方法——根据弦的定义，我们有三种完全不同的概率。问题归结到如何陈述这个问题，由于给出的三种解决方案指的是随机选择弦的三种不同方式，所以它们都是同样可行的解决方案。因此，正如最初所说那样，这个问题没有唯一的答案。

这些不同的概率可以通过以不同的方式设置问题而被物理地看到——下面简要补充一下其他解决方案。

在图32中，将随机弦选择这个问题转化为“随机选择一个实数”的概率的计算问题。结果是1/4，同(3)一致。

图 32

在图33中，给定一端点，通过考虑选择圆周上比邻近该端点1/3的圆周更远的点，给出另一端点产生比三角形边长的弦的概率的计算——该点通过将圆周的1/3的长度除以圆周来计算。这意味着假设从线段的一部分中“随机选择一个实数”的概率由该部分的长度除以线段的总长度给出。结果是1/3，同(1)一致。

图 33

当随机生成一个对象时，决定该对象的一系列自然变量应该被赋予适当的均匀分布。在图34中，假设线段长度(部分长度上的实数可以与整个线段上的实数一一对应)均匀分布在区间(0，1)上——结果是1/2，同(2)一致；假设角均匀分布在区间(0，90)上——结果是1/3，同(1)一致。

图 34

2.圣彼得堡悖论(the St. Petersburg paradox)

瑞士数学家和物理学家丹尼尔·伯努利（Daniel Bernoulli，1700-1782年）于1738年首次向圣彼得堡学院提出了决策悖论：抛硬币，如果正面朝上，玩家将获得一卢布，游戏结束；如果它是反面朝上，那么它将被再次投掷——这次如果它是正面朝上，玩家将获得两卢布，游戏结束。这一过程持续进行，每次回报都翻倍，直到出现正面朝上情形，玩家赢得一些东西，然后结束。

著名的圣彼得堡悖论，很可能是决策理论中最古老的悖论，可以说推动了现代决策理论本身的诞生。自1738年丹尼尔·伯努利提出圣彼得堡悖论以来，许多人试图解决它，并提出了各种解释，但都不令人满意。

在经济学中，圣彼得堡悖论发挥了特别重要的作用，它指出了这样一种情况，即基于预期收益甚至预期递增效用的假定理性决策并没有得到真正理性的人类决策者的认可。圣彼得堡悖论开启了试图解决它的洪流，结果都是以这样或那样的方式修改它。最重要的变化是引入了一个凹效用函数，以体现风险规避和收益边际效用递减，这仍然是现代经济理论的中心支柱。

圣彼得堡悖论之所以重要，是因为它让我们重新思考了我们对金钱和选择的一些想法。它改变了经济学，表明我们的决策比冷酷的数字可能暗示的要多。这对普通人来说很重要，因为每次我们做出关于消费或储蓄的选择时，我们都在处理类似的风险和回报概念。它真正改变了我们如何理解经济、决策和我们自己的行为。这个悖论为思考金钱、商业和我们每天做出的决策的新方法铺平了道路。

圣彼得堡悖论是概率论中的一个重要课题，在过去的280年中一直没有得到解决。它仍然是决策理论中新难题和新见解的可靠来源。有的数学家就此提出了一个新的定价理论，并认为附带解决了这个悖论。新的定价理论指出，所谓的公平(合理)定价应该由卖方和买方独立判断。卖方的合理定价可能不适合买方。卖家关心的是成本，而买家关心的是现实的回报前景。

下面用一个游戏的例子讲明什么是圣彼得堡悖论以及其解决方案。

比方说，你在一个游乐园里遇到了一个游戏，现金奖励可能会让人大吃一惊。游戏的运作方式是这样的：一枚硬币被一次又一次地翻转——直到它露出正面，如果你在第一次尝试时显示正面，你将赢得 2 美元——游戏结束；如果显示反面，你将进行第二次尝试——此时出现正面，你的奖金将翻倍——增加到 4 美元(游戏结束)，但若出现反面——你将进行第三次尝试；如果这次出现正面，你的奖金将翻倍——增加到 8美元(游戏结束)，但若出现反面——你将进行第四次尝试……你每次翻转反面时，你可以赢得的金额就会翻倍，直到正面出现(游戏结束)。

现在最大的问题是：你认为应支付多少钱来玩这种游戏是才公平的！

根据伯努利规则，人们最大化他们在赌博中的预期效用，即我们应采用期望值(预期收益)最大化的原则。根据这一原理，一个不确定前景的价值是通过将每个可能结果的价值乘以其概率，然后将所有项相加而获得的总和(见图35)。因此，圣彼得堡游戏的预期货币价值是

无穷大。

图 35

期望值是一个数学概念，你可以在其中查看游戏或情况的所有可能结果，并计算出如果你可以一遍又一遍地重复游戏，你平均可能期望的结果。

圣彼得堡游戏的预期货币价值(期望值)和是无限的。但为玩这个游戏的特权支付一大笔钱显然是荒谬的，因为很有可能输掉一切，包括第一次投掷就输掉50%的可能性，而且这个游戏对预期货币价值最大化的原则具有致命的损害——它揭示了一种奇怪的情况，我们认为玩这种硬币游戏的公平价格远低于游戏平均实际支付的价格，应着眼于赔率而做出明智选择。如同假设一家保险公司提供一份涵盖极其罕见事件的保单——你需要索赔的预期价值很高，但大多数人不会支付如此高的保费一样——这种不匹配是现实世界中起作用的悖论。所以，即使游戏的平均胜利也可能是巨大的，但大多数人不会为梦想而支付巨额费用来参与。

圣彼得堡悖论让我们对我们认为明智的金钱决策三思而后行。这个谜最终通过在组合中加入效用的概念(经济学中的想法，它试图衡量某件事让你感到多么快乐或满足，而这一切都是关于你如何决定什么值得做或买)而得到解决。这不仅仅是纯粹的价值，这是关于金钱带来的有用性或享受，它不会随着你拥有的钱越多而永远上升。伯努利发现，如果你把这个收益递减的原则考虑进去，预期的效用就不会越来越大，这与人们玩游戏的实际支付更紧密地一致。

“悖论”在于这样一个事实，即我们理性选择的最佳理论似乎要求为玩一次圣彼得堡游戏的机会支付任何有限的费用都是理性的，即使几乎可以肯定玩家将赢得非常适度的金额。玩家赢得不超过$2的概率是1/2，赢得不超过$4的概率是3/4。

伯努利对这一问题的回应是，他观察到，通过增加美元的预期收益这种算法出现了错误，而应该增加的是每个结果的预期效用。他提出了被广泛接受的原则，即(粗略地说)货币具有递减的边际效用，并建议货币效用的现实度量可以通过货币金融的对数来给出。如果效用 = log($)，那图35中的收益表1就转换成收益表2(图36)。

图 36

期望效用(预期效用)的总和不是无限的:它达到大约0.60206效用(价值4.00美元)的极限(图37)。因此，理性的人会支付任何低于4.00美元的金额来玩游戏。然而，这种对悖论的回应并不令人满意——让我们同意货币具有递减的边际效用，并接受(为了论证的目的)对任何金额效用的合理计算采用美元金额的对数。

图 37

图 38

3.蒙蒂·霍尔悖论(问题)(the Monty Hall paradox/problem)

蒙蒂·霍尔悖论相当有趣，数学教授杰森·罗森豪斯（Jason Rosenhouse）为此专门单独将它作为一个主题写了一本书《蒙蒂·霍尔问题：数学最具争议的脑筋急转弯的非凡故事》（牛津大学出版社，2009年）。在这本书中，他从从逻辑论证到数学严谨性的各种角度来处理这个问题。

“蒙蒂·霍尔问题”因其与蒙蒂·霍尔主持的电视游戏节目“让我们做笔交易”相似而得名。问题陈述如下：

假设一个房间有三扇门，两扇门后面是山羊；另一扇门后面是一辆闪亮的新车。你被要求选择一扇门，将赢得门后的任何东西。假设你选了1号门。然而，在1号门打开之前，知道三扇门后面是什么的人(蒙蒂 )打开了另外两扇门中的一扇门——露出一只山羊(按照游戏规则，蒙蒂总会露出一只山羊)，并问你是否希望将你的选择改为第三扇门(即：既不是你选的也不是他打开的门)。

你直觉的、但不正确的反应是参赛者是否转换并不重要：因为还有两扇门，找到后面那辆车的概率是1/2——在第三扇门打开后，你会认为你有两扇门可以选择……两扇门都有相同的概率。但正确答案是你确实想换。如果你不切换，你有1/3的机会赢得汽车，因为不管你最初是否选择了正确的门，蒙蒂总会给你看一扇有山羊的门。但是在蒙蒂为你消除了其中一扇门后，你显然没有通过坚持你最初的选择将你的获胜机会提高到1/3以上。然而，如果你现在换扇门，你有2/3的机会会赢得这辆车(尽管这看起来违反直觉)。

很多人都对换门的更大概率感到困扰：改变选择会让你赢的概率是坚持原来选择的两倍，这个结果对许多人来说似乎是违反直觉的。解决方法之一是明确列出所有可能的结果，并计算如果你留在你选择的门前而不是去换另一扇门，你得到一辆车的概率有多大。

不失一般性，假设你的选择是1号门，那么可能的结果如下表所示(图39):

图 39

从图39中可知：在三分之二的情况下，你通过在其中一扇门出现山羊后改变你的选择来赢得汽车。这是因为有更大的概率，你的第一次选择就选择了一扇后面有山羊的门，然后蒙蒂保证会揭示另一扇后面有山羊的门。因此，通过改变你的选择，你赢的概率将加倍。

上述解释来源于枚举所有可能性，从而计算出在蒙蒂揭示另一扇后面有山羊的门后，你所作出的决定(换还是不换)胜算是多少——相当直观。但是，如果是100扇门——你无法枚举，这时你就得用到贝叶斯定理来求解——使用贝叶斯定理可以找到更严格的解决方案。

贝叶斯定理是一个公式，描述了在给定证据的情况下，如何更新假设正确的概率。在这种情况下，这是我们最初选择的门是后面有车的门的概率(停留是正确的)，因为蒙蒂打开了一扇门——门后面有一只山羊：蒙蒂向我们展示了我们没有选择的一个选择是错误的。

用贝叶斯定理计算出来的概率同上述枚举法计算出来的结果相一致(图40)。结果显示：汽车位于1号门后面的概率完全没有变化(1/3)；然而，由于这辆车只能在1号门后面或蒙蒂没有透露的门后面，所以它不在1号门后面的概率是2/3——在另一扇门的概率为2/3。因此，改变(换门)的可能性是留下来(不换门)的两倍。

图 40

上述结果很大程度上取决于这样一个事实:不管你最初选的是哪扇门，蒙蒂总能保证打开一扇后面有山羊的门。现在考虑一下，如果蒙蒂随机打开(他不知道三扇门后面是什么东西)一扇我们没有打开的门——里面有一只山羊，会发生什么？不管我们选择了哪扇门，我们第一次选择正确的概率是多少？这就是蒙蒂·霍尔问题的变体(随机)。

结果显示：当蒙蒂随机打开一扇门，而门后恰好有一只山羊时，我们的第一次选择有1/2或50%的可能性是正确的(图41)。

图 41

蒙蒂·霍尔悖论表明：游戏的一般原则是随着新信息的增加，应重新评估胜算概率

（三）其他与概率相关的悖论

1.辛普森悖论(the Simpson paradox)

辛普森悖论，也被称为尤尔-辛普森效应，是由统计学家爱德华·辛普森（Edward Simpson）于1951年提出的。在这个悖论中，当这些数据集组合在一起时，出现在几个不同数据集中的趋势往往会消失或逆转——在统计学中，当两个分类变量之间的边际关联在控制了一个或多个其他变量后，在性质上不同于相同两个变量之间的部分关联时出现的一种效应。

辛普森悖论之所以重要，有三个关键原因：首先，人们通常期望统计关系是不可变的，但它们通常不是——两个变量之间的关系可能增加、减少，甚至改变方向，这取决于被控制的变量组；第二，辛普森悖论不仅仅是一个只有一小部分统计学家感兴趣的模糊现象，实际上它是一大类联想悖论之一；第三，辛普森悖论提醒研究人员，因果推断，特别是在非实验研究中，可能是危险的——可能存在无法控制甚至无法观察到的变量，这些变量会消除或逆转两个变量之间观察到的关联。

在一个简单例子的背景下理解辛普森悖论是最容易的。假设一所大学担心研究生入学过程中的性别偏见。为了研究这一点，该大学研究生项目的申请人根据性别和录取结果进行分类。这些数据似乎与性别偏见的存在相一致，因为男性（40%被录取）比女性（25%被录取）更有可能被研究生院录取。

为了确定男女录取率差异的来源，该大学根据申请人是申请自然科学系还是社会科学系进行细分，然后再次进行分析。结果是令人惊讶的，该大学居然发现性别和结果之间的关系方向发生了逆转。在自然科学系，女性（80%被录取）比男性（46%被录取）更有可能被研究生院录取；同样，在社会科学系，女性（20%被录取）比男性（4%被录取）更有可能被研究生院录取。

上述例子说明，当数据被分割成单独的数据组时，似乎存在统计趋势，但当数据被视为一个整体时，统计趋势就会消失（或反转）。辛普森悖论可能在因果关系被忽视时出现，但当它们被适当解释时就会消失。

虽然在辛普森悖论中观察到的这种反向关联看起来令人困惑，但实际上很简单。在这个例子中，发生这种情况是因为性别和录取都与第三个变量有关，即院系。首先，女性更有可能申请社会科学系，而男性更有可能申请自然科学系；第二，社会科学系的录取率远低于自然科学系，因为女性比男性更有可能申请录取率低的项目，当忽略院系时（即当数据在整个大学中汇总时），女性似乎比男性更不太可能被研究生院录取，而事实恰恰相反。虽然像这样的假设例子很容易构建，但在社会科学和统计学文献中可以很容易地找到大量真实的例子。

辛普森悖论是关联悖论中的一个特例，它可以发生在连续变量（可以取任何值的变量）或分类变量（只能取某些值的变量）之间。辛普森悖论，虽然是关联悖论中最引人注目的，但当出现较弱的关联悖论形式时，边际关联的大小超出了在被控制变量的各个水平上计算的部分关联的值范围——这些被称为合并或聚合悖论。

当出现反转悖论时，很自然地会问边际关联或部分关联是否是对两个变量之间因果关系的正确描述。假设样本中变量之间的关系反映了抽取样本的总体之间的关系，那么通常的统计答案是边际关联和部分关联都是正确的。从数学上讲，边际关联和部分关联方向的逆转并不令人惊讶。

2.男孩还是女孩的悖论(the boy or girl paradox)

想象一下，一个家庭有两个孩子，我们知道其中一个是男孩。那么，另一个孩子是男孩的概率是多少呢？显而易见的答案是说概率是1/2——毕竟，另一个孩子只能是男孩或女孩，而婴儿出生为男孩或女孩的概率（基本上）是相等的。

然而，在二孩家庭中，实际上有四种可能的孩子组合：两个男孩（MM）、两个女孩（FF）、一个大男孩和一个小女孩（MF）以及一个大女孩和一个小男孩（FM）。我们已经知道其中一个孩子是男孩，这意味着我们可以消除组合 FF，但这给我们留下了三个同样可能的孩子组合，其中至少有一个是男孩——即 MM、MF 和 FM。这意味着另一个孩子是男孩的概率（MM）必须是 1/3，而不是 1/2。

3.富客悖论(the rich guest paradox)

有一个非常贫穷、古板的小镇,每个人都欠了一大笔债,却没钱还。

有一家旅馆几乎看不到任何生意了，老板很快就会关闭它。一天,一位非常富有的美国客人出现了,他想在那里过夜。然而,在他确认之前,他要求参观旅馆。接待员要一份保证金,美国人可以拿回去,以防他不喜欢这些房间。

客人在参观房间时，旅馆老板将客人的保证金(刚好是旅馆欠厨师三个月工资的准确数额)给了厨师。厨师发现这保证金刚好是他几个月来欠杂货店老板的钱款,于是他付钱给杂货店老板。杂货店老板意识到这是他欠医生治疗他妻子关节炎的确切金额,于是又付给了医生钱。然后,医生付给护士两个月的欠薪——刚好是杂货店老板交来的治疗费。这位护士刚到这个城镇,所以她在旅馆里住了几天才找到房子租下来。她也很穷,当时也付不起旅馆的钱。而医生给她的钱正是她欠旅馆的钱,所以她付给了旅馆。

现在旅馆已经收回了付给厨师的确切金额。然后客人完成了对客房的参观,结果他发现自己不喜欢，于是从酒店拿回他的保证金,然后离开——再也不会被人看到。所以每个人的债务都已经偿还了,但没有什么不同于以前——没有人能得到任何东西，但现在每个人都很高兴,尽管这些钱只不过是为了回到第一个拥有者身边。因此,这一悖论基本上是描述从一开始就没有什么变化,但在此过程中,债务是用不着钱来偿还的。

请问：债务真的存在吗？这个没标准答案，有待各位看官自行脑补。