2017年“双十一”狂欢落下帷幕,
你贡献了多少?
知道吗?影响消费决策的因素,其实背后藏着很有趣的统计知识。
在“双十一”买买买的时候,我们通常会浏览网友评论,作为重要参考因素。究竟,差评积累到什么程度,会让我们放弃购买?商家为什么会惧怕差评?
贝叶斯统计告诉我们:原来,一条差评所带来的坏影响需要连续五条好评所带来的好影响去弥补,可见商家如此排斥差评也是有贝叶斯定理为理论支撑的。
不要停,读下去一起涨姿势~
18世纪,英国学者托马斯·贝叶斯提出了一种看起来很显而易见的观点:客观的新信息会对我们关于某个事物的初步认识进行更新,使我们得到一个新的、改进了的认识,而我们必然会根据新的认识进行决策。
这一观点似乎因为太简单而显得有些平淡乏味,但恰恰这大道至简的思想,就是贝叶斯法则的伟大之处,贯穿了整个贝叶斯统计的始末。后来,这一思想逐步完善成一种系统的统计推断方法,即贝叶斯方法。利用贝叶斯方法做统计推断所得到的全部结果,构成了贝叶斯统计的基本内容。
日常生活中的贝叶斯
我们之所以觉得贝叶斯方法平淡朴实,正是因为生活中我们无时无刻不在面对这样的问题:根据给定的一些信息,探求事件真相,而在解决这一问题时,我们总是在不知不觉地应用着这一法则。
以当今生活中不可或缺的网络消费为例,我们来挖掘一下贝叶斯统计是如何存在于我们身边的。首先我们回顾一下网购的过程:浏览商家描述——形成对商品的初步认识,查看商品评价——获取新信息,买或不买——依据更新后的认识做出决策,这个过程本身就体现着完整的贝叶斯思想。
试想如果平均每十条评价中出现三次差评,那么你还会继续购买该商品吗?可能性不大。但是从概率的角度考虑,该商品令人不满意的可能性为3/10,小于令人满意的概率7/10,理性的选择应该为继续购买才对。
为什么会出现理论与实际相悖的现象呢?原因在于上述分析没有考虑到消费者对网络商品的初步认识是先验信息,这也是统计界频率学派与贝叶斯学派最根本的区别所在。
为了描述方便,我们记“某商品令人满意”为事件A,由于各种网络商品鱼龙混杂,使得消费初步认为这些商品令人满意的可能性较小,因此令p(A)=1/4< 1/2;记“同一商品获得差评”为事件B,由观察商品评价获得的实际数据可知p(B)=3/10,同时在考虑实际情况的基础上令“消费者对令人满意的商品给出差评”的概率p(B│A)=0.1,那么根据贝叶斯公式可得
也就是说,每十条评论出现三次差评这一客观信息,会使消费者认为该商品令人满意的概率降低到1/12,自然不会进行购买,可见消费者下意识地做出了符合贝叶斯标准的决策。
同时,我们又经常会遇到这种情况:对商品给出差评后,商家会开启狂轰滥炸模式,用各种方法来劝说消费者修改评价。商家如此惧怕差评的背后又隐藏着什么呢?
从上面的分析中,我们知道自然是差评越少即p(B)越低越容易提高消费者对商品的信任。另一方面,由于每十条评论会出现三次差评,这里首先认为每条评论为差评的概率为3/10,为好评的概率为7/10。由上文可知在看到一条差评后,消费者认为该商品令人满意的概率为1/12,若在此基础上继续查看其它评价,如果下一条为好评,那么根据贝叶斯公式消费者对商品的信任程度会提高到3/28,以此类推只有连续观察到五条好评才能让消费者恢复到原有的信任程度。
也就是说,一条差评所带来的坏影响需要连续五条好评所带来的好影响去弥补,可见商家如此排斥差评也是有贝叶斯定理为理论支撑的。
除网络消费之外,很多生活小事都与贝叶斯统计有关,张嵘在发表于数理科学的文章中,用贝叶斯公式解释了2011年由日本核泄漏导致的“抢盐”风波、分析了“老人倒地无人敢扶”的奇怪现象、论证了企业“试行”决策的合理性。
到这里,似乎又明白了好多社会现象的存在原因,如:为何通过面试后公司还会要求几个月的实习期才能转正;相亲对象为何还要“处一处”才能确定关系;某些病情为何要留院观察才能最终确诊……无非是获得新信息来不断更新原认识,最终得到新认识的过程,可见贝叶斯思想与我们实际的思维方法十分贴近。
国际难题中的贝叶斯
除日常生活外,贝叶斯统计方法在解决国际难题中也发挥着重要作用。2009年6月1日凌晨,一架由里约热内卢飞往巴黎的法国航线A44航班奇迹般地消失在了大西洋上空,该事件引起世界一片哗然,并被称为截至2009年地最神秘空难事故。事后,法国航空管理局(BEA)多次努力寻找飞机残骸和黑匣子,但情况都不容乐观。
直到2010年7月,BEA决定组织一批有经验的研究人员对残骸的可能位置进行贝叶斯理论分析搜寻,工作才有了新的进展。研究人员根据当时飞机本身的飞行情况和天气状况确定了飞机残骸的最大可能分布区域,并在该区域内取n个点来代表飞机残骸可能存在的位置。整个搜寻工作总共分为四个阶段:表边搜寻、被动声搜寻、第一次旁侧声呐搜寻(2009年)和第二次旁侧声呐搜寻(2010年)。
每一次搜寻结束都能对前一次的推断结果进行修正得到新认识,并以此作为后一次搜寻的初始认识进行再次修正,也就是说每一次搜寻得到的后验都将作为下一次搜寻的先验来计算新的后验,具体的计算公式为:
其中,Wn表示残骸在位置n的先验概率,p(n)表示处于位置n的残骸能够被成功搜寻到的概率。令人欣慰的是,经过四阶段的搜寻工作,在经过四次更新后的后验分布图的指导下,终于在2011年4月3日于14000英尺的海底找到了飞机残骸和黑匣子。可见,贝叶斯理论方法在该问题的解决过程中发挥了强大的作用。
除A447外,天蝎号以及SS中美洲号的搜寻工作,也是在贝叶斯方法的指导下进行并取得成功的。在贝叶斯分析中,可以通过先验概率和客观数据对不确定因素进行量化,从而对问题进行比较理想的分析,所以说贝叶斯分析方法可以非常完美的安排复杂的搜寻工作,并且该方法已经成功成为了美国海岸巡防搜救优化计划系统(SAROPS)安排海上搜寻工作的基本方法。
在其他领域,贝叶斯方法在处理垃圾邮件这一困扰着所有互联网用户的难题上,也取到了很好的果。Paul Graham曾兴奋地说:“这样做的效果,好的不可思议!在如今的大数据背景下,贝叶斯方法更是在机器学习中发挥了很大作用……”
贝叶斯统计,曾被美国科学史家莎伦·麦格瑞恩选入《不会死掉的理论》一书中,并进行了应用及相关知识的讨论,后又被美国城市大学研究员迈克尔·沃什伯恩评价说:“贝叶斯的实用性使它在军事、商业以及克服个人困难而非纯粹研究上非常成功。它没有激发出创新,但它能解决问题。”
没错,贝叶斯统计没有使我们生活的世界和被研究的世界产生断裂,日常生活中我们无意识地应用它,国际难题中我们有意识的选择它,这就是贝叶斯统计的魅力所在——平凡而伟大。
(作者:周兰兰 天津财经大学)
参考文献
[1]张嵘. 用贝叶斯公式解释生活中的若干决策[J]. 科教导刊, 2012(36):112-112.
[2]Stone L D, Keller C M, Kratzke T M, et al. Search for the Wreckage of Air France Flight AF 447[J]. Statistical Science, 2014, 29(1):69-80.
热门跟贴