今天了解了一下博弈论,博弈论的经典例子之一是囚徒困境。有两个小偷集体作案,被警察抓住了,警察对两个人分别审讯,并且告诉他们政策,如果两个人都坦白交代,作案过程和赃物去向就可以定罪,两个人各判三年。如果一个人交代,另外一个人不交代,交代的人从宽处理,批评教育释放了,不交代的人,从严处罚判5年。如果两个人都不交代,无法定罪,每个人只能判一年。

两个人的具体收益情况在表里面展示,由于判刑是不好的,收益是负的,那这个时候两个小偷会作什么决策,是自己收益最大呢?

首先,考虑小偷a的决策,如果b坦白,那么a坦白就会判三年,a如果不坦白就会判5年,为了a的收益更大,a应该坦白;

如果b不坦白,a坦白就会判0年,a不坦白就会判一年,那a还是应该坦白;

所以,无论b如何做,a都应该选择坦白,这样a的收益是最大的,同样b也会这样想,无论a怎么做,b都应该坦白,收益才是最大的,因此而最终两个人都会坦白,而且此时没有任何一方愿意单方面的改变决策,因为一旦单方面改变决策,就会造成自己的收益下降。

这个a,b都坦白的策略就称之为纳什均衡点,两个人都坦白各判三年。两个人都不坦白各判一年是集体最优解,但是纳什均衡点却不是集体最优解,这说明个人理性产生的纳什均衡结果未必是集体的最优解。

但是,两人都不坦白,是一个不稳定的状态,因为小偷之间能不能相互信任是一个问题。小偷之间不知道对方会做什么。这不是合作游戏,所有小偷都会从背刺中获益。囚徒困境只是竞争游戏的一个例子,但其解决方案背后的基本思想适用于各种情况。通常,当你与他人竞争时,无论其他人决定做什么,选择对你最有利的行动方案都是有意义的。

另外,囚徒困境也反映了一个深刻的哲学问题:个人理性和集体理性的矛盾。个体为了自己的利益最大,而不愿意改变决策,因为改变决策的结果是不划算,导致整体利益最小。这样的情景就是个体与环境博弈的结果。所以,如果要达到更高的均衡收益结果,协调合作是最好的方法。在合作游戏中,每个玩家都同意为共同目标而合作。这可能是任何事情,从一群朋友决定如何分摊在餐馆的账单费用,到各国联盟决定如何在博弈论中分摊阻止气候变化的负担。

如果要到集体最优解,要求合作者完全理性,合作者之间相互信任对方的理性,决不会冲动和不理智,即使在复杂的多层次交互推理中也不会糊涂,不会相互对对方的理性、能力、信任和对信任的信任等有任何怀疑和动摇。这在合作中是不现实的,但是加强合作之间的理解、信任,是有助于提高所有合作者的利益的。

所以,合作协调是博弈中的关键,在我们做决策的时候,建立相互信任以及提高博弈中合作者协调性,从而在博弈对局中获得更大的利益。