---囚徒困境---|博弈论|合作者|囚徒|囚徒困境|困境|均衡点|纳什

今天了解了一下博弈论，博弈论的经典例子之一是囚徒困境。有两个小偷集体作案，被警察抓住了，警察对两个人分别审讯，并且告诉他们政策，如果两个人都坦白交代，作案过程和赃物去向就可以定罪，两个人各判三年。如果一个人交代，另外一个人不交代，交代的人从宽处理，批评教育释放了，不交代的人，从严处罚判5年。如果两个人都不交代，无法定罪，每个人只能判一年。

两个人的具体收益情况在表里面展示，由于判刑是不好的，收益是负的，那这个时候两个小偷会作什么决策，是自己收益最大呢？

首先，考虑小偷a的决策，如果b坦白，那么a坦白就会判三年，a如果不坦白就会判5年，为了a的收益更大，a应该坦白；

如果b不坦白，a坦白就会判0年，a不坦白就会判一年，那a还是应该坦白；

所以，无论b如何做，a都应该选择坦白，这样a的收益是最大的，同样b也会这样想，无论a怎么做，b都应该坦白，收益才是最大的，因此而最终两个人都会坦白，而且此时没有任何一方愿意单方面的改变决策，因为一旦单方面改变决策，就会造成自己的收益下降。

这个a，b都坦白的策略就称之为纳什均衡点，两个人都坦白各判三年。两个人都不坦白各判一年是集体最优解，但是纳什均衡点却不是集体最优解，这说明个人理性产生的纳什均衡结果未必是集体的最优解。

但是，两人都不坦白，是一个不稳定的状态，因为小偷之间能不能相互信任是一个问题。小偷之间不知道对方会做什么。这不是合作游戏，所有小偷都会从背刺中获益。囚徒困境只是竞争游戏的一个例子，但其解决方案背后的基本思想适用于各种情况。通常，当你与他人竞争时，无论其他人决定做什么，选择对你最有利的行动方案都是有意义的。

另外，囚徒困境也反映了一个深刻的哲学问题：个人理性和集体理性的矛盾。个体为了自己的利益最大，而不愿意改变决策，因为改变决策的结果是不划算，导致整体利益最小。这样的情景就是个体与环境博弈的结果。所以，如果要达到更高的均衡收益结果，协调合作是最好的方法。在合作游戏中，每个玩家都同意为共同目标而合作。这可能是任何事情，从一群朋友决定如何分摊在餐馆的账单费用，到各国联盟决定如何在博弈论中分摊阻止气候变化的负担。

如果要到集体最优解，要求合作者完全理性，合作者之间相互信任对方的理性，决不会冲动和不理智，即使在复杂的多层次交互推理中也不会糊涂，不会相互对对方的理性、能力、信任和对信任的信任等有任何怀疑和动摇。这在合作中是不现实的，但是加强合作之间的理解、信任，是有助于提高所有合作者的利益的。

所以，合作协调是博弈中的关键，在我们做决策的时候，建立相互信任以及提高博弈中合作者协调性，从而在博弈对局中获得更大的利益。