博弈论

更新时间：2024-03-05 06:52:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

如何走出囚徒困境

目前博弈论的发展正越来越受到各个领域的重视，因为在现实生活中矛盾和冲突总是无所不在，而利用博弈论可以帮助我们很好地解决这些现实生活中的矛盾和冲突问题。由此可见，如何在矛盾和冲突中成功的选择和运用策略是一个很有意义的问题。一、“囚徒困境“现象描述

囚徒困境是由数学家Tucker提出的，描述的是警方抓住两个合伙犯罪的嫌犯，但却缺乏足够的证据指证他们的罪行，如果其中至少有一人供认犯罪，就能确认罪名成立。为了得到所需的口供，警察将两个嫌疑犯A和B关在两个单独的房间里单独审讯，并告诉他们：如果有一人坦白，坦白者将被无罪释放，不坦白者则将被判刑10年徒刑；如果两人同时认罪，则他们将被各判5年徒.由此得

出囚徒困境得意矩阵：

囚徒2 囚徒1 坦白抵赖坦白抵赖（-5，-5）（0，-10）（-10，0）（-1，-1）在“囚徒困境”博奕中，纳什均衡是（坦白，坦白），尽管从总体上看（抵赖，抵赖）是对两个人都有益的结果，但由于不构成纳什均衡，所以不是该博奕的解。给定B坦白的情况下，A的最优战略选择是坦白，AB最优战略的组合（纳什均衡）却不是总体最优的选择。有没有可能其中一个人选择抵赖呢？按照人是理性的假设，没有人会积极地这么做，因为如果对方坦白的话，自己就可能被判刑

10年，理性的人是不会冒这种风险的。事实上如果两人都不坦白，则警方只能将他们都无罪释放，当然这一点警方不会告诉他们。这样看来A和B毫无疑问应该相互合作共同保持沉默，但是并非如此，以A为例，他认为如果自己不坦白而B坦白的话B将会无罪释放，却留下A自己独守牢狱。当然此时如果B也不坦白那情况是最佳的，但A无法确信B在这样的诱惑下能不动心。而在A坦白的情况下，无论B是否坦白，A收到的惩罚都小于前者。因此A最终会选择坦白。同理B也会做出同样的决定，结果就是A、B两人一起坐牢。

囚徒困境说明的是每个人都应该理性地考虑自身利益最大化做出对各自有利的抉择，其结果却会适得其反。即使他们建立同盟，在缺少足够的沟通和信任的情况下这种同盟只会不攻自破。

二、解决“囚徒困境”的方法：

现实生活中的博弈现象很多，只要有竞争的地方就会有博弈就会出现囚徒困境现象。囚徒困境一旦从一次性博弈转变为重复博弈，情况会发生非常大的变化，博弈的结局也就是纳什均衡点可能会完全不同。我们怎样才能走出这种困境这是值得我们深思的问题。（一）重复多次博弈

该博弈为一个完全信息的静态重复博弈，因为单次的囚徒困境只会导致双方选择纳什均衡，即均不合作。在重复博弈中囚徒们只是有时会走出困境，在每个囚徒贴现值充分大时，以下两种情况可能使得两个囚徒走出困境：其一是博弈重复无限次；其二是引入非对称信息，博弈重复的次数充分大。一次性的博弈最终会因个人利益最大化而陷入囚徒困境；但如果是多次博弈，人们就有了合作的可能性，囚徒困境就可能破解。

（二）约定约束

在重复型的囚徒困境中，并不是签订合作协议很困难，困难的是这个协议对博弈各方是否具有很强的约束力。一个合作契约建立的困难在于任何协议签订之后，博弈参与者都有作弊的动机。在博弈理论中，在无限次重复博弈的情况下，合作可能是稳固的。如果博弈无穷次，双方就会逐渐从互相背叛走向互相合作。因为任何一次背叛都会招致对方在下一次博弈时的报复；而双方都采取合作态度会带来合作收益。

（三）附加的可置信威胁可以让囚徒摆脱困境。

由于来自外部环境的威胁，进行“囚徒困境”博弈的两个囚徒之间的合作(抵赖、抵赖)可能作为一种受迫性反应而出现。举个例子，大家都知道国外的黑手党组织严密，对待背叛者的惩罚非常残忍。一个黑手党成员告发别的黑手党成员，一定会被组织谋杀。我们假设前面的囚徒困境故事不是发生在中国，而是意大利，囚犯A和B都是黑手党成员。他们很可能宁愿被判处终生囚禁，也不愿意出狱之后被同伙干掉。

（四）参与人或集体是理性经济人

囚徒困境反映了一个深刻的哲学问题：个人理性和集体理性的矛盾个人理性者是狭隘的理性人．面对囚徒博弈时。无法走出困境。集体理性者是科学的理性人．比个人理性者主观能动性更强。目光更长远，为了达到最大化的目的，能够主动引入(制定)人工博弈规则，甚至不惜与自己的竞争对手合作。集体理性者虽然与个人理性者的出发点完全一样，都是为了最大化自己的效用．但集体理性者能够认识到纯粹的个人理性有时无法达到最大化自己效用的目的，而只有引入人工博弈规则，比如建立联盟。从竞争走向合作。有集体认同感

才能达到目标。因此，对于“囚徒困境”，参与人中必须存在带有集体理性的理性人，才能最终走出囚徒困境。

三、分析总结

现实生活中各种经济利益矛盾和冲突总是无所不在，利用博弈论可以帮助我们很好地解决这些现实生活中的矛盾和冲突问题，最常见的解决方式就是选择长期重复博弈来解决，当无法实现自身利益最大化就会退出博弈。

通过运用有限次重复“囚徒困境”博奕，我们知道：如果该博奕在后来的长期内不断重复，由于每个博奕方互相知晓对方可能的得益，他们明白即使在最后一轮博奕中，也可能会被对方出卖。因此，在任何一次重复的博奕中都不存在合作的激励因素。从头至尾他们都会出卖对方。博奕双方在决策时都以自己的最大利益为目标，结果是无法实现最大利益，甚至导致对各方都最不利的结局，这种情况在现实生活中具有相当的普遍性，在市场竞争、环境问题、公共资源开发利用中屡见不鲜。

参考文献：

1、《教育学原理》曾灿著

2、《论摆脱囚徒困境的途径》马本江等

本文来源：https://www.bwwdw.com/article/2moa.html

相关文章：

正在阅读：

博弈论03-05

实验四图形用户界面编程实验报告12-17

时政热点：餐饮外卖进高校,学校食堂应反思05-23

读《种树郭橐驼传》有感03-08

2006年11月秘书三级国考题11-16

幼儿园大班美术《美丽的春天》教师资格证面试试讲教案模板教师招聘试讲教案12-05

观猴有感03-08

维运考试题03-28

初中人教版全部体育理论课教案05-25

浙江省嘉兴市《职业能力倾向测验》事业单位考试【含答案】04-07

上一篇：加油站标准化清单下一篇：政府财政科技支出结构如何影响创新绩效