关于“囚徒困境”博弈的认识.doc

上传人:gs****r 文档编号:1550264 上传时间:2019-03-05 格式:DOC 页数:6 大小:26.50KB
下载 相关 举报
关于“囚徒困境”博弈的认识.doc_第1页
第1页 / 共6页
关于“囚徒困境”博弈的认识.doc_第2页
第2页 / 共6页
关于“囚徒困境”博弈的认识.doc_第3页
第3页 / 共6页
关于“囚徒困境”博弈的认识.doc_第4页
第4页 / 共6页
关于“囚徒困境”博弈的认识.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

1、关于“囚徒困境”博弈的认识摘要:囚徒困境是博奕论中的一个重要范例。该模型深刻揭示了个人理性与集体理性的冲突。文章以博弈论中的经典模型“囚徒困境“为工具分析解剖了社会、经济、政治领域的一些囚徒困境现象,最后提出了囚徒困境的破解策略。 关键词:囚徒困境 个人理性 集体理性 合作 囚徒困境是博弈论中非零和博弈的经典范例。它是建立在具有个人理性的理性人的基础上的,反映了个人最佳选择而非团体最佳选择。虽然囚徒困境本身只具有模型性质,但是现实生活中类似囚徒困境的例子却屡见不鲜。因此,需要我们深入研究囚徒困境博弈的经典理论模型,找到一条能够真正帮助我们走出困境的道路。 一、 “囚徒困境”博弈的简介 “囚徒困

2、境”博弈讲的是, 两个嫌疑犯 A 和 B 作案后被警察抓住,被分别关在不同的房间里审讯。警察知道两人有罪, 但缺少足够的证据定罪, 如果罪犯中至少有一人供认罪行就能确认罪名成立。为了得到所需的口供, 对每一个犯罪嫌疑人,警方给出的政策如图: 在这个博弈中,假定 A 选择坦白的话, B 最好也选择坦白, 因为 B 坦白判刑八年, 而抵赖却要判刑十年; 假定 A 选择抵赖的话, B 最好还是选择坦白, 因为 B 坦白的话就不会被判刑, 而抵赖却要被判刑一年。也就是说, 不管 A 坦白或抵赖, B 的最优选择都是坦白。反过来, 同样, A 的最优选择也是坦白。结果, 两个人都选择了坦白, 各判刑八年

3、。 “囚徒困境”博弈反映了集体理性和个人理性的矛盾。如果 A 和 B 都选择抵赖的话, 则两人各被判刑一年, 显然要比都判刑八年要好,但是每个人都追求个人利益最大化, 以自我利益为目标的“理性”行为,却导致两个囚犯得到相对较劣的收益,对各方都不利的结果。 “囚徒困境”就是指这样一种情形, 此时几个人( 或企业) 合作要比不合作好, 但是每个人都觉得不合作符合他的利益, 因此每个人的状况都要坏于如果他们合作时的境况,这一惊人结果给现代社会科学造成了深远的影响。二、现实中的“囚徒困境” “囚犯困境“在各个领域里都有很多应用,也有力地解释了一些现象。下面,我们就看一下各领域里的“囚徒困境” 。 (一

4、)社会生活中的“囚徒困境” 公地悲剧。公地悲剧大概是说,当草地向牧民完全开放时,每一个牧民都想多养一头牛,因为多养一头牛增加的收益大于其购养成本,是有利润的。可是如果所有的牧民都看到这一点,都增加一头牛,那么草地将被过度放牧,从而不能满足牛的需要,导致所有牧民的牛都饿死。这个故事就是公共资源的悲剧。很多公共资源都存在这样的悲剧,就是每个人都是从利己的角度出发,追求各自的最大利益,结果给集体利益带来损害。像今天的环境污染,资源过度开采都是属于这种情况。 (二)经济领域中的“囚徒困境” 价格战。行业中的价格竞争是典型的“囚徒困境” 。比如可口可乐公司和百事可乐公司之间的竞争, 我们来构造两个公司价

5、格战的博弈模型。如果百事和可口可乐都均不促销,设此时收益为 0。若只有百事促销,设它能收益 4,而可口可乐为 -2,这是因为促销不仅能获得更多收益,还吸引了可口可乐消费者中对价格敏感的那部分人。同理,若只有可口可乐促销,则其收益为 4,而百事为 -2。但如果两家公司都促销,原先消费者基本不会改变自己的倾向,两家公司没有额外利润,并且还需要承担促销带来的利润损失,因此收益均为 -1。所以,无论百事选择什么策略,可口可乐肯定都会选择促销。这样一来,百事也就只能选择促销来应对。而尽管双方都知道这个选择并非最优,也必须仍会坚持选它,因为如果一家选择不促销而另一家促销,就会获益并且让对方承受更大的损失。

6、可口可乐公司和百事可乐公司在决策时都追求自身利益最大化, 结果是谁都无法实现最大利益。因此陷入了囚徒困境。 (三)政治领域中的“囚徒困境” 军备竞赛。在政治学中,两国之间的军备竞赛可以用囚徒困境来描述。以美苏争霸为例。假定每一方都有两种策略选择,一个是增加军备,另一个是削减武器,直至不设军备。这样,我们就可以写下美苏两家的争霸博弈。 如果双方都增加军备,则各花费 2 000 亿美元用于军费。不设军备,则军费为 0。如果美国裁军不设防,但是苏联扩军,在一个弱肉强食的世界上,苏联就可以任意欺侮和损害美国。这样,美国会受到很大损失,直至丧失主权,赢利为?。而苏联因为增加军备,耗费大量资金,不利于其他

7、经济社会事业的发展,所以他也是有损失的。假定纯赢利是 8 000亿美元。 通过这个博弈矩阵,我们可以看到,双方都增加军备是这个争霸博弈唯一的优势策略均衡,这就造成了实际上和囚徒困境一样的争霸博弈均衡:双方都扩军,双方都损失,直到后来苏联的经济被拖垮。 三、 “囚徒困境”的破解策略 破解“囚徒困境”最有效的手段就是合作。首先我们要先分析一下,为什么嫌疑犯双方没有选择合作一起抵赖,而是让坦白策略能成为纳什均衡解呢?其原因有三: 其一,参与者之间的博弈是一次性的。博弈各方都难以向对方实施可信的威胁,不怕对方的报复,所以,容易作出利己的选择。 其二,参与者缺乏有效的信息沟通。由于嫌疑犯双方是分别关在不

8、同的房间,所以,明知道(抵赖,抵赖)的策略组合能够达到利润总和的最大化, 但出于对对方的防范, 却不得不选择(坦白,坦白)的策略组合, 如果参与人之间能进行有效的信息沟通,是可以出现对各方都有利的结果的。 其三,参与者之间缺乏必要的信任。即使双方进行了沟通,但是如果每一方都对其他方选择抵赖策略不信任,合作也是难以形成,最终还是造成双方都选择坦白。 基于以上分析, “囚徒困境”的破解可以有如下策略: (一)进行无限次重复博弈,创建合作基础 重复博弈、是指同一个博弈被重复进行。在这样的博弈中,对于任何一个参与者的任何一次背叛都会招致对方在下一次博弈时的报复,这就使得当前的背叛相对于整个未来的接触过

9、程来说不是那么有诱惑力,所以,参与者会选择合作的策略。比如,在公共汽车上,两个陌生人会为一个坐位争吵,可如果他们认识,就会相互谦让,就是这个道理。再比如,同样的东西在你家门口的超市可能就物美价廉,而在旅游景点就价格翻好几番,也是因为你家门口超市你经常在那买东西,超市主人不会宰你,否则你就不会再去了,而旅游景点不一样是属于一锤子买卖,不宰白不宰。博弈专家已经用数学证明,在无限次重复博弈的情况下,合作可能是稳固的。因此,囚徒困境就有可能破解。 (二)进行信息沟通,协商促进合作 博弈各方可以进行有效的信息沟通来达成某种协议, 将你的问题、我的问题通过沟通变成是我们共同的问题,使博弈各方通过合作走出“

10、囚徒困境” ,从而实现双赢或多赢。这便将各方由原先的对立关系转化为合作关系。在这个过程中,将个体理性,逐渐向集体理性的方向调整。比如前面我们提到的可口可乐和百事可乐,如果经过有效的沟通达成了一个协议: 两家价格都定在某个相同的价格水平上,那么最后就不会出现两败俱伤的结果。 (三)借助外力增强信任,提高合作可靠性 囚徒困境中,并不是签订合作协议很困难,困难的是这个协议对博弈各方是否具有很强的约束力。博弈参与者都有作弊的动机,因为至少在作弊的这一局博弈中,作弊者可以得到更大的收益。 (没有约束的情况下,作弊是纳什均衡点)霍布斯对合作协议的观点是:“不带剑的契约不过是一纸空文。 ”所以,我们看前面讲

11、的玉寅生和三乌丛臣即便两人歃血盟誓,但最后都违背了誓言,就是这个原因。这时,必须引进外力,对不合作者进行惩罚,这样才能增强博弈各方之间的信任,从而使合作得以形成。 这种外力一方面可以是法律。如果一方违约,另一方有权罚款或做其他的处置。使任何一方选择背叛的话付出的代价会更大,在法律的强制力保障下,双方对彼此都能够信任,从而走向合作。所以,我们看为什么初次合作生意的双方,即便逃款或逃货他的收益最大,但都没有作弊,而是采取合作策略完成合同,就是因为有法律的约束。 另一种外力就是道德。与法律一样,道德也是对某些不合作行动的惩罚机制。自私自利、不道德的人会受到大家的鄙视和唾弃,没有人再愿意与他进行合作,甚至事后他自己也会受到良心的谴责。如果每个人都能意识到这个问题,社会上少数不道德的人和行为就会受到抑制,这样,道德就会促使人们走向合作,帮助人们走出囚徒困境。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。