ImageVerifierCode 换一换
格式:DOC , 页数:11 ,大小:74.50KB ,
资源ID:1453604      下载积分:10 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-1453604.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(博弈论经典例子.doc)为本站会员(99****p)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

博弈论经典例子.doc

1、笔记博弈论经典例子的思考摘要:博弈论就是关于在包含相互依存情况中的理性行为的研究,是研究对策现象中各方是否存在最合理的行动方案,以及如何找到合理的行动方案的理论和方法。本文分析思考了博弈论的两个典型例子,也对博弈价格战提出了自己的看法,希望能带给大家一些启发。关键词:纳什均衡 非合作博弈 无限博弈田忌赛马战国时期,齐王和大将田忌赛马,双方各出三匹 马各赛一局。各方的马根据好坏分别称为上马、中马、下马。田忌的马比齐王同一级的马差但比齐王低一级的马好一些。若用同一级马比赛,田忌必然连输三局。每局的赌注为 1 千金,田忌要输 3 千金。田忌的谋士建议田忌在赛前先探听齐王赛马的出场次序,然后用自己的下

2、马对齐王的上马,用中马对齐王的下马,用上马对齐王的中马。结果负一局胜两局赢得 1 千金。但若事先并不知道对方马的出场次序,双方应取何种策略?双方采用的赛马出场次序安排及相应的结果(齐王赢的千金数)可由下表所示列出。 齐王田忌上中下 上下中 中上下 中下上 下中上 下上中上中下 3 1 1 1 1 1上下中 1 3 1 1 1 1中上下 1 1 3 1 1 1中下上 1 1 1 3 1 1下中上 1 1 1 1 3 1下上中 1 1 1 1 1 3由图可知,田忌赢的概率只有六分之一,孙膑只是掌握了齐王的思维定势侥幸赢了一把,在一把定胜负的时候管用,当试验的机会增多,田忌就输了。如果赛马的规则发生

3、变化,每个人要将自己的马严格的划分等级,上等马速度必须比中等马快,中等马必须比下等马快,且比赛时同等级的马才可以比赛的话,那么田忌就只有输的份了。孙膑只是一时抓住了规则的某些漏洞耍了些小聪明才取得一盘的胜利,我们只对他的小聪明淡然一笑罢了。博弈根据不同的游戏规则会产生与之相适应的策略。囚徒的困境有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话

4、:检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们 1 年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,你将无罪释放,但你的同伙要被判 10 年刑。如果你拒不坦白,而被同伙检举,那么你就将被判 10 年刑,他无罪释放。但是,如果你们两人都坦白交代,那么,你们都要被判 8 年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判1 年。但是由于两人处于隔离的情况下无法串供,所以,按照亚当斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到无罪释放,但前提是同伙抵赖,显然要

5、比自己抵赖要坐 10 年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐 10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判 8 年,总比被判 10 年好。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判 1 年刑)就不会出现。这样两人都选择坦白的策略以及因此被判 8年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者

6、)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要延长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时问的监禁的结果。有理由相信现实生活当中不是冤家不聚头。结果第二次,第三次这两个囚徒又被抓到一起。有了第一次教训之后他们会在接下来的审讯里做何选择呢?这就是有限次重复的“囚徒的困境“ 。博弈论里有一种倒推法来解决这个问题。假设这个例子只重复 5

7、次,因为在狱中渡过太多的岁月之后他们都老到做不动坏事了。我们先看第 5 次他们会怎么选。显然第 5 次的面临的选择和第 1 次是一模一样的,因此没有理由相信这两个囚徒会在第 5 次审讯里合作。如果第 5 次不合作,为什么他们会在第 4 次合作呢?如此倒推,有限次重复的“囚徒的困境“ 和一次的结果没有任何不同,即双双坦白,入狱 8 年。如果把这种体验无限延长,或至少是他们俩知道肯定还有这种事,只是不知道什么时候才能停止这种把戏,这就是无限次重复的“囚徒的困境“ ,让我们再来看看这会不会有不同。因为无限博弈不存在最后一次,倒推法不再适用。假设一个人在监狱里呆久了会适应这种环境变得油滑。因此第一个

8、8 年最长,后来再进去的 8 年变得只有象 6 年一样长,再后来是 4 年 .。因此这里引入一个表示监狱生活适应性指数的符号“&“,0&1。这个 &值越大表明对监狱生活越难适应,前一个 8 年和后一个 8 年差不多一样漫长。如果&越小则表示这个囚犯对环境适应很快,后来呆上 8 年都没什么感觉了。对于一个经常被判 8 年的人来说,他的受惩罚实际感受的总量是:(-8)+&(-8)+&(-8)+.。易知,如果 0&1,则 1+&+&+&+.的极限值是 1/(1-&)。假设这两个囚徒选择这样一种战略:最开始选择抵赖,然后一直选择抵赖直到另一方选择了坦白,然后就永远选择坦白。这样的话其中任一个囚徒选择永

9、远抵赖的总收益是:(-1)+&(-1)+&(-1)+.=(-1)/1-&。如果其中某一次他选择了坦白,则那一次他将获无罪释放,之后对方将用永远坦白来惩罚他,他们俩都一直被判 8 年。因此总收益是:0+&(-8)+& &(-8)+.=(-8&)/(1-&)。如果要使某次坦白对其中一个囚犯有利,显然需要其中坦白一次这种选择所带来的收益(-8&)/(1-&) 大于等于一直互相合作抵赖所带来的总收益(-1)/1-&,也就是&=1/8 的情况下( 即某人实在认为狱中岁月妙不可言,判得久对他来说无所谓,& 值极低)才会有人选择中途坦白,否则在无限次重复的“囚徒的困境“ 当中他们都会选择一直抵赖以使自己能尽

10、量减少在监狱中渡过时光。因此在无限次重复的“囚徒的困境“ 中最后的结果和一次或是有限次完全不同。在很大概率上囚徒会选择合作而不是各自为战。也就是说,在长期的双方关系中任何短视的行为都是得不偿失的。这个结果可以用来说明为什么我们的传统文化里强调人与人的关系“ 以和为贵“。数千年来中国一直是农业国家,农业人口缚系于土地,乡间邻里相对固定。因此人们彼此之间的很多利益冲突可以用无限次重复的囚徒困境来描述。也就是说如果某次利益是通过冲突而不是合作解决,那么失利的一方必然会设法报复,而且这种对立的情绪很有可能在后辈中延续,也就是无限次被重复,结果必然是双方都得不偿失。此所谓“冤冤相报何时了“!我的看法是:

11、现实中囚徒要考虑更多的因素,即使他们合谋决定合作,他们商量好都抵赖,但是真正面对警察的审讯时,他们又会考虑对放是否会出卖自己,他们有可能会继续出卖对方。但是人都有报复心理的,如果一方违背了约定,虽然能很快出狱,但是若干年后呢,那位囚徒刑满释放后会放过他吗?考虑到若干年后的情况,两个囚徒也许会都选择抵赖。如果惩罚和奖赏的度发生改变:两人都坦白的话,则均判刑 1 年;A 坦白 B 抵赖,则 A 无罪释放, B 判刑 5 年;两人都抵赖的话,则均判刑 3 个月,这样的情况下,两个囚徒会做怎样的选择呢?这样两个囚徒都选择坦白的可能性比较大,毕竟一年的时间比较短,不必为了 3 个月的刑而冒坐牢 5 年的

12、风险。这里涉及到了风险收益不对称问题,湖北省的一些官员,明明知道某些问题存在,却坐视不理,很大的原因就是风险收益不对称,不治理问题不会太大,治理好了奖励表彰也不怎么样,治理差了要受到责怪,于是湖北就有些落后,原因就是湖北的官太聪明了。总之,囚徒的困境涉及到的问题众多,不仅仅是心理与智力的较量,游戏规则的指定对结果产生的影响是比较明显的。而现实中我们要考虑的相关因素会更多,博弈论只有与我们已经掌握的情况充分的结合才能得出比较满意的策略。博弈价格战现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会

13、“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润、如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。

14、另一个极端的情况是厂商用正常的价格,双方都可以获得利润:从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么 WTO 和各国政府要加强反垄断的意义所在。我对博弈价格战的看法是:

15、各个公司的实力是不一样的,一些国际上知名的家电厂商,和国内厂商一样采取低价战略,同样低价的情况下,老百姓当然愿意选择国际知名的大公司的产品,因为国际知名大公司的产品有档次,质量也不会比国内的差。虽然说厂家都会亏本,但是国际大公司资金雄厚,他亏本几年甚至十几年都亏得起,国内一些脆弱的公司亏本几个月或者一年就倒下了,一家家国内家电厂商退出后,国际大公司形成垄断,适当提高价格,不久就会把以前亏损的钱弥补回来,也许还会赚得更多。但是当一些普通品牌家电厂商采取低价策略的时候,一些名牌家电厂商会采取提价的策略,也许一些经济能力差点的消费者会买相对便宜的普通品牌家电,但是有能力买名牌家电的人会觉得名牌家电不

16、降价是因为质量好,所以尽管名牌家电提价后仍然获得了丰厚的利润,同时在中国这个社会,攀比非常严重,人们的思维定势是便宜没好货,在中国,少数消费者目前处于盲目消费阶段,不管多贵的东西都有人买,商家不愁卖不出去,。所以说,商家不管是采取提价还是降价都是可取的,但是要结合当时的情况,还有就是厂家的目的到底是为了立竿见影还是在几年后的翻盘。结语博弈渗透到生活的各个方面,实际情况往往比理论复杂得多,不按常理出牌也许会收到意想不到的效果,只有知己知彼才能做出最正确的决策。参考文献1、施锡铨著博弈论上海:上海财经大学出版社,20002 刘加福新管理博弈学中国纺织出版社,20053 张维迎博弈论与信息经济学上海

17、人民出版社,19964 谢识予经济博弈论石家庄:复旦大学出版社,2002http:/www.1zhao.org/viewthread.php?tid=105717博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。下面介绍几个关于博弈论的例子:1。智猪博弈这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落

18、下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。 “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数

19、量和踏板与投食口之间的距离。 如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。 如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。 对于游戏规则的设

20、计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。 对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”

21、现象,就要看游戏规则的核心指标设置是否合适了。 比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈” 增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了-就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三-减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。 许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。股市

22、上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深谙“智猪博弈”指标改变的个中道理。 2囚徒困境在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoners dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷 A 和 B 联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有

23、罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑 8 年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑 2 年,而坦白者有功被减刑 8 年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱 1 年。 我们来看看这个博弈可预测的均衡是什么。对 A 来说,尽管他不知道 B 作何选择,但他知道无论 B 选择什么,他选择“坦白”总是最优的。显然,根据对称性,B 也会选择“坦白”,结果是两人都被判刑 8 年。但是,倘若他们都选择“抵赖”,每人只被判刑 1年。(抵赖、抵赖)是最优的,因为偏离这个行动选择组合的任何其他行动

24、选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。3笨蜗居Ross 和 Rachel 是一对情侣,暗地里都有过不忠的行为。但他们并不想分开,而是希望能继续生活在一起,于是不得不面对一个问题:是否应该向对方坦白自己的不忠行为?对于 Ross 来说,他有两个战略,“坦白”或者“隐瞒”。如果他向 Rachel 坦白自己的过错,Rachel 作为“清白”的一方(Ross 并不知道 Rachel 的不忠行为,当 Rachel 选择“隐瞒”)将在二人关系中占据心理优势,从而使得 Ross 处于弱势状态。如果他决定隐瞒,则将背负良心上的谴责

25、。这个博弈是对称的,因此对于 Rachel 来说同样存在这样的两难抉择。我们引入经济学的收益概念来衡量博弈中战略的优劣,设收益上限为 10 分。如果 Rachel选择“隐瞒”而 Ross 选择“坦白”的话,Rachel 将占据“我是清白的”的心理优势,从而获得 9 的收益,而劣势一方的 Ross 的收益只有 5。反过来对 Ross 来说也是一样。如果两人都不约而同地选择“坦白”,虽然彼此都会感到被背叛的痛苦,但是能够将心比己地互相原谅,二人的收益都是 8。如果两人都选择“隐瞒”,他们之间感情得以维系的信任基础已经在事实上消失了,对双方来说都是非常大的损失,收益都只有 6。下表列出了四种情况下双

26、方的收益,Rachel 在前。Ross坦白 隐瞒坦白 8 , 8 5 , 9 Rachel 隐瞒 9 , 5 6 , 6直观地说,肥皂剧观众和经济学家们最愿意看到的结果自然是双方都坦承错误并互相原谅,这样可以使这部肥皂剧更加吸引人并且使双方收益之和最大。但博弈论给出的结论却正好相反。从表中可以看出,在 Rachel 选择“坦白”的情况下,Ross 选择“隐瞒”的收益大于选择“坦白”的收益;在 Rachel 选择“隐瞒”的情况下,Ross 选择“隐瞒”的收益也大于选择“坦白”的收益。因此,“隐瞒”对于 Ross 来说是一个占优战略,无论对方做出什么选择,这个战略都可以保证他的收益最大。作为一个理

27、性的人(这是博弈论的基本假设),Ross 必然会选择“隐瞒”。同样,Rachel 也会选择“隐瞒”。于是,博弈的结果就是双方都选择“隐瞒”,各得到 6 收益。 这是个稳定的纳什均衡,虽然结果出乎意料:博弈双方都选择了使自己利益最大化的战略,却得到了最差的收益(总收益是四种方案中最低的)。而观众所期待的“彼此坦白”的情况下,任何一方都可以通过改变策略而获得更大的收益,比如 Ross 由“坦白”转向“隐瞒”可以使自己的收益由 8 上升到 9。因此它是一个不稳定解,必须依靠某种外界约束才能存在。我们设想 Ross 和 Rachel 之间达成某种形式的协议,承诺对对方的不忠行为既往不咎。在这个约束条件

28、下“彼此坦白”的解能够稳定存在,这就是合作解。这是个典型的社会两难问题。各自从自身利益出发的博弈双方会自然而然地达到稳定的纳什均衡,但这往往导致最坏的收益。如果双方能建立有约束力的协议,则可以形成合作解,从而获得最好的收益。http:/ ,就是引入博弈论的概念和方法改造经济学的思维,推进经济学的研究。诺贝尔经济学奖授予包括美国普林斯顿大学的纳什博士在内的 3 位博弈论专家,可以看作是一个标志,这自然也激发了人们了解博弈论的热情。博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具。博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡,也就是说,当一个主体的选择受到其他主

29、体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。 “囚徒困境“囚徒困境“是博弈论里最经典的例子之一。讲的是两个嫌疑犯(和)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严“,如果两人都坦白则各判年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判年;如

30、果都不坦白则因证据不足各判年。在这个例子里,博弈的参加者就是两个嫌疑犯和,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:和均坦白或均不坦白、坦白不坦白或者坦白不坦白,是博弈的结果。和均坦白是这个博弈的纳什均衡。这是因为,假定选择坦白的话,最好是选择坦白,因为坦白判年而抵赖却要判十年;假定选择抵赖的话,最好还是选择坦白,因为坦白判不被判刑而抵赖确要被判刑年。即是说,不管坦白或抵赖,的最佳选择都是坦白。反过来,同样地,不管是坦白还是抵赖,的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑年。在(坦白、坦白)这个组合中,和都不能通过单方面的改变行动增加自己的收

31、益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果和都选择抵赖,各判刑年,显然比都选择坦白各判刑年好得多。当然,和可以在被警察抓到之前订立一个“攻守同盟“,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。 实证分析:“囚犯困境“在经济学上有很多应用,也有力地解释了一些经济现象。 一电信价格竞争根据我国电信业的实际情况,我们来构造电信业价格战的博弈模型。假设此博弈的参加者为电信运营商 A 与 B, 他们在电信某一领域展开竞争,一开始的价格都是 P0。A(中国电信)是老牌企业,实力雄厚,占据了绝大多数的市场份额;B(中国联通

32、)则刚刚成立不久,翅膀还没有长硬,是政府为了打破垄断鼓励竞争而筹建起来的。正因为 B 是政府扶植起来鼓励竞争的,所以 B 得到了政府的一些优惠,其中就有 B 的价格可以比 P0 低 10。这一举动,还不会对 A 产生多大的影响,因为 A 的根基实在是太牢固了。在这样的市场分配下,A、B 可以达到平衡,但由于 B 在价格方面的优势,市场份额逐步壮大,到了一定程度,对 A 造成了影响。这时候,A 该怎么做?不妨假定: A 降价而 B 维持,则 A 获利 15,B 损失 5,整体获利 10; A 维持且 B 也维持,则 A 获利 5,B 获利 10,整体获利 15; A 维持而 B 降价,则 A 损

33、失 10,B 获利 15,整体获利 5; A 降价且 B 也降价,则 A 损失 5,B 损失 5,整体损失 10。 从 A 角度看,显然降价要比维持好,降价至少可以保证比 B 好,在概率均等的情况下,A 降价的收益为 15505505,维持的收益为 550105025,为了自身利益的最大化,A 就不可避免地选择了降价。从 B 角度看,效果也一样,降价同样比维持好,其降价收益为 5,维持收益为 25 ,它也同样会选择降价。在这轮博弈中, A、B 都将降价作为策略,因此各损失 5,整体损失 10,整体收益是最差的。这就是此博弈最终所出现的纳什均衡。我们构造的这一电信业价格战博弈模型是典型的囚徒困境

34、现象,各个局部都寻求利益的最大化,而整体利益却不是最优,甚至是最差。许多其他行业的价格竞争都是典型的囚徒困境现象,如可口可乐公司和百事可乐公司之间的竞争、各大航空公司之间的价格竞争等等。二OPEC 组织成员国之间的合作与背叛“囚徒困境“ 告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不到实现。上述我们在对电信价格竞争的博弈分析中,只是一次性的 “囚徒困境“博弈,因此得到了互相降价的纳什均衡。而在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,“合作 “都是一种

35、随处可见的现象。比如中东石油输出国组织( 简称)的成立,本身就是要限制各石油生产国的产量,以保持石油价格,以便获取利润,是合作的产物。OPEC 之所以能够成立,各组织成员国之间之所以能够合作,是因为囚徒困境如果是一次性博弈(One shot game)的话,基于个人利益最大化,得到纳什均衡解,但如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的“大众定理“(Folk Theorem)的含义。 但合作的可能性不是必然性。博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)

36、必须主动通过可信的承诺(Credible commitment) ,向另一方表示合作的善意,努力把这个善意表达清楚,并传达出去。如果该困境同时涉及多个对手,则要在博弈对手中形成声誉,并用心地维护这个声誉。这里“可信的承诺“ 是一个很牵强的翻译,“Credible commitment“并不是什么空口诺言,而是实实在在的付出。所以合作是非常困难的。 所以 OPEC 组织经常会有成员国不遵守组织的协定,私自增加石油产量。每个成员国都这样想,只要他们不增加产量,我增加一点点产量对价格没什么影响,结果每个国家都增加产量,造成石油价格下跌,大家的利润都受到损失。当然,一些产量增加较少的国家损失更多,于是

37、也更加大量生产,造成价格进一步下降-结果,陷入一个困境:大家都增加产量,价格下跌,大家再增加产量,价格再下跌.。理论上,几乎所有的卡特尔都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳什均衡,没有成员有兴趣遵守。那么是不是不可能有卡特尔合作成功了?理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的。但只要是有限次的合作,合作就不会成功。比如合作次,那么在第九次博弈参与人就会采取不合作态度,因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你合作了。但是大家料到第九次会出现不合作,那么就很可能在第八次就采取不合作的态度。第八次不合作会使大家在第七次就不合作.

38、一直到,从第一次开始大家都不会采取合作态度。以上是运用博弈论中的经典案例“囚徒困境“ 对现实经济生活的一些简单的理论上的分析,虽然在现实生活当中影响人们决策和态度的因素很多,但是,博弈论作为现代经济学的前沿领域,始终是一个强有力的分析工具。http:/ 对夫妇。在这个村里已经形成了约定俗成的规定。如果女人发现自己的丈夫对自己不忠的话,就会毫不犹豫地将他杀死,而且就在当天执行。当然,她必须有确切的证据来证明她丈夫不忠。由于这个因素,某个女人发现某个男人不忠,她不会将之告诉那个不忠男人的妻子。但是,她会告诉其他人的妻子,并且女人们会相互传递这一信息,因此最后,一个男人不忠,除了其妻子不知道外,其他女人都知道。而事实上是,村子里的这 100 对夫妇的男人都不忠,但由于女人不会将她知道的事实告诉不忠男人的妻子,每个女人都不知道自己的男人不忠。因此,该村子一直很稳定,而没有发生妻子杀死丈夫的行为。村子里有一个辈份很高的老太太,她德高望重,诚实可敬。每个人都向她汇报村里的情况,因此她对村里的情况了如指掌,她知道每个男人都不忠,当然,其他女人不知道她所知道的。一天,这位老人对这 100 个女人说了一句很平常的话: “你们的男人当中至少有一个是不忠的。”于是,村里发生了这样一个事情:前 99 天,村里风平浪静,但到了第 100 天,

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。