1、1一、问题:(与自己记忆中的有很多不同)1。将上述事件用得益矩阵表示出来。 (10 分)2分析该博弈的均衡结果,并指出纳什均衡的性质。 (10 分)3若该程序重复进行 3 次,每次陈强和王立都看到上次的结果再进行下一次的选择,分析博弈的结果。 (10 分)1、如图2、通过划线法可求出该博弈的纳什均衡解为(不买,不买)双方的均衡得益分别为 2000、2000。该均衡为占优策略均衡采用逆推归纳法,第 3 次,双方间的博弈如图所示,纳什均衡为(不买,不买)均衡得益为(2000,2000) ,第 2 次双方的博弈变为纳什均衡的解为(不买,不买)均衡得益为(4000,4000) 。第 1 次,双方间的博
2、弈如图纳什均衡的解为(不买,不买) ,均衡得益为(6000,6000)二、一个工人给一老板干活,工资标准是 100 元。工人可以选择是否偷懒,老板则选择是否王立买 不买买 2600,2600 1700,3500陈强不买 3500,1700 2000,2000老板买 不买买 2600,2600 1700,3500陈强不买 3500,1700 2000,2000老板买 不买买 4600,4600 3700,5500陈强不买 5500,3700 4000,4000老板买 不买买 6600,6600 5700,7500陈强不买 7500,3700 6000,60002克扣工资。假设工人不偷懒有相当于
3、50 元的负效用,老板想克扣工资则总有借口扣掉 60 元工资,工人不偷懒老板有 150 元产出,而工人偷懒时老板只有 80 元产出,但老板在支付工资之前无法知道实际产出,这些情况时双方都知道的。问题:(不明白为什么是这样的得益)1。如果老板完全能够看出工人是否偷懒,用相应的形式表示该博弈并分析该博弈的均衡结果2如果老板无法看出工人是否偷懒,用相应的形式表示该博弈并分析该博弈的均衡结果。说明该均衡是什么均衡?1 为动态博弈,用扩展性表示为用逆推归纳法:第二阶段情况一 偷懒老板扣钱得益 40不扣钱得益-20老板扣钱情况二 不偷懒老板扣钱得益 110不扣钱得益 50老板扣钱第一阶段:工人偷懒得益 4
4、0不偷懒得益-10工人偷懒该博弈的 SPNE 为工人偷懒,老板扣钱均衡路径为第一阶段工人偷懒,第二阶段老板扣钱均衡得益为工人 40,老板 40。 2 为静态博弈,用得益矩阵表示分析如图纳什均衡的策略为(偷懒,扣工资)均衡得益为(40,40)由于偷懒是工人的占优策略,扣工资是老板的占优策略,所以该纳什均衡是占优策略均衡三、封面故事博弈:以下得益矩阵所示的一系列两人博弈模型说明了时代杂志和新闻周刊之间的对抗。每个杂志的战略包括选择封面故事:“弹劾”或“金融危机” 。 “弹劾”是个好封面故事,在不同版本的博弈中,各方得益不同。第一版本:时代杂志和新闻周刊地位相当新闻周刊弹劾 金融危机弹劾时代杂志金融
5、危机工人偷懒 不偷懒老板 老板扣 不扣 扣 不扣(40,40) (100,-20) (-10,110) (50,50)老板扣 不扣偷懒 40,40 100,-20工人不偷懒 10,110 50,5035 ,35 70 ,3030 , 70 15 ,153第二版本:时代杂志比新闻周刊更流行新闻周刊弹劾 金融危机弹劾时代杂志 死了金融危机第三版本:一些读者两本杂志都买新闻周刊弹劾 金融危机弹劾时代杂志金融危机问题:1。分析两博弈方在以上三个版本的博弈中是否有占优策略,若有,占优策略是什么?2分析以上三个版本博弈的所有纳什均衡(包括混合策略纳什均衡) ,并指出哪些版本的哪些纳什均衡同时是占优策略均衡
6、。 版本一:新闻周刊弹劾 金融危机弹劾时代杂志金融危机博弈双方均具有占优策略:弹劾本博弈的纳什均衡解为(弹劾,弹劾)均衡得益为(35,35)该纳什均衡同时是占优策略均衡版本二:新闻周刊弹劾 金融危机弹劾时代杂志 死了金融危机时代杂志具有占优策略:弹劾博弈的纳什均衡解为(弹劾,金融危机)均衡得益为(70,30)版本三:新闻周刊42 , 28 70 ,3030 , 70 18 , 1240 , 30 70 ,5050 , 70 30 , 2035 ,35 70 ,3030 , 70 15 ,1542 , 28 70 ,3030 , 70 18 , 124弹劾 金融危机弹劾时代杂志金融危机博弈双方均
7、不存在占优策略博弈有两个纯策略的纳什均衡解和一个混合策略纳什均衡解纯策略的纳什均衡解分别为(弹劾,金融危机) (金融危机,弹劾)对应的均衡得益分别为(70,50) (50,70)混合策略的纳什均衡为时代杂志以(5/7,2/7)的概率随机地选择弹劾,金融危机策略新闻周刊以(4/5,1/5)的概率随机选择弹劾,金融危机策略均衡的期望得益分别为(46,41.42) 。四、纳斯和贝克是两家生产麦片的厂家,两家企业均瞄准了河北经贸大学市场,通过市场调查获知大学内学生的消费口味就为两种:脆麦片和甜麦片。限于技术限制,一家企业只能生产一种口味的麦片,若两家企业生产同一种口味的麦片,则由于竞争太激烈,每家企业
8、将遭受 5 万元的亏损,若两家企业分别生产不同的口味,则生产脆麦片的企业将获得 10 万元的利润,而生产甜麦片的企业将获得 20 万元的利润。问题:1.若两家企业同时在年初决定自己产品的口味,将以上博弈用适当的形式表示,分析该博弈的所有纳什均衡,并求达到均衡时两家企业的得益各为多少?2.若由纳斯先决定口味,贝克企业在获知纳斯企业的生产决策后再决定自己的口味,用适当的博弈形式表示该博弈,分析该博弈的均衡。1.该博弈为静态博弈,形式如图纯策略的纳什均衡为(脆,甜)及(甜,脆)均衡的得益分别为(10,20) (20,10)混合策略的纳什均衡为纳斯以(3/8,5/8)的概率随机选择(脆,甜)策略贝克以
9、(3/8,5/8)的概率随机选择(脆,甜)策略均衡的期望得益为(35/8,35/8)2.该博弈为动态博弈,扩展形如图采用逆推归纳法分析第二阶段:贝克决策情况一 20-5 决策甜情况二,10-5 决策脆第一阶段:纳斯决策2010,决策甜该博弈的 SPNE 为纳斯选甜,贝克选脆均衡路径为第一阶段纳斯决策甜,第二阶段贝克决策脆。博弈结束均衡的得益为(20,10)贝克脆 甜脆 -5,-5 10, 20纳斯甜 20,10 -5,-540 , 30 70 ,5050 , 70 30 , 20纳斯脆 甜贝克 贝克脆 甜 脆 甜(-5,-5) (10,20) (20,10) (-5,-5)5五、波音和空中客车
10、正在决策开发和生产一种新的商用飞机,各厂商最终得益部分取决于对方怎么做。若两家厂商同时生产,则各遭受 10 亿美元的亏损,若只有一家生产,则生产厂商获得100 亿美元的利润,而不生产厂家既不获利也不亏损,若两家厂商都不生产,则两家厂商均为不获利不亏损状况。问题:1。用得益矩阵表示以上博弈,分析该博弈所有的纳什均衡(包括混合策略纳什均衡)及均衡时博弈方的得益。2若欧盟对外宣布将对空中客车开发生产新飞机进行补贴,补贴金额为 20 亿美元,分析波音和空中客车的博弈均衡策略,此时是否有哪家厂商存在严格上策?均衡是否为严格上策均衡?1纯策略的纳什均衡为(生产,不生产) (不生产,生产)均衡得益为(100
11、,0) (0,100)混合策略的纳什均衡为波音以(10/11,1/11)概率随机地选择(生产,不生产) ;空中客车以(10/11,1/11)的概率随机选择(生产,不生产)博弈的均衡期望得益为(0,0)2. 补贴后博弈的矩阵为纳什均衡变为(不生产,生产)空中客车存在占优策略:生产各博弈方的均衡得益为:(0,120)该纳什均衡不是上策均衡,因为波音公司在该博弈中不存在占优策略六、两家计算机厂商宏软和微基正计划推出用于办公室信息管理的网络系统。各厂商都既可以开发一种高速、高质量的系统(H) ,也可以开发一种低速、低质量的系统(L) 。市场研究表明各厂商在不同策略下相应的利润由如下第一矩阵表示:微基H
12、 LH 宏软L问题:1 如果两个厂商同时行动,结果将如何,请找出该博弈所有的纳什均衡策略组合(包括混合策略纳什均衡的策略组合)?是否存在帕累托上策均衡或风险上策均衡?2 假设宏软先行动,微基在看到宏软的选择后再决策,结果会是怎样?请用相应的形式表示此博弈,并分析。3 如果微基先制定计划并行动,宏软看到微基的行动后再决策,结果又是如何?用相应的形式表示此博弈,并分析。30 , 30 50 ,3540 , 60 20 , 20空中客车生产 不生产生产 -10,-10 100, 0波音不生产 0,100 0 , 0空中客车生产 不生产生产 -10,10 100, 0波音不生产 0,120 0 , 0
13、64 据此判断是博弈中先行动的厂商是否具有先动优势?如果先行动的厂商必须交纳一笔费用来获取先行动的特权(如通过组织研发团队加班加点定制研发计划)宏软愿支付的最高费用是多少?微基愿支付的最高费用呢?1两个纯策略的纳什均衡:宏软和微基的策略组合为(L,H)(H,L)均衡得益为(40,60)及(50,35)混合策略的纳什均衡为宏软以(8/9,109)的概率随机选择(H,L)微基以(3/4,1/4)的概率随机选择(H,L)均衡的期望的已分别为(35,33.33)不存在帕累托上策均衡,亦不存在风险上策均衡2、扩展形如图采用逆推归纳法分析第二阶段:微基选择情况一:3035 ,微基将采用 L 策略情况二:6
14、020,微基将采用 H 策略第一阶段:宏软选择5040,宏软将采用 H 策略SPNE 为宏软采用 H 策略,微基采用 L 策略,双方得益为(50,35)均衡路径为:第一阶段宏软选择 H,第二阶段微基选择 L 策略,博弈结束。3、扩展形如图;逆推归纳法分析第二阶段:宏软选择情况一:3040,选 L情况二:5020,选 H第一阶段:微基选择6035,选 HSPNE:微基选 H 宏软选 L 双方得益为(60,40)均衡路径为第一阶段微基选 H 策略,第二阶段宏软选 L 策略。4、根据上述分析此博弈中博弈方具有先动优势,若先动的博弈须交纳一定的费用,宏软最多愿意支付 10,危及最多愿意支付 15七、巧
15、克力市场上有两个厂商,各自都可以选择区市场的高端还是低端,相应的利润如下表所示的得益矩阵:厂商 2低 高低 厂商 1高问题:1。找出本博弈所有的纳什均衡,并分析纳什均衡的性质。-20 , -30 900 ,600100 ,800 50 , 50微基H LH 30 ,30 50 , 35宏软L 40 ,60 20 , 20宏软H L微基 微基H L H L(30,30) (50,35) (40,60) (20,20)微基H L宏软 宏软H L H L(30,30) (60,40) (35,50) (20,20)72两厂商能进行合作吗?若能,哪个厂商从合作中得到的好处最多?哪个厂商要说服另一个厂商
16、合作至少需要给另一个厂商多少好处?1、分析如图:纯策略的纳什均衡(低,高) ;(高,低)均衡得益(900,600) (100,600)混合策略的纳什均衡厂商 1 以概率(25/28,3/28)随机选择(低,高)厂商 2 亿概率(85/97,12/97)随机选择(低,高)均衡的期望得益为(9381,11856)既非帕累托上策均衡又非风险上策均衡2、能合作,厂商 1 选低,厂商 2 选高, (低,高)厂商 1 得到的好处多,为说服厂商 2 合作,厂商 1 至少得给厂商 2 的好处为 200八、你是一种相同商品的双寡头生产商之一。你和你的竞争者都有零边际成本。市场的需求曲线为:P=30Q 式中,Q=
17、q 1+q2;q 1是你的产量,q 2是你的竞争对手的产量。问题:1。设你们只进行这个博弈一次。如果你和你的竞争对手必须同时宣布你们的产量,你会选择生产多少?你期望的利润为多少?2假设你被告知你必须在你的竞争对手之前宣布你的产量。在这种情况下你会生产多少,你认为你的竞争对手会生产多少?你预计你的利润是多少?先宣布是一种优势还是一种劣势?为了得到先宣布或后宣布的选择权,你至多愿意付出多少?1、静态博弈利润函数: iiii qqCQp)(30)()( 21得到厂商 1 和厂商 2 的反映函数各为30q21解方程组得: 021qp1022、动态博弈第二阶段,对手在看到我方的产量后决策自己的产量,以使
18、利润最大化 2122 )(30)()( qqCQp厂商 2 的反映函数为 2厂商 2低 高低 -20 ,-30 900 ,600厂商 1高 100,800 50 , 508第一阶段,与其到第二阶段对手的产量反应,我方决策自己的产量,以使利润最大化 11112112 )25()230()(30)()( qqqqCQp 15q由此推出 5.72.6.1573021p先宣布是一种优势,为此,愿付出 12.5九、以下是一讨价还价博弈。A 首先行动,提供给 B 一个关于 100 元的分配方案,对此,B 可以接受也可以拒绝。如果他拒绝 A 的方案,钱的总额将降至 90 元,再由他提供这笔钱的分配方案。如果
19、 A 拒绝此方案,钱的总额将降至 80 元,再由 A 提供一分配方案。如果 B 再次拒绝,钱的总额将降至 0 元。A 和 B 都是理性的,拥有完全信息,并且追求得益最大化。 (假设得益相同时,博弈方偏好尽早成交)问题:1。用扩展形将该博弈表示出来。2用逆推归纳法分析此博弈的 SPNE,均衡路径及均衡得益(假设得益相同时博弈方愿尽早获得分配的份额)1、如图2、第四阶段:B 决策如果 80(1-S)0,B 将同意则 A 提出的 S=1 时,B 将同意第三阶段,A 决策如果 90S280S,A 将同意 B 在上一阶段的提议则 B 提出的 S2=8/9,A 将同意第二阶段:B 决策如果 100(1-S
20、1) 90(1-S2)=10 时,B 同意 A在第一阶段提出的分配方案第一阶段 A 提出分配方案S1=9/10SPNE: A 在第一阶段提出 9/10:1/10 的分配比例第三阶段同意,B 在第二阶段同意,第四阶段同意均衡路径:第一阶段 A 提出 9/10:1/10 的分配比例,第二阶段 B 同意,博弈结束,均衡的一各自为 A90,B10。十、选取你身边的发生的事件或你听说的事件,将其做成博弈模型(静态或动态) ,给出博弈方、策略、次序及得益,并利用所学知识分析结果十一、注意!你心仪的女孩(男孩)就坐在你前两排的左边那个座位答题,你已经犹豫了 20A提出 S1:1-S1B同意 拒绝,提出 S2
21、:1-S2(100S1,100(1-S1) A同意 拒绝,提出,S:1-S(90S2,90(1-S2) B同意 拒绝(0,0)(80S,80(1-S))9分钟:待博弈考试结束后是否要向她(他)表白爱慕之情。当然了,如果你向她(他)表白了你的真情,她(他)可能接受,也可能拒绝。看,考试就要结束了,快将你在几种可能出现的状态的心理感受数量化(你的得益) ,同时也推测她(他)在这几种状态的心理感受的数量值(她/他的得益),建立博弈模型分析分析考试结束后你的最佳选择及将达到的均衡结果。十二、两兄弟分一块冰激凌。哥哥先提出一个分割比例,弟弟可以接受或拒绝,接受则按哥哥的提议分割,若拒绝就自己提出一个比例
22、。但这时冰激凌已化得只剩 1/2 了。对弟弟提议的比例哥哥也可以选择接受或拒绝,若接受则按弟弟的提议分割,若拒绝冰激凌会全部化光。 (因兄弟之间不应该做损人不利己的事,因此假设接受和拒绝利益相同时兄弟俩都会接受) 。问题:1 用扩展形表示该博弈 (5 分)2 分析并求出该博弈的子博弈完美纳什均衡 (15 分)1、如图2、逆推归纳法第三阶段 哥哥决策当 1/2*S20 时,哥哥同意则弟弟在上一阶段提出的分配方案为S2=0第二阶段 弟弟决策当 1-S11/2 时,弟弟同意则哥哥在上一阶段提出的方案满足1-S1=1/2,即 S1=1/2第一阶段哥哥决策哥哥提出 S1=1/2SPNE 哥哥在第一阶段提
23、出 1/2:1/2,在第三阶段同意;弟弟在第二阶段同意均衡路径为第一阶段,哥哥提出按 1/2:1/2 分配,第二阶段,弟弟同意,博弈结束均衡得益:(1/2,1/2)十三、美国和日本必须同时决定对高清晰度电视的研究是投入高费用还是低费用,下面得益矩阵表示了每个国家的收益日本低 高低美国高问题: 在此博弈中是否有严格上策战略?该博弈的纳什均衡是什么?(10 分)分析:此博弈中美国存在严格上策:低纳什均衡为(低,高)均衡得益是(2,4)4 , 3 2 , 43 , 2 1 , 1哥提出 S1:1-S1弟同意 拒绝,提出 S2:1-S2(S1, (1-S1) A 哥同意 拒绝(1/2*S2,1/2*(
24、1-S2) (0,0) 日本低 高低 4 ,3 2 ,4美国高 3 ,2 1 ,110十四、甲方是某国的一股企图对抗中央的地方势力,乙方是该国的中央政府,丙方是支持甲方的某种国际势力。三方之间互动制约的利益关系可用下列扩展形博弈表示。问题:1。该博弈的均衡是什么?2如何对得益数字作最小程度的改动,分别使(A)甲方选择对抗,乙方选择软弱;(B)甲方选择对抗,乙方选择强硬,丙方选择行动。1、逆推归纳法第三阶段:丙方决策因为-2-1,故而选择不行动第二阶段 乙方决策因为 1-1,故而选择强硬第一阶段,甲方决策因为-2-1 故而选择不对抗SPNE 甲方不对抗,乙方强硬,丙方不行动均衡路径:第一阶段甲方不对抗,博弈结束,各方的均衡得益为(-1,1,0)2、分析(1) 第三阶段-2-1,丙方选择不行动第二阶段当 1x 时,乙方选择软弱第一阶段,10 甲方选择对抗由此推出秩序变动软弱策略下的乙方的得益,使之大于 1 即可(2)第三阶段,当 z-1 时,丙方选择行动第二阶段,当 y-1 时,乙方选择强硬第一阶段,当 x-1 时,甲方选择对抗甲对抗 不对抗乙 (-1,1,0)强硬 软弱丙 (1,-1,1)行动 不行动(-1,-2 ,-2 ) (-2,1,-1)甲对抗 不对抗乙 (-1,1,0)强硬 软弱丙 (1,-1,1)行动 不行动(-1,-2 ,-2 ) (-2,1,-1)