策略博弈习题部分解答.docx

上传人:h**** 文档编号:788105 上传时间:2018-11-01 格式:DOCX 页数:9 大小:189.94KB
下载 相关 举报
策略博弈习题部分解答.docx_第1页
第1页 / 共9页
策略博弈习题部分解答.docx_第2页
第2页 / 共9页
策略博弈习题部分解答.docx_第3页
第3页 / 共9页
策略博弈习题部分解答.docx_第4页
第4页 / 共9页
策略博弈习题部分解答.docx_第5页
第5页 / 共9页
点击查看更多>>
资源描述

1、博弈论与政治 第三小组作业第二章名词解释:1、理性行为(rational behavior):参与人精于算计并严格按照其最优策略行事。其中理性有两个重要的内涵:一个人对自己的利益完全了解,并能完美地计算出何种行动可以最大化其利益。2、不完美信息(imperfect information):在博弈的每一个行动时点上,参与人可能无法获悉决策所需的全部信息。这包括相关的外部环境比如天气的不确定性,以及对方先前或当前的行动。这类情况称为不完美信息。3、不完全信息(incomplete information):当一个参与人比另一个参与人了解更多信息时,阴谋诡计就会产生。这类情况称为不完全信息。4、合

2、作博弈(cooperative game):博弈论使用两个专门术语来区分协议具有强制力和不具有强制力的情况。若协议对参与人行为具有强制力,则称此类博弈为合作博弈。5、非合作博弈(noncooperate game):个体参与人可根据其利益采取行动,则称此类博弈为非合作博弈。第三章名词解释:1、中间评估函数(intermediate valuation function):赋予非终点结支付的规则被称为中间评估函数。2、先动优势(firstmover advantage):在博弈的过程中先做决策带来的优势。先动优势来自于将其自身置于一个优势地位以及迫使其他参与人接受它的承诺能力。后动优势(seco

3、nd-mover advantage):在博弈的过程中后做决策带来的优势。后动优势源于自己可对他人选择做出的灵活性。第四章名词解释:1、占优策略(dominant strategy)、劣策略(dominated strategy):每一个博弈中的参与者通常都拥有不止一个竞争策略,其所有策略的集合构成了该企业的策略集。在参与者各自的策略集中,如果存在一个与其他竞争对手可能采取的策略无关的最优选择,则称其为占优策略(Dominant Strategy),与之相对的其他策略则为劣势策略。占优策略是博弈论(game theory)中的专业术语,所谓的占优策略就是指无论竞争对手如何反应都属于本企业最佳选

4、择的竞争策略。2、占优可解(dominance solvable):在规模较大的博弈中,或许没有单个策略占优于其他所有的策略,但可能也存在一些策略劣于其他某些策略。如果参与人发现自己处于这样一种博弈中,他们可以通过将劣策略从可选策略中剔除的办法求得均衡。剔除劣策略缩小了博弈的规模,得到的“新”的博弈又可能出现对于同一个参与人或其他参与人而言的另外一些劣策略,进而又可以继续剔除这些劣策略;或者在“新”的博弈中,某个参与人存在占优策略。重复剔除劣策略的过程可以剔除劣策略或缩小博弈的规模,直到不能进一步剔除为止。如果这个过程最后只剩下一个唯一的结果,那么这个博弈就被称为占优可解。3、聚点(focal

5、 point):参与人得以成功协调所依赖的这种共同预期策略称为聚点。4、预期收敛(convergence of expectation):如果参与人在博弈中具备的共同认识,那么他们关于行动的预期会收敛到一个平衡点,即预期收敛。5、零和博弈(zero-sum game)在一些博弈中,博弈双方的利益是完全相对的。对参与人的每个策略组合而言,一个参与人的支付就是另一个人支付的相反数,我们称这种博弈为零和博弈。6、纳什均衡(Nash equilibrium)纳什均衡可以定义为这昂的一种策略组合:其中每个参与人的策略都是对其他人的策略的最优反应。或者有这样一个策略组合,每个参与人都选择了一个相应的策略,

6、并且具备如下性质:(1)每个参与人都对其他参与人的策略有正确的信念;(2) 给定每个参与人关于其他参与人策略的信念,自己所选择的策略是最优的。第五章名词解释:1、最优反应曲线(best-response curves):列出收益函数后,求导得到的函数所对应的曲线即为最优反应曲线。2、最优反应原则(best-response rule):最大化其支付的最优定价的集合就是最优反应原则。5. 第二章作业题1(a)这是一个博弈。因为不同口味的酸乳酪可能会给这些杂货店老板带来不同的收益。(b)这是一个博弈。因为如果这两个少女考虑到对方在舞会时要穿的衣服来选择自己要穿什么衣服才会让自己更加有利。比如避免出

7、现两个人穿同样衣服的情况出现。(c)这是一个决策。因为这位大学生在做出选择的时候不用考虑到他人的反应。(d)这是一个博弈。因为微软和网景公司在作出定价的时候都要考虑到对方的反应对自己的影响。(e)这是一个决策。因为这位州长候选人只需按照自己的意愿去选择自己的竞选搭档即可,不必考虑到其他人的反应对自己的决策带来的影响。4(a)预期支付=0.5*20+0.1*50+0.4*0=15(元)(b)预期支付=0.5*50+0.5*0=25(元)(c)预期支付=0.8*0+0.1*50+0.1*20=7(元)第三章作业题1解:(a)决策结:2 个终点结:6 个(b)决策结:3 个终点结:9 个(c)ABA

8、BB决策结:4 个终点结:8 个2解:(a)s 方向,即(1,0)(b)s-u 方向,即( 3,3,3,)(c)s-n-S-n-N 方向,即(4,5)4解:错,在序贯行动博弈中,先手不一定会获胜。因为在序贯行动博弈中,不单会有先动优势,使得对手被迫做出次一级的选择;同时也存在后动优势,即可以依据别人的选择做出相应的反应,具有灵活性。比如,如果猜拳变成序贯行动博弈的话,那么,一定是后动的人有绝对优势。5解:有博弈树得到均衡点为(3,3) ,即波音公司采用和平竞争,而空中客车参与竞争。A7此题为必胜策略题:先手占优势,只要先手第一轮出“1” ,之后每轮保证与对方说的之和为11即可获胜;后手在先手未

9、说“1 ”时,与对方说的凑成 12,然后之后每轮与对方凑成11即可获胜。7. 第四章作业题1,这句话不对,因为虽然某个参与人有一个占优策略,但是在这个占优策略的前提下,另外一个参与人可能会做出不同的选择,使得有占优策略的人不能得到对他来说最好的结果。例如下面的这个博弈过程(教材75页)联邦储备银行低利率 高利率预算平衡 3,4 1,3国会预算赤字 4,1 2,2我们来分析这个博弈中的占优策略:如果联邦储备银行认为国会会选择“预算平衡”,那么它自己则会选择“低利率”(因为这样它可以得到支付4而不是支付3);但如果它认为国会会选择“预算赤字”,则它选择“高利率”将会更好些(这样可以得到支付2而不是

10、支付1)。由此可见,联邦储备银行不存在占优策略,而国会却有占优策略。如果国会认为联邦储备银行会选择“低利率”,国会最优选择是“预算赤字”而不是“预算平衡”;如果国会认为联邦储备银行会选择“高利率”,它的最优选择仍是“预算赤字”而不是“预算平衡”。因此,“预算赤字”是国会的占优策略。但是这个博弈的平衡点式国会选择“预算赤字”而联邦储备银行选择“高利率”;并不是对国会的最好结果,这是因为当国会选择“预算赤字”这个最优策略的时候,联邦储备银行可以预见到它的这一选择,从而选择“高利率”。2.(a)列左 右上 1 4 Min=1行下 2 3 Min=2Max=2 Max=3 (2,2)根据占优策略原则,

11、对于“列“,“左”是占优策略,而当“列”选择“左”的时候,行会选择“下”,纳什平衡点是(Max,Min)=(2,2)。根据最大最小值也可以验证,如上面的表格。(b)列左 右上 1 2 Min=1行下 4 3 Min=3Max=4 Max=3 (3,3)根据占优策略原则,对于“行”,占优策略是“下”,而当“行”选择“下”的时候,列会选择“右”,所以纳什平衡点是(Max,Min)=(3,3)。根据最大最小值也可以验证,如上面的表格。(c)根据最大最小值方法,这个博弈有两个纳什平衡点。如上图所示。3,(a)列左 右上 2,4 1,0行下 6,5 4,2“行”的占优策略是选择“下”,当“行”选择“下”

12、的时候,“列”会选择“左”来得到更多的支付,纳什平衡点是(6,5)(b)列左 右上 1,1 0,1行下 1,0 1,1 “行”的占优策略是选择“下”,当“行”选择“下”的时候,“列”会选择“右”来得到更多的支付,纳什平衡点是右下方的(1,1);同样“列”的占优策略是选择“右”,当“列”选择“右”的时候,“行”会选择“下”来得到更多的支付,纳什平衡点是右下方的(1,1)(c)列左 中 右上 0,1 9,0 2,3直 5,9 7,3 1,7行下 7,5 10,10 3,5对于“行”,最优策略是“下”,当“行”选择“下”的时候,“列”会选择“中”来获得最大的支付。(10,10)为纳什平衡点,表格中红

13、色的部分表示被划掉过。或者用逐格检查的方法也可以实现。(d)列左 中 右上 5 3 1 Min=1直 6 2 1 Min=1行下 1 0 0 Min=0Max=6 Max=3 Max=1 (1,1)列西 中 东北 2,3 8,2 10,6上 3,0 4,5 6,4下 5,4 6,1 2,5行南 4,5 2,3 5,2此题采用逐格检查法,(10,6)为纳什平衡点。5列左 中 右上 1,2 2,1 1,0水平 0,5 1,2 7,4行下 -1,1 3,0 3,2此题采用逐格检查法,(1,2)为纳什均衡点。寻找过程,对于“列”在每一行中划掉对“列”来说支付最小的 两个策略组合,对于“行”在每一列中划

14、掉对“行”来说支付最小的两个策略。最后看哪个策略组合没有被划掉过,就是纳什平衡点。因为支付最大的组合并不一定是纳什均衡点所在的地方,这个博弈中(1,2)是平衡点,但是这个平衡点对应的不是支付最大的点,所以要使用参与人的策略而不知识均衡时的支付来描述均衡。4.7表格如图所示:红色的字和数字对应所获利益,此处默认快乐和时间的单位相同且有等价值。帮助 不帮帮助 2,2 2,3不帮 3,2 0,0此时没有nash均衡点,A帮助时B会选择不帮,而A不帮时B会帮助。但是由于同时决策,所以没有均衡点。4.11 A 不买时:其中按A,B,C排列B C 0元票 15元票 30元票0元票 0,0,0 0,0,15

15、 0,0,015元票 0,15,0 0,0,0 0,-15,030元票 0,0,0, 0,0,-15 0,-15,-15A买 15元票时:B C 0元票 15元票 30元票0元票 15,0,0 0,0,0 -15,0,015元票 0,0,0 -5,-5,-5 -15,-15,030元票 -15,0,0 -15,0,-15 -15,-15,-15A买30元票时:B C 0元票 15元票 30元票0元票 0,0,0 0,0,-15 -15,0,-1515元票 0,-15,0 0,-15,-15 -15,-15,-1530元票 -15,-15,0 -15,-15,-15 -20,-20,-20其中经

16、过简单的连续删除分析(由于其实两人对称),可知其中的考虑B,C两人时的均衡点为红字所示!而对于A来说没有重合的,所以没有nash均衡点。第五章第 2 题=442+;.=442+泽维尔每周的利润: =(8)=(8)(442+)为使 最大,可让 对 求导数,使得导数值为 0;BxxP即:=0dP=(442+)2(8)=4+60=0为泽维尔的最优反应规则。4+60伊冯娜每周的利润: )24)(6)6( PxyPyQyB为使 最大,可让 对 求导数,使得导数值为 0;By即:;0)6(2)4(yPxdP;056y这就是伊冯娜的最优反应规则。解出交点即为纳什平衡点:Px=19.73Py=18.93(b)泽维尔的最优反应曲线没有变化,而伊冯娜的最优反应曲线产生变化,伊冯娜的最优反应曲线向下移动了一个单位。产生这种变化的原因是伊冯娜通过重新安排工作和裁掉一些员工将服务每个顾客的成本降低到了 6美元。所以伊冯娜的最优反应曲线方程产生了变化。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 参考答案

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。