1、博弈论与政治学应用林辉程S131920005一、博弈论简介二、策略式博弈 纳什均衡形式化建模求解(占优、最优回应)政治学应用三、扩展式博弈 子博弈精炼纳什均衡博弈树求解(逆向归纳)政治学应用四、小结一、关于博弈论博弈论( Game theory), 是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依赖、相互影响的决策行为及其结果的组合称为博弈 (Game)。博弈论简史 对于博弈论的研究开始于恩斯特 策梅洛( 1913)、埃米尔 博雷尔( 1921)及冯 诺伊曼( 1928),后来由冯 诺伊曼和奥斯卡 摩根斯坦( 1944, 1947)首次将其系统化和形式化
2、(参照 Myerson, 1991)。随后约翰 福布斯 纳什( 1950, 1951)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。约翰 福布斯 纳什、约翰 C海萨尼及莱因哈德 泽尔腾因为他们对博弈论的突出贡献而获得 1994年的瑞典银行经济学奖。罗伯特 J奥曼、肯 宾摩尔、戴维 克瑞普斯及阿里尔 鲁宾斯坦对于博弈论也做出重大贡献。博弈的构成要素 一个博弈一般由以下几个要素组成,包括:参与人、行动、信息、策略 、收益、均衡 等 。1、参与 人 指 的是博弈中选择行动以最大化自己效用的决策主体 (可以是个人,也可以是团体 );2、 行动 指 参与人在博弈进程中轮到自己选择时
3、所作的某个具体决策; 3、 策略 指 参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排 ;4、 信息 参与 人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识; 5、收益 参与 人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西;6、 均衡 所有 参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目的就是使用博弈规则来决定均衡。 博弈的分类行动次序信息 静态
4、 (策略式 ) 动态 (扩展式 )完全信息 纳什均衡 (纳什)子博弈精练纳什均衡(泽尔腾)不完全信息贝叶斯纳什均衡(海萨尼)精炼贝叶斯纳什均衡(泽尔腾等)二、策略式博弈和纳什均衡策略 式 ( normal form)表达 又 称为标准式表达,在这种表达中,所有参人同时选择自己的策略,所有参与人选择的策略一起决定每个参与人 的 收益 。一个策略式博弈包含以下要素:1. 参与人( players)2. 参与 人的策略( strategies)3. 收益 /效用( payoff/utility)(效用理论的简单介绍,买房子的选择 定性描述与定量描述的转化 今天天气很好 晴,气温,湿度,风速, pm2
5、.5;大多数人都喜欢上田老师的课 12位同学中的 10人都喜欢;收益函数、期望效用、效用最大化 Max 函数求导)情景的形式化表述(建模的过程)警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境和面临的选择:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判 10年徒刑;果两人都坦白认罪,则他们将被各判 8年监禁。问:两个罪犯会如何选择(即是坦白还是抵赖)? 囚
6、徒 B坦白 不坦白囚徒 A 坦白 8 , 8 0, 10不坦白 10 , 0 1 , 1求解策略式博弈的均衡解 (博弈的三种不同解):1. 占优策略与占优均衡 占优均衡:如果每一个参与人的策略都是占优策略,那么称这个策略的组合为占优策略均衡。 eg:囚徒博弈2. 迭代剔除劣势策略与占优均衡(略)3. 最优回应与纳什均衡最优回应与纳什均衡最优回应:一位参与者针对另一方的某个特定策略,选择能为自己带来最高收益的策略纳什均衡:如果每个参与人的策略都是对其他参与人策略的最优回应,那么各参与人的策略组合构成一个纳什均衡。Player 2N YPayer 1 N 0, 0 0, 10Y 10 , 0 5, 5