1、课件,何为博弈?,If a group of hunters set out to take a stag, they are fully aware that they would all have to remain faithfully at their posts in order to succeed; but if a hare happens to pass near one of them, there can be no doubt that he pursued it without qualm, and that once he had caught his prey,
2、he cared very little whether or not he had made his companions miss theirs.Rousseau,博弈与博弈论,Game: a physical or mental competition conducted according to rules with the participants in direct opposition to each other.Merriam-Webster References,博,大通也。说文。,弈,围棋,通“奕”。,博弈,饱食终日,无所用心,难矣哉。不有博弈者乎?为之尤贤乎己! 论语阳货
3、篇,博弈:是对理性的参与人在策略相互依存情况下的行为所进行的正规的描述。,博弈论:是研究决策主体的行为发生相互作用时的决策以及相对应的均衡问题的经济学理论。,博弈与博弈论,为什么要学习博弈论?是经济学理论发展的自然延伸是学习经济学前沿理论的重要工具是从事科研工作的思维方式之一是理解制度、文化等非传统经济学问题的有效途径,1994年 约翰福布斯纳什 (John F. Nash Jr.) 美国人 (1928-2015 ) 约翰海萨尼 (John C. Harsanyi) 美国人 (1920- ) 莱因哈德泽尔腾 (Reinhard Selten) 德国人( 1930- ) 这三位数学家在非合作博弈
4、的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。,1996年 詹姆斯莫里斯 (James A. Mirrlees) 英国人(1936- )。主要著作: 关于福利经济学、信息和不确定性的笔记 道德风险理论与不可观测行为 组织内激励和权威的最优结构 威廉维克瑞 (William Vickrey) 美国人 (1914-1996) 维克瑞在信息经济学、激励理论、博弈论等方面都做出了重大贡献。,2001年 乔治阿克尔洛夫 (George A. Akerlof) 生于1940年,美国加州大学伯克莱分校迈克尔斯宾塞 (A. Michael Spence) 生于1943年,美国加州斯坦福
5、大学约瑟夫斯蒂格利茨 (Joseph E. Stiglitz) 生于1943年,美国纽约哥伦比亚大学为不对称信息市场的一般理论奠定了基石。他们的理论迅速得到了应用,从传统的农业市场到现代的金融市场。他们的贡献来自于现代信息经济学的核心部分,2004年 芬恩基德兰德 (Finn E. Kydland) 卡内基梅隆大学和加利福尼亚圣巴巴拉分校爱德华普雷斯科特 (Edward C. Prescott) 亚利桑那州立大学凯瑞(W.P. Carey) 商学院他们一是通过对宏观经济政策运用中“时间一致性难题”的分析研究,为经济政策特别是货币政策的实际有效运用提供了思路;二是在对商业周期的研究中,通过对引起
6、商业周期波动的各种因素和各因素间相互关系的分析,使人们对于这一现象的认识更加深入。,2005年 托马斯克罗姆比谢林 (Thomas Crombie Schelling),1921年生于美国。哈佛大学博士。现任马里兰大学教授。 罗伯特约翰奥曼(Robert John Aumann),1930年生于德国。麻省理工学院博士。耶路撒冷希伯来大学教授。 通过博弈论分析促进了对冲突与合作的理解。,2007年 埃里克马斯金 (Eric S. Maskin) 普林斯顿高等研究院社会科学部主任。他在现代经济学最为基础的领域里做出了卓越的贡献,其中包括公共选择理论、博弈论、激励理论与信息理论以及机制设计。被誉当今
7、国际经济学最受尊敬的经济学大师。 罗杰迈尔森(Roger B. Myerson) 1951年3月29日生于美国波士顿,美国国籍。1976年获得哈佛大学应用数学博士学位,其博士课题为“一种合作博弈理论(A Theory of Cooperative Games)”,对博弈论有深入的研究。著有博弈论:矛盾冲突分析(Game Theory: Analysis of Conflict)及经济决策的概率模型(Probability Models for Economic Decisions)。 莱昂尼德赫维奇(Leonid Hurwicz) 美国科学院院士,美国经济学会院士,总统奖获得者。最重要的研究工
8、作是开创了经济机制设计理论。他曾于1990年由于“对现代分散分配机制的先锋性研究”获得美国国家科学奖。,2009年 埃莉诺奥斯特罗姆(Elinor Ostrom)是印第安那大学政治学系阿瑟本特利讲座教授。她对制度分析理论、集体行动理论、可持续发展、公共资源等领域的研究在全世界范围内产生了很大的影响,并因而获得了众多的荣誉。她的获奖理由是对经济治理(economic governance )的研究,特别是在公共选择方面的研究,奥斯特姆的研究证明了用户组织(user associations)如何成功管理公共财产。规则、博弈与公共池塘资源共同合作集体行为、公共资源与实践中的多元方法民主的意义及民主
9、制度的脆弱性 ,2012年 埃尔文罗斯(Alvin Roth)与罗伊德沙普利(Lloyd Shapley)。,2014年 让梯若尔(Jean Tirole),因在“对市场力量和监管的分析”方面的贡献而获奖。,为什么要学习博弈论?,在博弈论中,优超战略均衡(Dominant Strategy Equilibrium)总是纳什均衡么?纳什均衡总是优超战略均衡么?,北京大学1996年研究生入学考试试题,考虑Spence的signal模型。市场上有高能力和低能力两类工人,高能力工人的生产效率为2,低能力的为1;且高能力工人接受y年教育的成本 y/2,低能力工人接受y年教育的成本 y。假设雇主可使工人的
10、效用达到最低限为零,雇主不能观察能力的大小,只能认为每个工人为高能力的概率为1/2。如果受教育程度可观察,求信号的分离均衡和混同均衡。,北京大学2005年研究生入学考试试题,请用博弈论思想简述中国为什么要加入世界贸易组织?,对外经贸大学2002年研究生入学考试试题,寡头垄断市场上有一种决策方式被称为“准竞争”(quasi-competitive),其含义是市场上所有的寡头垄断企业都模仿完全竞争厂商的行为模式,使生产的边际成本(MC)等于市场价格 (P)。假定市场上有n个相同的卖方垄断生产厂商,他们所面对的反需求函数为P=a-b(q1+ +qn),其成本为Ci=cqi 。求: (1)古诺均衡解
11、; (2)确定准均衡解; (3)当n时,古诺解是否收敛于准竞争解?,中国人民大学2004年研究生入学考试试题,为什么要学习博弈论?,主父欲伐中山,使李疵观之。李疵曰:“可伐也!君弗攻,恐后天下。”主父曰:“何以?”对曰:“中山之君所倾盖与车(古人乘车与人交谈,必须倾斜车盖),而朝穷闾(l)隘巷之士者,七十家。”主父日:“是贤君也,安可伐?”李疵曰:“不然。举士,则民务名不存本;朝贤,则耕者惰而战士懦。若此不亡者,未之有也。”,教材选择,课程内容设置,一、博弈论的基本理论 完全信息静态博弈 完全信息动态博弈 重复博弈 演化博弈 合作博弈论简介 不完全信息静态博弈 不完全信息动态博弈二、信息经济学
12、初步三、制度经济学的博弈研究,学习过程中的注意事项,一、注重理解和思考二、一定要做一定数量的习题三、超越符号四、把握各种定义公式背后的含义,学习方法,重要!,博学之,少看课件;审问之,突破常识;慎思之,由浅入深;明辨之,碰撞思想;笃行之,笔耕不辍。,第1章 博弈基本构成要素与表示方法,本 章 导 引,第1节 博弈的基本构成要素,参与人、行动、信息、策略、支付和均衡。,第2节 博弈的展开式表示,第3节 博弈的标准式表示,博弈树:结点、枝、信息集。,策略与支付矩阵。,第1节 博弈基本构成要素,案例:开发商A欲开发一栋新的写字楼,他面临着两方面的不确定性。一是房地产市场的需求存在不确定性,对写字楼的
13、需求可能很高的需求也可能很低;另一方面,存在另外一个开发商B也有可能开发类似的写字楼。所以可能出现的结果有以下八种:,需求旺盛,A开发,B放弃,则A的利润为8000万,B的利润为0; B开发,则A的利润为4000万,B的利润为4000万; A放弃,B开发,则A的利润为0,B的利润为8000万; B放弃,则A的利润为0,B的利润为0;需求萎靡,A开发,B放弃,则A的利润为1000万,B的利润为0; B开发,则A的利润为-3000万,B的利润为-3000万; A放弃,B开发,则A的利润为0,B的利润为1000万; B放弃,则A的利润为0,B的利润为0;,一、参与人(player),参与人是搏弈中的
14、决策主体,其目的是使自己的效用最大化。,界定:,参与人必须有可供选择的行动和很好定义的效用函数。,限制:,“自然” (nature)作为“虚拟参与人” (pseudo-player)在博弈中出现。自然可以理解为决定外生随机变量概率分布的机制。,特例:,符号:,i=1, 2, n代表参与人;N或0代表“自然”。,第1节 博弈基本构成要素,二、行动(action or move),行动是参与人在某个时点时的决策变量。,界定:,ai表示参与人的某一个行动;,符号:,Ai=ai表示可供参与人i选择的所有行动的集合,或称行动空间;,a=(a1, a2, an)表示n个参与人行动的有序集,称为“行动组合”
15、(action profile);,行动顺序(the order of play)很重要,注意:,第1节 博弈基本构成要素,三、信息(information),信息是参与人拥有的有关博弈的知识。尤其是与(1)“自然”的选择, (2)其他参与人的特征以及(3)行动的知识。,界定:,如果在一个二人博弈中,一个事实F能够满足如下条件,那么它就是一个“共同知识”(common knowledge):,注意:,(1)参与人1和2知道F;,(2)参与人1和2知道“参与人1和2知道F”;,(3)参与人1和2知道“参与人1和2知道参与人1和2知道F”;,第1节 博弈基本构成要素,黔无驴,有好事者船载以入。至则
16、无可用,放之山下。虎见之,庞然大物也,以为神,蔽林间窥之。稍出近之,慭(yn)慭然,莫相知。/他日,驴一鸣,虎大骇,远遁;以为且噬己也,甚恐。然往来视之,觉无异能者;益习其声,又近出前后,终不敢搏。/稍近益狎,荡倚冲冒。驴不胜怒,蹄之。虎因喜,计之曰,“技止此耳!”因跳踉大,断其喉,尽其肉,乃去。,参与人的特征往往是与其行为紧密相关的。,注意:,黔 之 驴,四、策略或战略(strategy),策略是参与人的一个完备(complete)的相机(contingent)决策规则。,界定:,符号:,si表示参与人的某一个策略;,Si=si表示所有可供参与人i选择的策略的集合;,s=(s1, si, s
17、n)是一个n维向量,被称为“策略组合”(action profile);,s-i=(s1, si-1, si+1, sn)表示策略组合s中除了i之外的其他人的选择。因此s也可以写作s=(si , s-i),第1节 博弈基本构成要素,五、支付(payoff),支付是指在一个特定的策略组合下得到的效用水平。,界定:,符号:,ui=ui (s)=ui (s1, si , sn)表示参与人i从策略组合s中所获得的支付(效用),第1节 博弈基本构成要素,第2节 博弈的展开式表示,第2节 博弈的展开式表示,博弈树的构成,GIRL,BOY,B,G,G,S,F,S,F,S,F,55,21,55,12,G,S,
18、F,S,F,S,F,B,G,55,21,55,12,第2节 博弈的展开式表示,案例:开发商A欲开发一栋新的写字楼,他面临着两方面的不确定性。一是房地产市场的需求存在不确定性,对写字楼的需求可能很高的需求也可能很低;另一方面,存在另外一个开发商B也有可能开发类似的写字楼。所以可能出现的结果有以下八种:,第2节 博弈的展开式表示,需求旺盛,A开发,B放弃,则A的利润为8000万,B的利润为0; B开发,则A的利润为4000万,B的利润为4000万; A放弃,B开发,则A的利润为0,B的利润为8000万; B放弃,则A的利润为0,B的利润为0;需求萎靡,A开发,B放弃,则A的利润为1000万,B的利
19、润为0; B开发,则A的利润为-3000万,B的利润为-3000万; A放弃,B开发,则A的利润为0,B的利润为1000万; B放弃,则A的利润为0,B的利润为0;,A,开发,放弃,N,大,1/2,小,1/2,B,开发,放弃,44,80,开发,放弃,-3-3,10,B,第2节 博弈的展开式表示,A,开发,放弃,N,大,1/2,小,1/2,B,放弃,44,80,开发,放弃,-3-3,10,B,B,B,开发,自然的行动无法观察到的情况,第2节 博弈的展开式表示,A,开发,放弃,N,大,1/2,小,1/2,B,放弃,44,80,开发,放弃,-3-3,10,B,B,B,开发,参与人A的行动无法观察到的
20、情况,第2节 博弈的展开式表示,第2节 博弈的展开式表示,练习:要挟诉讼参与人:一个原告(P)和一个被告(D)博弃顺序: (1)原告决定是否指控被告,指控的成本是c; (2)原告提出一个无协商余地的赔偿金额 s 0以私了; (3)被告决定接受或拒绝原告的要求; (4)如果被告拒绝原告的要求,原告将决定是放弃还是上法庭,自己的成本是p,给被告带来的成本是d; (5)如果告上法庭,原告以q的概率胜诉而获得赔偿x,(1-q)的概率什么也得不到。,第2节 博弈的展开式表示,练习:离婚的博弈博弈描述:琼斯夫人正准备与琼斯先生离婚。他们婚前的协议约定,如果她能证明琼斯先生有过外遇就能得到10万美元,反之则
21、只能得到5万美元。她的律师只有雇用私人侦探,才可能证明她丈夫有外遇。雇用私人侦探的费用为1万美元,包含在律师费中。琼斯夫人有两个选择:不管诉讼案结果如何都付给她的律师2万美元,或者支付诉讼收入的1/3。律师只有在有利可图的情况下才会雇用私人侦探。,第2节 博弈的展开式表示,练习:市场入侵博弈描述:某种产品目前由唯一的一家企业 I 进行垄断经营。现在另外一家企业E1企图进入这个市场。 E1可以选择单独进入这个市场;也可以考虑与另外一家企业E2联合进入这个市场。 E2拥有某种可以大大降低E1成本的技术,但是E2本身不能单独进入这个市场。如果E1向E2发出联合的邀请,而E2接受了邀请,那么两家企业就
22、联合进入这个市场;而如果E2拒绝,那么E1还是需要考虑是否单独进入这个市场。对于企业 I 而言,他能够发现有新的企业进入这个市场,但是却无法确定进入这个市场的企业究竟是单独的一家企业还是两家企业的联合。他必须在容忍对方的存在和与之进行斗争之间进行选择。,第2节 博弈的展开式表示,练习:消耗战(War of Attrition)博弈描述:考虑这样一个两阶段消耗战。在博弈的每个阶段,每个参与者都可以选择战斗(F)和退出(Q) 。每个阶段的战略都是同时制定的。在第1个阶段,如果参与者都退出,他们平分150,每人得到75。如果一个战斗另一个退出,战斗者得100,退出者得50。 如果他们都选择战斗,博弈
23、进入第2阶段,此时总收益最多为90,因为第1阶段的冲突耗费了一些资源。在第2阶段,如果他们还都选择战斗,进一步的冲突将收益减少为每人得到10。如果一人战斗一人退出,则战斗者得55,退出者得15。,A,开发,放弃,N,大,1/2,小,1/2,B,放弃,44,80,开发,放弃,-3-3,10,开发,N,小,大,1/2,1/2,放弃,开发,放弃,08,00,01,00,B,B,B,开发,对信息集的限定,贷款开发,00,第2节 博弈的展开式表示,不满足“完美回忆”(Perfect Recall)要求的情形,1,2,1,U,D,L,R,L,R,N,1,2,U,D,U,D,L,R,L,R,1,第2节 博弈
24、的展开式表示,第3节 博弈的标准式表示,第3节 博弈的标准式(策略式)表示,一、策略,A,U,第3节 博弈的标准式(策略式)表示,以z表示某一个终点结,以Z表示所有终点结的集合,则一个博弈的展开式可以表示为:,而一个博弈的标准式可以表示为:,第3节 博弈的标准式(策略式)表示,第二章完全信息静态博弈,由NordriDesign提供,本 章 导 引,第1节 从占优到纳什均衡,从占优关系出发,定义纳什均衡,第3节 纳什均衡定义2与存在性定理,第4节 应用举例,利用最优反应理解并求解纳什均衡,第2节 混合策略与混合策略纳什均衡,引入随机选择,第2节 混合策略与混合策略纳什均衡,第1节从占优到纳什均衡
25、,第1节 从占优到纳什均衡,一、囚徒难题,囚徒难题的启示:,1.个体理性与集体理性存在冲突;,2.“搭便车”(free rider)的行为的危害;,3.“损人利己”并不是一个好的策略。,为什么要加入WTO?,第1节 从占优到纳什均衡,第1节 从占优到纳什均衡,如果参与人i的一个策略si是一个严格劣策略(strictly dominated strategy),那么必然存在策略si使得以下关系成立:,此时,我们可以说si严格占优si 。,二、严格占优关系 (Dominance),如果参与人i的一个策略 si 是一个严格占优策略(strictly dominant strategy),那么必然有以
26、下关系成立:,第1节 从占优到纳什均衡,二、严格占优关系 (Dominance),如果一个策略严格占优每一个sisiSi,那么si是一个严格占优策略。,第1节 从占优到纳什均衡,三、重复剔除严格劣战略,第1节 从占优到纳什均衡,三、重复剔除严格劣战略,第1节 从占优到纳什均衡,三、重复剔除严格劣战略,第1节 从占优到纳什均衡,三、重复剔除严格劣战略,缺陷: 1.需要假定“所有人都是理性的”是共同知识; 2.对于某些问题的讨论并无助益。其实这也是博弈专家们提出纳什均衡概念的原因。,四、弱占优关系,如果参与人i的一个策略si是一个弱劣策略(weakly dominated strategy),那么
27、必然有si使得以下关系成立:,并且保证存在s-i使得严格不等式关系成立。,这种情况下我们称si弱占优si。,如果参与人i的一个策略si是弱优策略(weakly dominant strategy),那么弱占优每一个siSi。,第1节 从占优到纳什均衡,第1节 从占优到纳什均衡,四、弱占优关系,第1节 从占优到纳什均衡,BRMC,四、弱占优关系,第1节 从占优到纳什均衡,CML,四、弱占优关系,第1节 从占优到纳什均衡,五、最优反应(Best Response),如果参与人i的一个策略si是一个s-i的一个最优反应,那么对于所有的siSi,必然有以下关系成立:,定义bi : S-iSi为参与人i
28、的最优反应映射,则bi满足:,第1节 从占优到纳什均衡,五、最优反应(Best Response),第1节 从占优到纳什均衡,六、纳什均衡(Nash Equilibrium),纳什均衡定义1:如果策略组合s*=(s*1, ,s*n)是一个纳什均衡,那么必然有以下关系成立:,问题:如果存在si,使得ui(si,s*-i)=ui(s*i, s*-i)成立,那么si是一个纳什均衡策略么?,第1节 从占优到纳什均衡,六、纳什均衡(Nash Equilibrium),第1节 从占优到纳什均衡,纳什均衡体现了以下几个方面的含义:参与人各自独立地追求自身利益;单独偏离没有意义;纳什均衡是所有参与人共同的信念
29、;纳什均衡具有“自实施”(self-enforcing)的性质。,六、纳什均衡(Nash Equilibrium),第1节 从占优到纳什均衡,六、纳什均衡(Nash Equilibrium),第1节 从占优到纳什均衡,纳什均衡定义2:如果策略组合s*=(s*1, ,s*n)是一个纳什均衡,那么必然有以下关系成立:,问题:在一个用支付矩阵表示的搏弈中,用画线法找出的一定是纳什均衡么?为什么?,六、纳什均衡(Nash Equilibrium),第1节 从占优到纳什均衡,练习1:一群赌徒围成一圈赌博,每个人将自己的钱放在边上(每个人只知道自己有多少钱),突然一阵风吹来将所有的钱混在一起,使得他们无法
30、分辨哪些钱是属于自己的,他们为此发生了争执,最后请来一位律师。律师宣布这样的规则,每个人将自己的钱数写在纸上,然后将纸条交给律师,如果所有人要求的钱数加总不大于已有钱的总数,每个人得到自己要求的那部分,剩余部分归律师;如果所有人要求的钱加总大于已有钱的总数,则所有的钱归律师所有。写出这个博弈每个参与人的战略空间与支付函数,求出所有的纳什均衡。(假设钱的总数为M,M为共同知识)。,第1节 从占优到纳什均衡,一般性假定: (1)两个或多个厂商生产完全无差异的某种产品; (2)市场的逆需求函数为: ; (3)企业 i 的成本 ,因此企业 i 的利润函数为:,七、古诺模型,第1节 从占优到纳什均衡,对
31、于任一家企业而言,利润最大化意味着如下的最优化问题:,企业 i 利润最大化的一阶条件为:,七、古诺模型,第1节 从占优到纳什均衡,七、古诺模型,第1节 从占优到纳什均衡,假定: (1)两个厂商生产无差异的产品,企业的成本函数也完全相同; (2)市场需求函数为: (3)假定市场竞争的形势极为激烈,如果一家厂商的价格高于另外一家,则失却全部市场;反之亦然; (4)假定每个厂商的边际成本都是c,且无固定成本,两个厂商都只在价格不小于边际成本时才进行生产;如果价格相同,则平分市场份额。,八、伯川德(Bertrand)模型,第1节 从占优到纳什均衡,伯川德悖论:如果两个厂商经营同样的产品,且成本相同,则
32、二者之间的价格竞争必然使每家企业都按照边际成本定价,因而只能获取正常利润;从长期来看,低成本的企业将驱逐高成本的企业。 伯川德悖论不能广泛存在的原因: (1)埃奇沃思(Edgeworth):由于企业的生产能力有限,所以高成本的企业也可以得到一部分市场份额; (2)博弈时序; (3)产品差异:现实中的产品不是完全相互替代的。,八、伯川德(Bertrand)模型,有产品差异的伯川德模型: (1)两家企业生产有差异可互相替代的同类产品。假定消费者对每家企业的需求函数为: (2)两家企业的生产均为固定成本,且边际成本均为c。,八、伯川德(Bertrand)模型,第1节 从占优到纳什均衡,假定:两个商店
33、产品无差异,但是由于地理分布不同对消费者而言成本不同。 (1)城市为线性,消费者均匀分布,密度为1,消费者具有单位需求; (2)两家商店分别坐落在城市的两端,提供单位商品的成本为c; (3)消费者的移动需要花费成本,单位成本为t; (4)假定消费者从消费商品中所获得效用为S,且S足够大,使得每个消费者都需要1单位商品,但是也仅仅需要1单位商品。,九、霍特林(Hotelling)价格竞争模型(v1),第1节 从占优到纳什均衡,假定:两个商店产品无差异,但是由于地理分布不同对消费者而言成本不同。 (1)城市为线性,消费者均匀分布,密度为1,消费者具有单位需求; (2)两家商店的位置分别是a和1-b
34、,不失一般性地,我们假定1-a-b0,提供单位商品的成本为c; (3)消费者的移动需要花费成本,单位成本为td2; (4)假定消费者从消费商品中所获得效用为S,且S足够大,使得每个消费者都需要1单位商品。,九、霍特林(Hotelling)价格竞争模型(v2),第1节 从占优到纳什均衡,九、霍特林(Hotelling)价格竞争模型(v2),第1节 从占优到纳什均衡,练习:如果在一条一千米长的长街上均匀居住着许多居民,有两个人同时想在该长街开便利店。 (1)如果假设所有居民都是到最近的便利店购买商品,间这两个人会如何选择店面位置? (2)如果每户居民仍然到离得最近的便利店购买,但购买数量与他们到便
35、利店的距离有关,如Q=1-D,其中Q是购买量,D是居民与便利店的距离,此时两个人会怎样选择店面的位置?,九、霍特林(Hotelling)价格竞争模型:其他,第1节 从占优到纳什均衡,练习:设某个地方的居民均匀地环绕一个圆形湖居住。两个小贩来此地推销商品。 (1)如果居民都选择离自己较近的小贩购买商品,问小贩选择推销地点博弈的纳什均衡是什么? (2)如果有三个小贩同时到此地推销商品,那么推销地点博弈的纳什均衡又是什么? (3)如果圆形湖的周长是1(千米),而居民的购买量是它们与小贩距离的函数Q=1-D,其中Q是购买量,D是居民与小贩推销点距离,则两个和三个小贩博弈的纳什均衡各是什么?,九、霍特林
36、(Hotelling)价格竞争模型(v2),一片草原上生活着一群聪明的牧人,他们各自勤奋工作,增加着自己的牛羊。畜群不断扩大,终于达到了这片草原可以承受的极限,每再增加一头牛羊,都会给草原带来损害。但每个牧人的聪明都足以使他明白,如果他们增加一头牛羊,由此带来的收益全部归他自己, 而由此造成的损失则由全体牧人分担。于是,牧人们不懈努力,继续繁殖各自的畜群。 最终,这片草原毁灭了。,加勒特哈丁 (Garrett Hardin), 1968,十、公地悲剧,第1节 从占优到纳什均衡,1.一项可再生自然资源由n个人共同所有,nN;,2.每个拥有者都可以利用这种资源生产某种产品,不妨设其中第i个人生产的
37、数量为qi(0,),而市场上这种产品的总供给量则为Q=qi;,3.市场上该种产品的价格P是总供给量的函数,即P=P(Q),不失一般性地,我们假定:,4.该产品的生产中以边际成本不变的方式进行,且不耗费固定成本,因此可以设每增加一单位产品增加的成本为c;,十、公地悲剧,第1节 从占优到纳什均衡,1.假定这个社会有n个居民,每个居民自愿供给的公共品数量为为gi(0,),则G=gi;,3.令px和pG分别为私人物品和公共品的价格,Mi为第 i 个居民的预算约束。,2.居民i的效用函数为:其中ui /xi 0, ui /G 0。且私人物品和公共物品之间的边际替代率是递减的。,十一、公共品的私人供给问题
38、,第1节 从占优到纳什均衡,对于每个社会成员而言,需要求解如下最大化问题:,利用拉格朗日乘数法,构造如下函数:,继而求得:,十一、公共品的私人供给问题,第1节 从占优到纳什均衡,假定全体居民的社会福利函数为:,则对这个社会而言,其全体成员整体的最优化问题是:,十一、公共品的私人供给问题,第1节 从占优到纳什均衡,利用拉格朗日乘数法,构造如下函数:,继而求得:,十一、公共品的私人供给问题,第1节 从占优到纳什均衡,(2)式即存在公共品情况下帕累托最优的萨缪尔逊条件(Samuelson, 1954)。 改写上述帕累托条件:,十一、公共品的私人供给问题,第1节 从占优到纳什均衡,更进一步地,我们假定
39、消费者的效用函数采用柯布-道格拉斯形式:,其中:,这种情况下,结合个人最优的均衡条件与预算约束可得:,十一、公共品的私人供给问题,第1节 从占优到纳什均衡,如果所有居民有相同的收入水平,那么:,纳什均衡下公共品的总供给量为:,十一、公共品的私人供给问题,第1节 从占优到纳什均衡,如果所有居民有相同的收入水平,帕累托最优的一阶条件为:,代入预算约束可得单个居民的帕累托最优贡献为:,则公共品的总供给量为:,十一、公共品的私人供给问题,第1节 从占优到纳什均衡,纳什均衡的公共品总供给与帕累托最优的公共品总供给比率为:,十一、公共品的私人供给问题,第1节 从占优到纳什均衡,第2节 混合策略与混合策略纳
40、什均衡,第2节混合策略与混合策略纳什均衡,第2节 混合策略与混合策略纳什均衡,猜硬币的搏弈,第2节 混合策略与混合策略纳什均衡,政府与流浪者的搏弈,第2节 混合策略与混合策略纳什均衡,胆小鬼搏弈(chicken game),一、混合策略(Mix Strategy),第2节 混合策略与混合策略纳什均衡,在博弈G=N,Si,ui中,假定第i个人有K个策略,Si=si1, si2, , siK,如果函数i(sik)满足如下条件,则称i为i的一个混合策略: (1) (2),一、混合策略(Mix Strategy),第2节 混合策略与混合策略纳什均衡,二、混合策略纳什均衡(Mix Strategy NE
41、),第2节 混合策略与混合策略纳什均衡,如果参与人2混合策略为(q, 1-q),则:,二、混合策略纳什均衡(Mix Strategy NE),第2节 混合策略与混合策略纳什均衡,二、混合策略纳什均衡(Mix Strategy NE),第2节 混合策略与混合策略纳什均衡,O,r,q,1/2,1,1,二、混合策略纳什均衡(Mix Strategy NE),第2节 混合策略与混合策略纳什均衡,假定参与者1和2的纯策略空间分别为:S1=s11,s1JS2=s21,s2K 如果参与人2选取的混合策略为:2=(p21,p2k),二、混合策略纳什均衡(Mix Strategy NE),第2节 混合策略与混合
42、策略纳什均衡,参与人1选择纯战略s1所得的期望支付为:,参与人1选择混合策略1=(p11, p2k)所的期望支付为:,二、混合策略纳什均衡(Mix Strategy NE),第2节 混合策略与混合策略纳什均衡,参与人2选择混合策略2=(p11, p2k)所的期望支付为:,混合纳什均衡定义1:如果策略组合*=(*1, , *n)是一个纳什均衡,那么必然有以下关系成立:,二、混合策略纳什均衡(Mix Strategy NE),第2节 混合策略与混合策略纳什均衡,二、混合策略纳什均衡(Mix Strategy NE),第2节 混合策略与混合策略纳什均衡,在混合策略=(1, , n)中,设S+iSi是
43、参与人以正概率选择的纯策略的集合。如果是一个纳什均衡,那么对于i=0, , n必然有:,第2节 混合策略与混合策略纳什均衡,猜硬币的搏弈,二、混合策略纳什均衡(Mix Strategy NE),O,p2,p1,1/2,1,1,二、混合策略纳什均衡(Mix Strategy NE),第2节 混合策略与混合策略纳什均衡,第2节 混合策略与混合策略纳什均衡,政府与流浪者的搏弈,二、混合策略纳什均衡(Mix Strategy NE),第2节 混合策略与混合策略纳什均衡,性别战,二、混合策略纳什均衡(Mix Strategy NE),二、混合策略纳什均衡(Mix Strategy NE),第2节 混合策
44、略与混合策略纳什均衡,纳什均衡存在性定理I:每一个有限博弈至少存在一个纳什均衡(可能是混合策略的)。,纳什均衡存在性定理II:n人搏弈中,如果Si是欧式空间中的一个非空、闭的、有界的凸集,ui(s)连续,且对si是拟凹的,那么存在纳什均衡。,纳什均衡存在性定理III:n人搏弈中,如果Si是欧式空间中的一个非空、闭的、有界的凸集,ui(s)连续,那么存在混合策略纳什均衡。,三、混合策略纳什均衡(Mix Strategy NE),第2节 混合策略与混合策略纳什均衡,2. 考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。工作申请规则如下:每个学生只能向其中一家企业申
45、请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足: 。试问: (1)写出以上博弈的战略式描述 (2)求出以上博弈的所有纳什均衡,第2节 混合策略与混合策略纳什均衡:习题,3. 猜拳游戏是一种非常常见的零和博弈,那么(1)写出这个博弈的战略式描述;(2)求出以该博弈的所有纳什均衡,4. Lucy提议与Charlie进行这样一个博弈:两人同时拿出一枚硬币,如果朝上的一面都是H,那么Lucy给Charlie 1美元;如果朝上的一面都是T,那么Lucy给Charlie 3美元;如果朝上的一面不同,那么Charlie给Lucy 2美元。如果你是查理,你会同Lucy玩这样的游戏么?,