1、博 弈 论 专 题,张秀英,一、现代博弈论的简单发展史 博弈论与诺贝尔经济学奖 二、博弈论与主流经济学的发展 博弈论对经济学的影响三、非合作博弈理论 非合作博弈的非技术性简要概述,一、现代博弈论简单发展史,1944年数学家冯诺伊曼(Von Neumann)与经济学家摩根斯坦(Morgenstein)合著的博弈论与经济行为1950年,Tucker最先提出并研究了“囚徒困境”1950年,Nash发表了“n人博弈中的均衡点”-奠基性论文,1960年开始,不同类型的博弈问题的研究取得突破性进展1965年,Selten将纳什均衡概念引入动态分析,提出“子博弈精炼纳什均衡”1967年,Harsanyi把不
2、完全信息引入博弈论研究,提出“海萨尼转换”方法,给出“贝叶斯纳什均衡”19751991年泽尔腾(1975)、Kreps和Wilson(1982)、Fudenberg和Tirole(1991)提出了精炼贝叶斯纳什均衡的概念20世纪80年代,发展迅猛,1982年,Kreps&Wilson把动态分析不完全信息糅合在一起,提出“序贯均衡”。Kreps于1990年获得了全美对40岁以下经济学家的最高奖-“Clark Medal”20世纪后半叶,蓬勃发展,一、现代博弈论简单发展史,博弈论和诺贝尔经济学奖,1994:纳什( John F. Nash)、海萨尼( John C.Harsanyi)、泽尔腾(德)
3、( Reinhard.Selten),1996:莫里斯(英)(James A.Mirrlees)和维克瑞(美)(William Vickrey),纳什的基本贡献是证明了非合作博弈均衡解及其存在性,建立了作为博弈论基础的“纳什均衡”概念;海萨尼则把不完全信息纳入到博弈论方法体系中;泽尔腾的贡献在于将博弈论由静态向动态的扩展,建立了“子博弈精练纳什均衡”的概念。,这两位经济学家的贡献集中于运用博弈论对现实经济问题的解释。,2001:阿克洛夫( George A. Akerlof)、斯宾塞( A. Michael Spence)、斯蒂格利茨( Joseph E. Stiglitz)(美),博弈论和诺
4、贝尔经济学奖,这三位作为不对称信息市场理论的奠基人被授予诺贝尔经济学奖,以表彰他们分别在柠檬品市场等不对称信息理论研究领域做出的基础性贡献。这些贡献发展了博弈论的方法体系,拓宽了其经济解释范围。,2002:弗农史密斯(Vernon Lomax Smith),2005(以色列)奥曼( Robert J. Aumann)、谢林(美)( Thomas C. Schelling),贡献主要在于通过实验室实验来测试根据经济学理论而做出预测的未知或不确定性。是对以博弈论为基础构建的理论模型进行实证证伪工作的一大创举。(两位美国学者丹尼尔卡纳曼和弗农史密斯 ),他们通过博弈理论分析增加了世人对合作与冲突的理
5、解。其理论模型应用在解释社会中不同性质的冲突、贸易纠纷、价格之争以及寻求长期合作的模式等经济学和其他社会科学领域。,二、博弈论与主流经济学的发展,传统微观经济学与博弈论的比较传统微观经济学的个人决策是在给定一个价格参数和收入的条件下最大化自己的效用,个人的效用与其他人无关,所有其他人的行为都被总结在“价格”参数之中博弈论中,个人效用不仅依赖于自己的选择,还以来于他人的选择,研究在存在外部经济条件下的个人选择问题行为主体的数量通常不多,相互之间存在明显影响,国外经济学教科书改写,加入大量博弈论内容博弈论进入主流经济学,其研究对象:转向个体放弃了某些没有微观基础的假设转向人与人之间行为的相互影响和
6、作用重视对信息的研究传统微观经济学的工具是数学(微积分、线性代数、统计学),而博弈论是一种新的分析工具。,二、博弈论与主流经济学的发展,博弈论研究对象: 当成果无法由个体完全掌握,而结局须视群体共同决策而定时,个人为了取胜,应该采取什么策略方法论: 经济学、政治学、管理、军事、外交、国际关系、公共选择、犯罪学“深蓝”和“更深的蓝”使用动态博弈理论编写程序,后来战胜了无敌的卡斯帕罗夫,企业、政府与商业环境,博弈论与竞争策略,“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解” 保罗萨缪尔森,Paul.Samuelson曾经戏说:你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必
7、须学习的只有两个词,那就是“供给”和“需求”博弈论学者Kandori俏皮地作了引申:现在这只鹦鹉需要再学习一个词,那就是“纳什均衡”博弈论在现代经济学中的重要地位、作用和影响,三、非合作博弈理论,著名案例囚徒困境(prisoners dilemma),个人理性最终导致集体理性的缺失,三、非合作博弈理论,博弈: 决策主体在互相对抗中,对抗双方(或多方)互相依存的一系列策略和行动的过程集合参与人的利益有冲突博弈是一个过程集合(参与人、策略、行动、信息等)。思维从具体到抽象本质特征是策略的相互依存性博弈论:专门研究博弈如何出现均衡的规律的学问,三、非合作博弈理论,博弈论的基本要素: 参与人、行动、信
8、息、战略、支付函数、结果、均衡博弈有不同的种类:从行动顺序角度: 静态博弈 动态博弈从拥有信息角度: 完全信息博弈 不完全信息博弈,博弈的关键三要素: 参与人、策略空间、收益函数(支付函数)博弈信息:影响最后博弈结局的所有参与人的情报 “完美信息”-确定的结果 “不完美信息”-概率期望依据支付结果分为零和博弈、常和博弈以及变和博弈,非合作博弈理论,非合作博弈理论,(一)完全信息静态博弈:纳什均衡Nash Equilibrium,A Nash equilibrium, named after John Nash, is a set of strategies, one for each play
9、er, such that no player has incentive to unilaterally change her action. Players are in equilibrium if a change in strategies by any one of them would lead that player to earn less than if she remained with her current strategy. For games in which players randomize (mixed strategies), the expected o
10、r average payoff must be at least as large as that obtainable by any other strategy. 纳什均衡,一个策略集合,其中每个参与人没有动机去单方面改变自己的行动。任何一个人改变策略都会获得更少,这就是纳什均衡。对于随机化的参与人,期望或平均支付至少与其他任何策略一样大,(一) 完全信息静态博弈:纳什均衡,纳什均衡的重要性: 任何“合理”结果都要满足的条件 当某一参与人发现他单方面改变战略可以获取更多时,他会毫不犹豫地改变自己的战略,博弈自然就没有达到均衡一种制度安排要发生效力,必须是纳什均衡,否则,这种制度安排就没有
11、效力,(一) 完全信息静态博弈:纳什均衡,囚徒困境的几个事例:价格大战两个寡头企业选择产量公共产品的供给军备竞赛做广告围观时踮脚尖应试教育污染。1968年,格雷特哈丁成功地将“囚徒困境”与资源耗竭结合起来 , 揭示了生态环境问题与囚徒困境的相似之处。贸易自由与壁垒,地方保护主义,(一) 完全信息静态博弈:纳什均衡,个人理性与集体理性的冲突 各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局 从利己目的出发,结果损人不利己 合作是有利的“利己策略”,但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是 “己所不欲勿施于人”。,
12、占优战略均衡: (dominant-strategy equilibrium) 反映了所有人的绝对偏好,因此十分稳定。但这种情况较少见。又称为上策均衡。重复剔除的占优战略均衡混合战略纳什均衡,(一) 完全信息静态博弈:纳什均衡基本分析思路和方法,例2:智猪博弈(boxed pigs),(一) 完全信息静态博弈:纳什均衡,猪圈里圈两头猪,一头大猪,一头小猪。猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就要付出2个单位的成本。若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪
13、吃6个单位,小猪吃4个单位,例3:性别战(battle of sexes),先动优势所形成的“解”形成的机会,(一) 完全信息静态博弈:纳什均衡,例4:斗鸡博弈(chicken game)(胆小鬼博弈),(一) 完全信息静态博弈:纳什均衡,例5:进入阻挠(entry deterrance),(一) 完全信息静态博弈:纳什均衡,(一) 完全信息静态博弈:纳什均衡-混合战略纳什均衡,有些博弈不存在(纯策略的)纳什均衡社会福利博弈之例:不存在纳什均衡猜谜游戏之例:不存在纳什均衡,(一) 完全信息静态博弈:纳什均衡-混合战略纳什均衡,纯战略:参与人在每一个给定信息的情况下只选择一个特定的行动混合战略:
14、参与人在每一个给定信息的情况下以某种概率分布随机地选择不同的行动“流浪汉”的纳什均衡:政府以0.5救济,流浪汉以0.2找工作一个参与人使用混合策略的好处是给对方造成不确定性海萨尼对混合战略的解释:混合战略等价于不完全信息下的纯战略,1. 纳什均衡的存在性2. 纳什均衡的多重性促成纳什均衡的方法Cheap talk 重复博弈但并不保证必然出现纳什均衡,(一) 完全信息静态博弈:纳什均衡,可能存在多个纳什均衡,如果某种情况不可能出现(如,不可信的威胁),则可剔除之。精炼,缩小了“解”的个数如果是动态博弈,从每一个行动选择开始到博弈结束又构成一个博弈,即“子博弈”子博弈精炼纳什均衡:当只当参与人的战
15、略在每一个子博弈中都构成纳什均衡承诺行动:当事人使自己的威胁变得可信的行动,(二) 完全信息动态博弈: 子博弈精炼纳什均衡,扩展式表述博弈的纳什均衡,需求大,开发者利润8千万,不开发者利润0。需求大,两者都开发利润各为4千万。需求小,开发者利润1千万,不开发者利润0。需求小,两者都开发利润各为-3千万两者都不开发利润各为0。,博弈树:房地产开发博弈I,信息集:房地产博弈II,信息集:房地产博弈III,信息集:房地产博弈IV,逆向归纳法,逆向归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始,逐步向前倒推以求解动态博弈的方法。,子博弈精炼纳什均衡,扩展式博弈的战略组合s*=(s1*,si*,
16、sn*)是一个子博弈精炼纳什均衡,如果:(1)它是原博弈的纳什均衡;(2)它在每个子博弈上给出纳什均衡一个战略组合是子博弈精炼纳什均衡,当只当它在每个子博弈上都构成纳什均衡,子博弈精炼纳什均衡,均衡路径构成子博弈精炼纳什均衡的战略不仅在均衡路径上是最优的,而且在非均衡路径上也是最优的。这是纳什均衡与子博弈精炼纳什均衡的实质区别只有当一个战略规定的行动规则在所有可能的情况下都是最优的时,它才是一个合理的、可置信的战略序贯理性:不论过去发生了什么,参与人应该在博弈的每一个时点上最优化自己的决策,有同时选择的两阶段动态博弈,假设有两个阶段,在每个阶段有两个参与人同时选择(静态博弈)。(两个子博弈),
17、银行挤兑(1)王则柯“银行挤兑的成因和预防”,两客户在同一银行各存有100元,银行将这200元投资于一个长期项目。如果在项目到期前银行要抽回资金,则只能收回140元;但如果到期后再收回投资,则可收回本息280元。,对客户来说,抽回存款的日期也有两种:一是在银行投资项目到期之前,称日期1;一是在到期之后,称日期2。假定如果两客户在日期1要求抽回资金则各得70元;如果只有一个客户在日期1要抽回资金则该客户得100元,另一客户只能得到剩余的40元。如果等到日期2两客户同时要收回资金,则各得140元;如果到日期2还只有一方要求收回资金,则要求收回资金一方得180元,另一方得100元;如果到日期2没有客
18、户要求收回资金,则银行还是分给他们各140元。,银行挤兑(2),银行挤兑(3),重复博弈和无名氏定理,序贯博弈:不同阶段的博弈结构不同重复博弈:同样结构的博弈重复多次,其中每次博弈称为“阶段博弈”当博弈重复无限次时,存在着完全不同于一次博弈的子博弈精炼纳什均衡无名氏定理:有一个一次博弈G可作为某无穷博弈的一个阶段,G有纳什均衡,对于无限博弈,一定存在一个贴现因子,使无限博弈的结果不劣(弱优)于G的纳什均衡结果,不确定环境下的重复博弈,寡头市场上,低需求时容易使他们都选择“合作”,但在高需求时,利润的诱惑使他们都选择“背叛”。这种情况可以重复能同甘却不能共苦,似乎有道德谴责的意味,但这一现象总是
19、发生,发生的逻辑是什么?博弈论可以解释,只拥有不完全信息。每个人知己于必然,知人于或然引入一个虚拟的参与人:自然。它选择参与人的特征类型海萨尼转换完全但不完美信息博弈给定自己的类型和别人的类型的概率分布的情况下,每个参与人的期望效用达到最大,(三) 不完全信息静态博弈: 贝叶斯-纳什均衡,不完全信息静态博弈和贝叶斯纳什均衡,例:市场进入博弈进入者不知道在位者的成本函数,只能猜概率如果你是高成本,我就进入,预期收益40,如果你是低成本,我就不进入。到底进还是不进?,海萨尼转换 贝叶斯纳什均衡,双方叫价拍卖(double auction)两群人各自出价,有中间的拍卖商。叫价较低者容易卖出,但成交价
20、格有可能高于他的出价;出价高者容易买到,但成交价格有可能低于他的出价Chatterjee & Samuelson “双方叫价拍卖模型”假设你卖我买你觉得这东西值c,要价ps;我觉得这东西值v,要价pb。同时报数如果你要价较低,成交,价格为中间数如果你要价较高,不成交,贝叶斯纳什均衡的应用举例,贝叶斯纳什均衡的应用举例,双方叫价拍卖(double auction)如果是完全信息,我知道那东西对你意味着什么,你也知道那东西对我来讲值多少钱。这将形成一个均衡:你我出价相等,皆大欢喜如果谁想沾便宜,生意就没法做还可能出现无效率的均衡:双方都没有认真选择价格,漫天要价,坐地还钱,做不成生意,贝叶斯纳什均
21、衡的应用举例,双方叫价拍卖(double auction)如果是不完全信息,我不知道那东西对你意味着多少钱,你也不知道那东西对我来讲有多大价值。但可以假设我们互相知道对方的分布函数根据纳什均衡的定义,我们都选择最大化根据均衡战略,即使我觉得它值1,但我最多只出3/4,如果想成交,你的要价必须不高于3/4,后行动者可以通过观察而增加对先行者的了解,再修正其主观判断,并由此选择自己的行动。先行者知道自己的行为会被他人利用,就会设法传递有利信息。博弈过程不仅是参与人选择行动的过程,还是不断学习的过程。精炼贝叶斯均衡要求:给定其他参与人类型的信念,参与人的策略在每一个信息集开始的“后续博弈”上构成贝叶
22、斯-纳什均衡,而且在所有可能的情况下,参与人要根据观察结果来修正对其他参与人的信念,据此选择自己的最优化行为。,(四) 不完全信息动态博弈:精炼贝叶斯均衡,二手车交易,假定你现在到二手车市场去买一辆旧车,到了市场后,你却发现不知道每辆旧车真正的质量究竟怎样,因为它们看起来都象新车一样。但通常卖方对旧车的质量要清楚得多。现在假定二手车只有“好”和“差”两种类型,卖者知道而买者不知道;不管好、差,卖者都有两种选择:卖或不卖,买者有“买”和“不买”两种选择。,二手车交易的扩展式表述:首先,卖者确定旧车质量;其次,卖者决定是卖还是不卖;最后,在卖者卖车的情况下,买者确定买还是不买。,二手车交易,精炼贝
23、叶斯均衡,精炼贝叶斯均衡是一个战略组合和一个概率分布,它们满足以下要求:(1)在各个信息集,轮到选择的参与人必须具有一个关于博弈达到该信息集中各决策结的概率的判断(即信息集上的概率分布);(2)给定概率分布和其他参与人的选择,每个参与人的战略是最优的;(3)概率分布是使用贝叶斯法则从最优战略和观测到的行动得到的。,市场类型,市场完全失败:所有卖方担心商品卖不出去而不卖,市场交易不存在。市场完全成功:只有质量好的商品才被卖,而质量差的卖方不敢卖。市场上的商品都是好的。市场部分成功:所有卖方不管商品好坏都卖,买方不管商品好坏都买,交易总是能够完成。市场接近失败:所有好商品都被投放在市场,只有部分坏
24、商品被投放,但买者按一定概率购买市场上的商品。,混同均衡与分离均衡,在有的市场中,所有的卖方(具有完美信息)都采取相同的选择(卖或不卖),而不管商品的“好”“坏”(如市场完全失败中所有卖方都不卖,市场部分成功中所有卖方都卖)。这种完美信息的参与人完全采取相同的行为的市场均衡被称为“混同均衡”。,而另外一些市场,拥有不同质量商品的卖方采取的选择却截然不同(如完全成功中,好商品的卖方选择卖,差商品的卖方选择不卖)。这种具有完美信息的参与人采取完全不同的选择的市场均衡被称为“分离均衡”。,二手车博弈:单一价格模型,假定:二手车有好、差两种情况,对买方来讲价值分别为V和W (VW);卖方不管旧车好坏都
25、只能以一种价格P出售(即差车如果出低价将没有人买)。但是,差车必须花费一定的伪装成本C才能诱使买者购买。,二手车博弈:单一价格模型,情形I:如果VPW,差车子出现的概论P(b)很小,即买方相信还是好的车子占绝大多数,并且PC,则下列策略组合和判断构成一个市场部分成功的精炼贝叶斯均衡(混同均衡):(1)卖方选择卖,不管车子好或差;(2)买方选择买,只要卖者卖;(3)买方的判断为P(g|s)=P(g),P(b|s)=P(b)。g=good b=bad s=sell,情形II:假定PC,即要把差车伪装成好车很费钱。下列策略组合和判断构成一个市场完全成功的精炼贝叶斯均衡(分离均衡):(1)卖方在车况好时选择卖,车况差时选择不卖。(2)买方选择买,只要卖方卖。(3)买方的判断是P(g|s)1,P(b|s)=0,情形III:在某些特殊时候,可能出现一些最悲观的情况,即买方根据以往的经验,判断当卖方选择卖时一定是车况差的,则下列策略和判断构成市场完全失败的精炼贝叶斯均衡:(1)卖方总选不卖;(2)买方总选不买;(3)P(g|s)=0, P(b|s)=1,献给诸位,知人者智,自知者明;胜人者力,自胜者强 ;小胜者术,大胜者德 。,站在别人的立场上想一想,就是为自己未来的遭遇着想 米兰昆德拉,谢谢大家!,