1、第十一章 博弈论与企业策略,一、博弈论概述(一)博弈论的研究对象 博弈论Game Theory研究决策主体的行为发生直接相互作用时的决策,以及这种决策的均衡问题,即,当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。(二)博弈论的发展历史 1944年,冯诺依曼Von Neumann和摩根斯坦Morgenstern合作的博弈论和经济行为The Theory of Games and Economic Behaviour 一书出版,提出了预期效用理论等概念,但与现代博弈论关系不大。,1950s,合作博弈发展到鼎盛时期,包括纳什Nash和夏普里Sharple
2、y1953 年的“讨价还价模型”,Gillies和Sharpley1953年关于合作博弈中的“核”core的概念等。同时,非合作博弈也开始创立,纳什在1950年和1951年发表了两篇关于非合作博弈的重要文章,杜克于1950年定义了“囚犯困境”prisoners dilemma,从而基本上奠定了现代非合作博弈的基础。 1960s年代后,泽尔滕R.Selten把纳什均衡的概念引入了动态分析,提出了“精炼纳什均衡”的概念。海萨尼J.Harsanyi把不完全信息引入博弈论的研究。克瑞普斯Kreps和威尔逊Wilson 1982年合作发表了关于不完全信息动态博弈的重要论文。,专栏11-1:博弈论在微观经
3、济学中的重要性 1博弈论与新古典经济学 新古典经济学研究的是当外部条件既定时,单个厂商(消费者)的最大化决策问题,即在给定一个价格参数和成本(收入)的条件下,最大化其利润(效用),厂商利润(个人效用)函数只依赖于他自己的选择,而不依赖于其他人的选择;个人的最优选择只是价格和成本(收入)的函数,而不是其他人选择的函数。对单个人来说,其他人对其的影响都被总结在一个参数价格里,决策时,他既不考虑自己的选择对别人选择的影响,也不考虑别人选择对自己的影响。 但是,新古典经济学的分析有两个假定条件:一是市场参与者数量足够多,从而市场是竞争性的;二是双方不存在信息不对称的问题。第一个条件在现实中并不具备,在
4、市场参与者人数有限的情况下,即在不完全竞争市场上,人们之间的行为是直接影响的,所以,一个人在决策时,必 须考虑对方的反应,这就是博弈论研究的内容。同时,当信 息不对称时,非价格制度会出现,其显著特征是,参与人之 间行为的相互作用,因此,博弈论又成为分析非价格机制的 重要工具。 2博弈论与诺贝尔经济学奖 (1)博弈论与诺贝尔奖的授予 1994年诺贝尔经济学奖授予了三位博弈论专家:纳什、泽尔 滕和海萨尼。而1983年,英国wheatsheaf出版社出版的,由 当代在世的最著名的经济学术史专家Mark Blaug根据社会科 学文献引证索引编写的一本经济学家名人录中,收录了 从1970年到1981年间
5、在世的674位,去世的397位,共计 1071位经济学家的传记。在这本名人录中,没有纳什和泽尔 滕,只有海萨尼,但其名字下注着NE,即没有条款,原因是 他自己没有编写简历。而仅仅十几年后, 三人就获得了诺贝,尔经济学奖,说明了博弈论和经济学发展的迅速。 2005年度诺贝尔经济学奖则授予持有以色列和美国双重 国籍的罗伯特奥曼和美国公民托马斯谢林。瑞典皇家科学 院说,两位经济学家获奖是因为“他们通过对博弈论的分析 加深了我们对冲突与合作的理解”。这是自1994年之后,博 弈论学者再获诺贝尔经济学奖。谢林,执教于美国马里兰大 学经济学系,同时也是哈佛大学名誉教授。按照评委会的认 定,谢林的贡献,在于
6、显示“某一方可以显而易见地限制自 己的选择,以此强化自身的(竞争)地位;报复的能力可以 比之抵御攻击的能力更为有用;以及不确定的报复比之确定 的 报复更为可靠和更为有效。”评委会说,这些见解“已经证 明与化解冲突和努力避免战争有着相当大的关联”。奥曼执,教于耶路撒冷希伯来大学理性分析中心。奥曼和谢林之所以 一同获奖,是因为他们“以博弈论分析方式增进了我们对于 冲突与合作的理解。”具体到经济领域,他们帮助“解释了诸 如价格战和贸易战之类的经济冲突,以及为什么一些社区相 对于其他社区在管理共有资源方面更为成功。” (2)国外流行教科书中的博弈论 Hal Varian的微观经济分析Microecon
7、omic Analysis是一本在欧美非常流行的高级微观经济学教科书, 几乎所有大学的研究生课程都用这本书。在1984年的第二 版中,没有博弈论,甚至书后词汇表中也没有“博弈论”一词。 但在1992年第三版就加上了“博弈论”一章,而且有关寡头 竞争这一章也按博弈论理论重写了。,克瑞普斯David Kreps1990年出版的微观经济理论教程 A Course in Microeconomic Theory 是1991年最畅销的经济学教科书,被相当多欧美名牌大学选为研究生教材,其中第三部分就是“非合作博弈”,共219页,占全书的比重超过28%,其本人就是博弈论专家。1990年他因对博弈论的贡献获得
8、美国“克拉克奖”Clark Medel。 泰勒尔Jean Tirole1988年出版的产业组织理论一书,是目前最受欢迎的、最流行的产业组织理论教科书,全书的内容都建立在非合作博弈的基础上,以至于作者不得不在最后加上一章“非合作博弈论”,供不熟悉的读者参考。,相关链接111 从日常生活看“博弈论” “博弈论” 原本是数学的一个分支, 但由于它较好地解 决了对于竞争等问题的可操作性分析, 成为经济学中激荡 人心的一个研究领域。可以说, “博弈论”已经改变了经济 学的传统轮廓线。“博弈论” 的英语原文是game theory , 直译过来就是游戏论、运动论或竞赛论。譬如, 在足球比 赛中, 双方都想
9、在努力巩固防守的同时, 积极进攻以置对 方于“死地” , 这种行为就是一种博弈。“弈” 在汉语中是下 棋的意思, 下棋中的双方行为特征也如同足球比赛中双方 的行为。当然,扩展开来讲, 企业之间的竞争、国家之间 的角力等, 都是“游戏” , 只是游戏的内容不同而已。 我国古代有个“田忌赛马” 的故事, 说的是齐威王与大将田忌各出三匹马一对一比赛三场, 由于齐威王的最优、次优和较差的三匹马分别跑得比田忌的三匹马快,所以田忌总是以0:3告负。后来田忌的谋士孙膑给田忌出主意,让,最差的马去与齐威王最快的马比, 而让最优的马去赢齐威王次优的马, 让次优的马去赢齐威王最差的马, 这样便以2:1 取胜。但我
10、们还可进一步设想, 如果齐威王知道了田忌的花招后, 便会在以后的比赛中也更改出马的次序, 当然田忌的出马次序也应改动。双方的出马次序怎样才是最合理的呢? 这便是“博弈论” 更深层次研究的问题了。 2002 年度获奥斯卡大奖的影片枟美丽心灵枠中主角的原型, 便是“博弈论”中纳什均衡的创立者约翰 纳什。影片中有这样一个情节: 在美国普林斯顿大学的酒吧里, 个男生正商量着如何去追求一位漂亮女生, 当时还正在大学读书的纳什却在朦胧的“博弈论” 思维逻辑引导下喃喃自语: “如果他们 个人全部去追求那漂亮女生,那她一定会摆足架子,谁也不睬。然后再去追其他女孩子,别人也不会接受,因为没人愿意当次品 。但如果
11、他们先追其他女生,那么漂亮女生就会感到被孤立, 这时再追她就会容易得多。” 在纳什眼里, 追求女生就是一场“博弈” , 而“博弈” 是要遵循一定的规则的,是需要“博弈” 策略的。,我们再从经济决策上来看“博弈论” 。假如你是一个公司的老总,你在决定是否将自己的产品降价以及降价多少时,必须首先要考虑至少以下几个方面的问题:消费者将会增加购买吗? 大概会增加多少购买量呢? 其他同种产品的厂家也会降价吗? 等等。你只要是理性的话,一定会在对这些问题进行考虑的基础上来作出你的决策。所以说,“博弈论” 主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下,理性的行为主体如何决策,以及这种决策
12、的均衡等问题的。在这里,决策均衡是一个经济学概念,意味着最佳决策或最佳决策的组合。因为只要决策是最佳的,相关的行为主体就不会去改变它, 从而使它处于稳定、均衡的状态。再简而言之,“博弈论” 就是分析博弈行为和博弈决策的一门科学。 资料来源:叶德磊:从日常生活看“博弈论” ,文汇报, 2005 年10月23 日。,(三)博弈的要素 构成博弈的要素主要包括参与人、行动、战略、支付、信息、均衡、结果等。 1.参与人players 一个博弈中的决策主体,其目的是通过选择战略(或 行动),以最大化自己的支付(效用)水平。 2.行动actions or moves 行动是参与人在博弈的某个时点的决策变量。
13、 1行动集合action set:可供某个参与人(i)选择的所有 行动的集合,写作Ai=ai。 2行动组合action profile:n个参与人的行动的有序集 a=(a1,ai,an)。 3行动顺序the order of play:根据行动顺序,可以将博 弈分为静态博弈和动态博弈。因此,行动顺序对于博弈 结果非常重要。,3.战略strategies 参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。 战略与行动是不同的概念,战略是行动的规则而不是行动本身,战略要说明什么时候采取什么行动。例如“人不犯我,我不犯人;人若犯我,我必犯人”,就是一个战略,而“犯”与“不犯”
14、是两种行动,这一战略规定了什么时候选择“犯”与“不犯”的行动。可以有的战略还包括:“人不犯我,我必犯人;人若犯我,我不犯人”;“人不犯我,我不犯人;人若犯我,我还不犯人”;“人不犯我,我必犯人;人不犯我,我还犯人”等。在静态博弈时,战略与行动是相同的,因为作为参与人行动的规则,战略必须依赖于参与人获得其他参与人行动的信息,而在静态博弈中,双方同时行动,从而不可能获得对方行动的信息,因此战略选择就变成简单的行动选择。战略必须是完备的。它要给出参与人在每一种可想象到的情况下的行动选择,即使参与人并不预期到这种情况会实际发生。,(1)战略集合strategy set:某参与人i所有可选择的战略的 集
15、合。Si=si。 (2)战略组合strategy profile:n个参与人每人选择一个战 略的n为向量。s=(s1,si,sn)。 4.支付pay off 在一个特定的战略组合下,参与人得到的确定的效用水 平,或者是指参与人得到的期望效用水平。 支付是博弈参与人真正感兴趣的东西。 博弈的一个基本特征是,一个参与人的支付不仅取决于 自己的战略选择,而且取决于所有其他参与人的战略选择。 5.信息information 参与人有关其他参与人的特征、战略、行动、支付等的知识 共同知识common knowledge:“所有参与人知道, 所有参与人知道所有参与人知道,所有参与人知道所有参与 人知道所有
16、参与人知道”的知识。,6.均衡equilibrium 所有参与人的最优战略的组合,记为s*=(s1*,si*,sn*)。 7.结果outcome 即博弈均衡产生的博弈的最终后果,包括均衡及其支付。 (五)博弈的分类 1.根据博弈参与人划分 (1)单人博弈。其实质是个体的最优化问题,即在一定条 件下选择最优战略。单人博弈区别于两人博弈和多人 博弈的根本之处在于,博弈的信息越多,支付越高。 (2)两人博弈。参与人为两人的博弈。 (3)多人博弈。三个或三个以上参与人的博弈。其与单人 博弈和两人博弈最大的区别在于,可能存在“破坏 者”,即具有下列特征的参与人:其策略选择对自身支 付没有任何影响,但却会
17、影响其他参与人的支付,有 时甚至是决定性的影响,如奥运会申办。,2.根据战略划分 (1)有限博弈(finite game)。一个博弈被称为有限博 弈,如果,第一参与人个数是有限的;第二,每个参与 人可选择的纯战略是有限的。它可以用矩阵式、扩展 式,甚至罗列方式表示。 (2)无限博弈(infinite game)。不符合上述两个条件的博 弈。一般用数集或函数式表示。 3.根据支付划分 (1)零和博弈。 无论各参与人如何决策,最后的社会总支付,即各参 与人支付之和总是为零。如猜谜游戏。一是各参与人之间的 利益是对立的,相互之间难以和平共处;二是各参与人为了 多得利益,总不希望对方知道自己选择的战略
18、,因此,这种 博弈的结果是不能完全确定的;三是即使进行重复多次的博 弈,也不会产生新的机会或可能。,(2)常和博弈。 各参与人支付之和总是等于一个非零常数。如分配固定 数额的奖金。各参与人之间的利益关系也是对立的,但较易 取得妥协,因而往往有一个确定的结果。在重复博弈中,由 于总支付增加,会创造出许多新结果。 (3)变和博弈。 在不同的战略组合下,各参与人支付之和是不同的。是 博弈的一般形式。 4.根据参与人行动次序划分 (1)静态博弈。 参与人同时进行战策选择、同时行动;虽然各参与人做 出决策的时间不一定真正一致,但至少在其作出各自选择前 都不知道其他参与人的战略选择;或在指导其他参与人战略
19、 选择后不能改变自己已经做出的选择。,(2)动态博弈。 各参与人先后、依次进行选择、行动,而且后选择、行动的参与人在自己选择前一般能看到此前其他参与人的选择、行动的博弈。参与人之间存在不对称性。后行为的参与人可根据先行动的参与人的行动作出针对性选择,而先行动的参与人在决策时,不但看不到后行动参与人的选择,而且还要考虑后行动参与人的反应。 (3)重复博弈。 同一博弈反复进行所构成的博弈过程。构成重复博弈的一次性博弈称为“原博弈”或“阶段博弈”,其一般是静态博弈。重复博弈的最少重复次数是两次。其中,到一定重复次数后肯定要结束的重复博弈称为“有限次重复博弈”。而无限次重复进行的博弈叫“无限次重复博弈
20、”。在重复博弈中,考察的重点不是某一次重复的结果或支付,而是原博弈重复进行后的总体效果或平均效果,因此,不能把重复博弈割裂为一次次独立的博弈进行分析,而是要将它们作为一个完整的过程和整体进行分析,因此,重复博弈是一种特殊的动态博弈。在重复博弈中,一次静态博弈中的均衡可能会发生变化。,5.根据参与人对其他参与人等的信息划分 (1)完全信息博弈(complete information)。 若各参与人都完全了解所有参与人的特征、战略、行动,以及在每种战略组合下的支付,并且不存在事前的不确定性,该博弈称为“完全信息博弈”。 (2)不完全信息博弈(incomplete information) 至少存
21、在部分参与人不完全了解其他参与人相关情况的博弈,称为“不完全信息博弈”。 6.根据参与人对博弈进程信息,对动态博弈进行划分 (1)动态博弈中,若某参与人行动时,对此前行动的各参与 人(包括“自然”)的选择、行动完全了解,称为“具有完美 信息的”参与人。若其不完全了解此前全部的博弈进程,称 为“具有不完美信息的”参与人。,(2)如果动态博弈中的所有参与人都是具有完美信息的,则 该动态博弈称为“完美信息动态博弈”,perfect information。 若动态博弈中存在具有不完美信息的参与人,该博弈称为“不 完美信息动态博弈”,(imperfect information)。 二、完全信息静态博
22、弈 (一)博弈的战略式表述(strategic form representation) 1.战略式表述又称为标准式表述normal form representation 在这种表述中,所有参与人同时选择自己的战略,所有参 与人选择的战略一起决定每个参与人的支付。需要注意得 是参与人“同时选择”的是战略,是参与人行动的全面计划 和准则,而不是行动。因此,战略式表述也可以用来描述 动态博弈。,2.战略式表述的组成及表示(1)博弈的参与人集合:i; =(1,2,n)(2)每个参与人的战略空间:Si,i=1,2,n;(3)每个参与人的支付函数:ui(s1,si,sn),i=1,2,n。 所以,G=
23、S1,Sn;u1,un代表战略式表述博弈。 3.两人有限博弈的战略式表述的矩阵表述 例:囚犯困境prisoners dilemma,(二)占优战略均衡 1.占优战略(dominant strategy)是指无论其他参与人选择什么战略,该参与人的最优战略是唯一的,这样的最优战略被称为 “占优战略”。例如,在 “囚犯困境”中,“坦白”是囚犯A的占优战略,“坦白”也是囚犯B的占优战略。 2.占优战略均衡(dominant-strategy equilibrium)是指在一个博弈里,如果所有参与人都有占优战略存在,则所有参与人占优战略所组成的战略组合称为“占优战略均衡”。例如,在上例“囚犯困境”中,(
24、坦白,坦白)就是占优战略均衡。这时,个人理性与集体理性产生了冲突。需要注意得是占优战略均衡只要求每个参与人是理性的,不要求“每个参与人是理性的”是共同知识。,(三)重复剔除的占优均衡 1.例子:“智猪博弈” 在绝大多数博弈中,占优战略均衡是不存在的。在“智猪博弈”中,按下按钮可有8个单位食物,但要支付2单位成本。若大猪先到,大猪吃7个单位,小猪吃1个单位;小猪先到,各吃4个单位;同时到,大猪吃5个单位,小猪吃3个单位。 本例中,尽管 “等待”是小猪的占优战略,但大猪没有占优战略,因此,本博弈没有占优战略均衡。,2.重复剔除严格劣战略和重复剔除的占优均衡(iterated dominance e
25、quilibrium) (1)劣战略 第一,严格劣战略 1)定义 令si和si是参与人i可选择的两个战略(即 siSi, siSi)。如果对于任意的其他参与人的 战略组合s-i,参与人i从选择si得到的支付严格小于从 选择si得到的支付,即ui(si,s-i) ui(si,s-i) s-I 我们说,战略si严格劣于战略si(siis strictly dominated by si)。 2)例子:在“智猪博弈”中,对于小猪,“按”严格劣于 “等待”。,第二,弱劣战略 1)定义 战略si弱劣于战略si(siis weakly dominated by si),如果对于所有的s-i,ui(si,s
26、-i) ui(si, s-i)s-i,且对于某些s-i,严格不等式成立。 si称为相对于si的弱占优战略。 2)例子:在“智猪博弈”中,若“-1”变为“0”,则对于小 猪,“按”弱劣于“等待”。 (2)重复剔除(严格)劣战略 第一,思路 首先找出某参与人的(严格)劣战略(假定存在), 把这个(严格)劣战略剔除掉,重新构造一个不包含已剔除 战略的新博弈;然后再剔除这个新博弈中的某个参与人的 (严格)劣战略;继续这个过程,一直到只剩下一个唯一的 战略组合为止。,第二,例子 在“智猪博弈”中,先剔除小猪的“按”战略,再剔除大猪的“等待”战略,剩下唯一的战略组合是(按,等待)。这里,小猪是“搭便车者”
27、free rider。 (3)重复剔除的占优均衡 如果一个战略组合是重复剔除劣战略后剩下的唯一的战略组合,它被称为“重复剔除的占优均衡”。如果这种唯一的战略组合是存在的,称该博弈为“重复剔除占优可解的”dominance solvable。如果重复剔除后剩下的战略组合不唯一,该博弈不是重复剔除占优可解的。 3.例子 剔除的顺序是:右 下 左,(上,中)是博弈结果。,如果每次剔除的是严格劣战略,均衡结果与剔除顺序无关;但如果剔除的是弱劣战略,均衡结果可能与剔除顺序有关。因此,一般使用严格劣战略剔除。 (5)重复剔除严格劣战略方法的缺陷 重复剔除严格劣战略要求假定“参与人是理性的”是共同知识。这一
28、条件比占优战略均衡严格。这一方法对博弈结果的预测经常是不精确的,甚至许多博弈无法通过该方法找到均衡。例如:,(4)纳什均衡(Nash Equilibrium) 许多不存在占优战略均衡,或重复剔除的占优均衡的博弈,却存在纳什均衡。 1.纳什均衡的含义 纳什均衡是一个战略组合,当其余参与人不改变各自的战略选择时,某参与人也没有动力单独改变自己的选择,这一点对所有参与人都成立。这就意味着,在纳什均衡的战略组合中,每一个参与人的战略选择都是针对其他参与人战略组合的最优选择。 纳什均衡的特征假定所有参与人签订一个协议,协议规定个参与人均选择纳什均衡中各自的战略。则这一协议必定是可以自动实施的self-e
29、nforcing,否则,就不是纳什均衡。,专栏 价格战博弈 现在,我们经常会遇到各种各样的家电价格大战: 彩电大战、冰箱大战、空调大战、微波炉大战 这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战, 百姓都会“没事儿偷着乐” 。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡” , 而且价格战的结果是谁都没钱赚,因为博弈双方的利润正好是零。竞争的结果是稳定的, 即是一个“纳什均衡” 。这个结果可能对消费者是有利的, 但对厂商而言是灾难性的。所以, 价格战对厂商而言意味着自杀。从这个案例中我们可以引申出两个问题: 一是竞争削价的结果或“纳什均衡” 可能导致一个有效率的零利润结
30、局; 二是如果不采取价格战,作为一种敌对博弈论,其结果会如何呢? 每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格, 并尽力获取垄断利润。如果垄断可以形成, 则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。,从这一点, 我们又引出一条基本准则: “把你自己的战略建立在假定对手会按其最佳利益行动的基础上。” 事实上,完全竞争的均衡就是“纳什均衡” 或“非合作博弈均衡” 。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中, 每一企业要使利润最大化, 消费者要使效用最
31、大化, 结果导致了零利润,也就是说,价格等于边际成本。在完全竞争的情况下, 非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格, 那么社会的经济效率就会遭到破坏。这就是为什么WTO 和各国政府要加强反垄断的意义所在。,2.划线法和纳什均衡的求解(1)划线法。一是对参与人i的每一个可选择战略,在参与人j使用最优反应战略时的支付下划横线。二是支付均有横线的战略组合就是纳什均衡 2例子:在上例中 (下,右)是纳什均衡。,3.纳什均衡与占优战略均衡和重复剔除的占优均衡 纳什均衡是比重复剔除的占优均衡,比占优战略均衡(适应性)条件更强的解的概念。 (1)每一个占优战略均衡都
32、是纳什均衡,而每一个纳什均衡却未必是占优战略均衡; (2)用重复剔除严格劣战略方法,保留下的唯一的重复剔除的占优均衡,就是纳什均衡。 (3)纳什均衡,不会被重复剔除严格劣战略方法剔除掉(但弱劣战略剔除,可能会剔除纳什均衡); (4)经重复剔除严格劣战略之后,有不唯一的多个战略组合保留,其中有的战略组合不一定是纳什均衡。即重复剔除严格劣战略方法,无法确保将所有非纳什均衡战略剔除,没有被剔除的战略组合不一定是纳什均衡。 (5)没有占优战略均衡均衡的博弈,不能用重复剔除严格劣战略方法求解的博弈,可以有纳什均衡。,4.没有纳什均衡和多个纳什均衡 (1)没有纳什均衡猜谜游戏matching pennie
33、s 这是一个零和博弈。 (2)多个纳什均衡性别战,(五)混合战略纳什均衡 1.混合战略 (1)猜谜游戏的一个突出的特点是,每一个参与人都试图先知道对方的战略。一旦每方参与人都尽力知道其他参与人的战略选择,就不存在前面定义的纳什均衡,因为参与人此时的最优行为是不确定的,而博弈的结果必然要包含这种不确定性。 (2)纯战略(pure strategies)。在给定信息的情况下,一个参与人的选择是其战略空间Si中的一个战略si。例如在猜谜游戏中,出正面就是出币人的一个纯战略,出反面也是他的一个纯战略。 (3)混合战略(mixed strategies)。在给定信息的情况下,一个参与人的选择是,以某种概
34、率分布随机选择其战略空间中的一些或全部战略。例如,在猜谜游戏中,出币人以0.5和0.5 的概率随机选择出正面和出反面就是一个混合战略;以0.8和0.2的概率随机选择出正面和出反面是其另一个混合战略。纯战略是混合战略的一个特例。,(4)注意 第一,一个给定的纯战略,可能会严格劣于一个混合战略,即是这个纯战略并不严格劣于其他任何一个纯战略; 第二,一个给定的纯战略,可以是针对对方参与人一个混合战略的最优反应,即使这一纯战略并不是针对对方参与人任何一个纯战略的最优反应。 2.混合战略纳什均衡 (1)混合战略纳什均衡的含义 混合战略(P1*,P2*)是纳什均衡的充要条件是:每一个参与人的混合战略是另一
35、个参与人混合战略的最优反应,即V1(P1*,P2*)V1(P1,P2*),和V2(P1*,P2*)V2(P1*,P2)同时成立。(即对于参与人2的混合战略P2*,参与人1选择P1*的期望收益大于(不小于)自己选择其他战略的期望收益。这一点对于参与人2也成立。),(2)混合战略纳什均衡的求解 第一,支付最大化方法- 以猜谜游戏为例 假定“出币人”的混合战略为h=(,1-),即“出 币人”以的概率选择出正面,以1-的概率选择出反面。 “猜币人”的混合战略为a=(,1-),即“猜币人”以 的概率选择猜正面,以1-的概率选择猜反面。 “出币人”的期望效用为: Vh(h,a)=-1+1(1-)+(1-)
36、 1+(-1)(1-)=(2-4)+(2-1) 对上述效用函数求微分,得到“出币人”效用最大化的一阶条件为: =2-4=0;*=0.5 在混合战略纳什均衡中,“猜币人”以0.5的概率猜正 面,以0.5 的概率猜反面。,同样,“猜币人”的期望效用为: Va(h,a)=1+(-1)(1-)+(1-) (-1)+1(1-) =(4-2)+(1-2) 对上述效用函数求微分,得到“猜币人”效用最大化的一阶条件为: =4-2=0;*=0.5 即在混合战略纳什均衡中,“出币人”以0.5的概率出正面,以0.5 的概率出反面。在猜谜游戏中,*=0.5,*=0.5是唯一的纳什均衡。,第二,支付等值法 “出币人”出
37、正面的期望收益为:(-1)+1(1-)=1-2 “出币人”出反面的期望收益为:1+(-1)(1-)=2-1当且仅当 将以上随的变化用函数关系表达出来,就得到下图 所示的反应对应=*()。在这里,因为存在一个 值,使得*()有不止一个解,称*()为“出币人” 的最优反应对应best-response correspondence,如果对于 每一个值,*()只有一个解,称*()为“出币人” 的最优反应函数best-response function。,“猜币人”猜正面的期望收益为: 1+(-1)(1-)=2-1 “猜币人”猜反面的期望收益为:(-1)+1(1-)=1-2 当且仅当 将以上随的变化用
38、函数关系表达出来,就得到下图所示的反应对应=*()。,最优反应对应*()和*()的交点就是混合战略纳什均衡。如果“出币人”的战略是(0.5,0.5),“猜币人”的最优反应就是(0.5,0.5);反之,亦成立。 第三,注意 (1)一个混合战略要成为对方参与人战略s2的最优反应,混合战略中每一个概率大于零的纯战略本身也必须是对s2的最优反应。 (2)如果参与人1有n个纯战略都是对方参与人战略s2的最优反应,则这些纯战略全部或部分的任意线性组合(同时,其他纯战略的概率为零)形成的混合战略同样是参与人1对s2的最优反应。,(六)纳什均衡的存在性 1.四种均衡的关系 占优战略均衡DSE、重复剔除的占优均
39、衡IEDE、纯战略纳什均衡PNE和混合战略纳什均衡MNE,每个均衡概念依次是前一个均衡概念的扩展,或者说,前一个均衡是后一个均衡概念的特例。 如果将在某个适当定义的均衡的所有博弈定义为一个集合,那么,存在前一个均衡的集合依次为存在后一个均衡的集合的子集。如图: 一般,将上述四个均衡概念统称为纳什均衡NE。,2.纳什均衡的存在性 是不是所有的博弈都存在纳什均衡?不一定。纳什于1950年证明,每一个有限博弈,至少存在一个纳什均衡(纯战略纳什均衡或混合战略纳什均衡)。(这里,有限博弈指,博弈有有限个参与人,且每个参与人有有限个纯战略)。 三、不完全信息静态博弈和动态博弈的主要思路 (一)完全信息动态
40、博弈 完全信息静态博弈的纳什均衡存在三个问题:第一,一 个博弈可能有不止一个纳什均衡,哪个纳什均衡会发生是不 知道的,例如“性别战”博弈;第二,在纳什均衡中,参与人 在选择自己的战略时,把其他参与人的战略当作给定的,不 考虑自己的选择如何影响对手的战略。这一假设只适合静态 博弈,在动态博弈下就不适合了;第三,由于不考虑自己选 择对别人选择的影响,纳什均衡允许不可置信威胁的存在。,例如:“市场进入阻挠”(entry deterrance)博弈 已经在市场上的垄断企业称为“在位者”,试图进入的新企业称为“进入者”,博弈矩阵如下 这个博弈的纳什均衡有两个:(进入,默许), (不进入,斗争)。对于进入
41、者,在位者发出“你进入我就斗争”的威胁是不可置信威胁,因为,进入者如果进入,在位者的最优行动是默许。但是纳什均衡承认了这种不可置信威胁,于是(不进入,斗争)成为了一个纳什均衡。 于是,泽尔腾定义了“子博弈精炼纳什均衡”,中心意义是将纳什均衡中包含的不可置信威胁战略剔除出去。,(二)不完全信息静态博弈 在不完全信息下,某个博弈参与人对对方的特征(生产函数)、战略空间、各种战略组合下的支付等并不是全部了解。 海萨尼(1967-1968)的贡献就是引入一个虚拟的参与人“自然”,自然首先行动选择参与人的“类型”。被选择的参与人知道自己的真实类型,其他参与人只知道被选择的参与人的各种可能类型的概率分布。
42、而且,这一概率分布是共同知识。 海萨尼的上述工作称为“海萨尼转换”(the Harsanyi transformation)。这样,“不完全信息博弈”(games of imcomplete information)就变成了“完全但不完美信息博弈”(complete but imperfect information)。这里,“不完美”是指,自然做出了他的选择,但其他参与人并不知道他的选择是什么,仅知道各种选择的概率分布。,在这个基础上,海萨尼定义了“贝叶斯纳什均衡”。贝叶斯均衡是纳什均衡在不完全信息中的扩展。其含义是,在不完全信息静态博弈中: (1)参与人同时行动,所以不能观察到别人的选择。
43、给定别人的选择,每个人的最优战略依赖于自己的类型。 (2)每个参与人只知道对方的类型的概率分布,而不知道对方真实类型,所以他不知道对方实际的战略选择。但是他知道其他参与人的战略选择是如何依赖于其各自类型的。 (3)于是,参与人的决策目标就是,在给定自己的类型和别人的类型依从战略的情况下,最大化自己的期望支付。 于是,贝纳斯纳什均衡是这样一种类型依从战略组合: 在给定自己的类型和别人类型的概率分布的情况下,每个参 与人的期望支付达到了最大化。,相关链接112 上海大众营销策略博弈分析 上海大众凭借其在中国内地市场近 年的积累, 已 成为中国轿车市场的一线领军厂商。但现在上海大众面临着 更多市场进入者的挑战, 其垄断地位受到威胁, 市场占有 率逐渐萎缩。而新进入的厂商除了不断推出新车型占领细分 市场外, 其蚕食市场的最主要手段就是以相对较低的价格冲击市场。 面对激烈竞争, 上海大众也在竭力维护其车坛老大的 地位, 其技术含量高的新车型投放市场的步伐明显加快。 但是从整体上看, 上海大众的价格与新进入的厂商相比依 然坚挺。并且, 上海大众的有关负责人公开在媒体上表示 “市场的领导者是不会主动降价的” , “上海大众汽车质量 好, 故其造车成本高, 实际上单车利润已经很低” 。本文 针对上述说法, 以价格作为切入点, 用博弈论来分析上海 大众市场营销策略的有效性。,
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。