1、第十五章 对策论Game Theory15.1 对策论的基本概念15.2 矩阵对策的最优纯策略15.3 矩阵对策的混合策略15.4 其他类对策论日常生活中的例子n 占座问题A同学的最优选择是 “占座 ”,即不管 B同学是否占座, A同学都会有位子。 B同学选择占座也是这个道理。两个同学都放弃了 “不占座 ”,这个同样都有位子坐的策略。这就是个人理性与集体理性的矛盾,即个人理性的结果不一定导致集体的理性或者集体最优。博弈论所讨论的局中人,都是经济学上所讲的 “理性人 ”。他们利己但不损人。 A同学占座 不占座B同学 占座 都有位置 A没有不占座 B没有 都有位置日常生活中的例子n 恋爱问题:鲜花
2、与牛粪u前提是鲜花一般是不追人的u被人追,在个人婚姻上没有主动权u由于男性的控制性倾向导致其一般会降一格选择异性伙伴u因此实际社会中的典型完配是 A男配 B女, B男配 C女, C男配 D女,而 A女与 D男轮空。u这个时候产生了两个确定性, A女(鲜花)确定 D牛粪男是没人要的,而 D男确定 A女是追不到的。u这种确定导致了两个最有可能的均衡策略, A女如果在某种情况下选择了 D男,则 D男一定会接受,而 D男去追 A女则肯定不会有结果,但反正 D男也没人要则追 A与不追 A都一样不会有损失,所以 D男出于无聊或其他动机仍非常有可能追 A女。内容简介n 也称为博弈论或者赛局理论, 应用数学
3、的一个分支,目前在 生物学 、 经济学 、 国际关系 、 计算机科学 、 政治学 、 军事战略 和其他很多学科都有广泛的应用n 分析在一群举止行为颇具策略的理性人之间的相互作用的正规方法n 开始于策墨洛 (Zermelo,1913),波雷尔 (Borel,1921)及 冯 诺伊曼 (von Neumann, 1928)n 由 冯 诺伊曼 和奥斯卡 摩根斯坦 (von Neumann and Morgenstern,1944,1947)首次对其系统化和形式化n 约翰 福布斯 纳什 (John Forbes Nash Jr., 1950, 1951)利用不动点定理证明了均衡点的存在,为博弈论的一般
4、化奠定了坚实的基础博弈论领军人物u 美藉匈牙利数学家冯 诺依曼( John Von Neuman) 和美藉奥地利经济学家摩根斯顿( Morgenstern) 相识于普林斯顿大学,他们于 1944年出版了经典著作 博弈论与经济行为 ,为现代博弈论的发展奠定了基础。u 美国的数学家、经济学家纳什( John Nash), 美籍匈牙利经济学家海萨尼( John C. Harsanyi) 和德国经济学家泽尔滕( R.Selten) 因对博弈论的卓越贡献而获得 1994年度的诺贝尔经济学家。u 在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响 。u 值得一提的是纳什,他发
5、表奠定其在博弈论中重要地位的学术论文时,年仅 22岁,被人称为 “一个天才 ”。 1959年,纳什被精神病医生诊断为 “妄想性精神分裂 ”,饱受精神病折磨 40余年。博弈论与诺贝尔奖n 1994年诺贝尔经济学奖授予了三位 博弈论 专家纳什、泽尔腾和海萨尼。n 1996年诺奖授予两位 博弈论与信息经济学 研究专家莫里斯、维克瑞;n 2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他们在柠檬市场、信号传递和信号甄别等 非对称信息理论 研究中的开创性贡献。n 2005年诺奖授予有以色列和美国双重国籍的罗伯特 奥曼和美国人托马斯 谢林,以表彰他们在 博弈论 领域作出的贡献。1 对策论的基本概念对策
6、模型的基本要素:n 博弈方(局中人) -参与博弈但利益不完全一致者。有二人博弈与多人博弈之分。n 策略集 -每个局中人都会有一系列的策略可选,称为对应于每个局中人的策略集。有限和无限个对策。n 得益(益损值) -在每策略组合下每一局中人的得益情况,是选择策略的标准,称为得益函数或支付函数。n 均衡: 是指博弈的所有参与者从自我利益最大化出发选择的策略所组成的策略集。由 “齐王赛马 ”引入“齐王赛马 ”齐王在各局势中的益损值表(单位:千金)1 对策论的基本概念(上中下 ) (上下中 ) (中上下 ) (中下上 ) (下上中 ) (下中上 ) (上中下 )(上下中 )(中上下 )(中下上 )(下上
7、中 ) (下中上 ) 其中:齐王的策略集 : S1= 1, 2, 3, 4, 5, 6 ,田忌的策略集: S2= 1, 2, 3, 4, 5, 6 。下面矩阵称齐王的 赢得矩阵 :3 1 1 1 -1 11 3 1 1 1 -1A= 1 -1 3 1 1 1-1 1 1 3 1 11 1 1 -1 3 11 1 -1 1 1 3 1 对策论的基本概念二人有限零和对策 (又称 矩阵对策 ):局中人为 2;每个局中人的策略集的策略数目都是有限的;每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。通常将矩阵对策记为 : G = S1, S2, AS1: 甲的策略集; S2: 乙的策略集;A: 甲的赢得矩阵。“ 齐王赛马 ” 是一个矩阵策略。1 对策论的基本概念