1、“田忌赛马”的博弈理论探讨摘要:本文对“博弈”这个概念有更进一步的认识,概括来讲,学术界对“博弈”有三种不同的理解,分别是“游戏” 、 “技艺”和“过程” 。本文同时剖析了“田忌赛马”博弈的具体类型,应是非完全信息动态博弈,最后对它的一般扩展式即序列均衡问题做了简要的概述。 关键词:博弈论;田忌赛马;一般扩展式 一、什么是“博弈” 博弈论的思想最早可以追溯到 18 世纪,但真正作为一种理论研究则始于 20 世纪 20 年代,公认的开山之作是 1944 年出版的由科学家冯诺依曼和经济学家奥斯卡摩根斯坦恩合著的博弈论与经济行为的理论一书。此时, “博弈论”才作为一个完整的新名词被提了出来。此后,国
2、内外对博弈论有了广泛的研究,博弈论取得了长足的发展。国内方面,关于博弈论的文章、专著不胜枚举,各位学者对“博弈”一词的认识或定义也存在偏差。 按照现代汉语词典的解释, “博”是丰富多彩的意思,而“弈”则指下棋、打牌等对抗性游戏,因而“博弈”就是指丰富多彩的对抗性游戏。在英文中, “博弈”一词是“game”的复数,表示各种各样的游戏。因此,汉语中的“博弈”与英语中的“game”意思完全一致。 “博弈”与“游戏”有这密不可分的联系。 学者王俊冰对“博弈”一词有着不同的理解。他指出:博弈的“博”字是竞争的意思, “弈”是对弈,是一种关于在竞争中选择策略,争取最好结果的技艺。概括来讲,博弈是一种技艺。
3、学者郭磊认为:博弈的基本意思是弈棋,博弈本身是一种游戏,但博弈更强调谋略博弈则可能是一系列策略与行动的组合体,并且是一个由始而终并产生结果的完整过程。可以理解为博弈是一个过程。还有学者认为:博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 二、 “田忌赛马”概述 忌数与齐诸公子驰逐重射。孙子见其马足不甚相远,马有上、中、下辈。于是孙子谓田忌曰:“君弟重射,臣能令君胜。 ”田忌信然之,与王及诸公子逐射千金。及临质,孙子曰:“今以君之下驷彼上驷,取君上驷与彼中驷,取君中驷与彼下驷。
4、”既驰三辈,而田忌一不胜而再胜,卒得王千金。于是忌进孙子于威王。威王问兵法,遂以为师。 ”这是我国“田忌赛马”故事的原型。这个故事可谓是众所周知了,该故事发生在战国时期,齐威王和大将田忌赛马,根据马跑的速度双方各有上、中、下三种等级马各一匹,其中田忌的马比同一等级齐王的马跑得慢,但比齐王低一级的马跑得快。比赛规则为三局两胜制,每局比赛各出一匹马,负者向胜者支付黄金一千,显然相比之下齐王的马占优势。在第一次比赛中,田忌以上等马对齐王的上等马,以中等马对齐王的中等马,以下等马对齐王的下等马,结果连负三局。在第二次比赛中,田忌采纳孙膑的建议,以下马对齐王的上马,以中马对齐王的下马,以上马对齐王的中马
5、,结果胜两局负一局,赢齐王一千金,而自以为胜券在握的齐王反而输掉一千金。 首先要从语言上分析一下这个典故。 “孙子见其马足不甚相远”这一句是前提,否则这个故事就不会发生。我们可以这样理解这句话,即“齐威王和田忌的马根据速度划分各有上、中、下三种等级各一匹,其中田忌的马比同一等级齐王的马跑得慢,但比齐王低一级的马跑得快” 。假如齐威王的马按速度由快到慢分为 A1、A2、A3,田忌的马由快到慢分为 B1、B2、B3,那么这六匹马由快到慢依次是A1、B1、A2、B2、A3、B3。另外,还有一处是学者研究中普遍遗漏的,即“及临质”三个字,这一句起到了至关重要的作用。这句话在这个故事中应该翻译为“等到将
6、要开始比赛的时候” ,那么这句话告诉我们一个什么讯息呢?我认为是说孙膑献计田忌改变马的出场顺序这一情况并不为齐威王所知,这也成就了田忌在第二轮赛马中能够胜出的重要因素。“威王问兵法,遂以为师。 ”这一句也是关键所在,通过这一句话得知,齐威王并不知道自己是怎么输的,所以请教孙膑。假设如果齐威王知道其中玄机的话,那么田忌将必输无疑。以上三点是“田忌赛马”故事得以出现的基本前提。 而我国关于“田忌赛马”博弈论研究的相关论著可谓不少,但鲜有人认真透彻地分析这个故事的原型,殊不知这关系到“田忌赛马”是不是博弈、是怎样的博弈等问题。在以往的文献中,王俊冰在白话博弈论一文中指出“田忌赛马”是一个非合作博弈;
7、詹国枢在博弈处处有,几人能识之中指出“田忌赛马”是博弈论的实际运用,是典型的博弈案例;周瀚光认为“田忌赛马”是一个“二人有限零和博弈” ,但他并没有首先从语言学的角度分析这个故事的前提;此外学者袁国强、和蔚、逯彦彦、郭鹏等等均指出“田忌赛马”是一个博弈,但没有深入分析它到底属于什么类型的博弈,是怎样博弈的等问题。 三“田忌赛马”的博弈论分析 前文分析了该故事的三个前提,一、田忌的每等级的马均次于齐威王同等级的马,但强于齐威王下个等级的马;二、齐威王事先不知道田忌临阵改变了马的出场顺序;三、齐威王不知道改变马出场顺序其中的玄机。本文以下的分析均基于此三前提。 首先要从博弈论定义上理解“田忌赛马”
8、 。很明显, “田忌赛马”确实符合“博弈”的定义,但现在言“田忌赛马”就是博弈还为时尚早。 其次需要分析“田忌赛马”是否具备博弈理论的基本要素。国内学术界对博弈论基本构成要素有分歧,基本分为两派。一派认为博弈论要素有四方面,即博弈的参加者、策略、进行博弈的次序、博弈的信息。但是主张博弈理论四要素这一派内部也有分歧,学者胡静认为博弈理论的第四个构成要素是“博弈方的得益” ,而不是博弈的信息;另一派认为博弈理论具有五方面的要素,即博弈的参加者、策略、进行博弈的次序、博弈的信息、博弈方的得益。可以清晰地看出后者对博弈理论的要素有了一个完整的归纳。那么“田忌赛马”是否具备五个要素呢?齐威王和田忌是博弈
9、的参加者;策略选择按照排列组合来计算共有六种(这里不详细叙述) ;博弈的次序是双方非同时决策,齐威王是先手;博弈的信息是不完全的,齐威王不知道田忌策略的变化;得益是每胜一局有一千金的奖励。通过分析这些要素,我们得出一个结论,即“田忌赛马”是一个完整的博弈。 最后要弄清楚“田忌赛马”到底属于什么类型的博弈。首先要了解一下博弈论的分类情况。 (1)合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。 (2)零和博弈、常和博弈与变和博弈。这是按得益情况划分的,一方得益必来自一方损失,这种博弈是零和博弈。常和博弈又叫非零和博
10、弈,指博弈各方得益之和不为零。变和博弈中各方得益之和不确定,这是最一般的博弈,常和博弈和零和博弈是它的特例。 (3)静态博弈与动态博弈。根据博弈的次序,即参加者策略选择并行动的先后次序博弈可以分为静态博弈和动态博弈。静态博弈指参加者可同时决策并行动的博弈,并不考虑决策的次序问题。动态博弈指参加者先后、依次决策并且后行动者能够观察到先动者所选择的策略和行动。(4)完全信息博弈与不完全信息博弈。在前一种博弈中,每一个参与者都拥有全部的相关信息,只拥有部分相关信息的便属于后一种博弈。博弈理论按照不同的标准基本可分为以上四种情况。 “田忌赛马”这个典故是非合作博弈,也是零和博弈,这在上文中已经提到。同
11、时,依据上文的三个前提,它同时也是一种不完全信息状态下的动态博弈。 四“田忌赛马”博弈的一般扩展式及其序列均衡 上文我们提到“田忌赛马”博弈是非完全信息动态博弈,而这种博弈则是博弈论中最为复杂的模型,也称动态贝叶斯博弈。序列均衡是非完全信息动态博弈的核心概念。 一个动态贝叶斯博弈的扩展式为=N,H,P,I,p,u,其中 N为参与者集合,N=0,1,2,n,0 代表自然。B11H 为全历史集合,即从博弈开始到博弈结束所有可能的行动序列a0,a1,am,m 为任一自然数,表示一个全历史包含的行动次数。P 为参与者函数即对于每一个子历史 h,P(h)将其映射成自然或是其他参与者。I 为信息空间。p
12、为自然的概率分布函数,其表示当自然行动时,自然以多大概率选择某个行动。u 表示参与者的偏好,其定义是在全历史结果上的收益函数。B12 在“田忌赛马”博弈中,参与者集合 N=0,1,2,0 代表自然。H 是全历史集合,表示所有可能的行动序列上中下,上下中,中上下,下上中,下中上,中下上,即共有六个可能的行动。在此博弈中,由于是齐威王先行动,所以无论马出场顺序如何,作为自然的孙膑总是可以帮助田忌,以下等马对上等马,以中等马对下等马,以上等马对中等马(顺序无先后) ,这样如果把三场全胜看做“1”的话,那么田忌总有“2/3”的收益。也就是说田忌有 100%的可能获得 2/3 的收益。齐威王由于过分自信
13、或者智商不高,未能识破此中玄机,所以败下阵来。但在现实生活中,一方的决策是严格保密的,作为自然的“孙膑”并不可能事先知道“齐威王”的决策,而齐威王有六种行动序列,相对应, “田忌”也有六种,我们说过,只有一种情况可以助“田忌”胜出,所以“田忌”获胜的概率仅为 1/6。P 为参与者函数即对于每一个子历史 h,P(h)将其映射成自然或是其他参与者。在此博弈中,假设一个子历史“上中下” ,那么 P(h)作为一个映射将有六种;一共有六个子历史,所以 P(h)应该有 36 种。I 是信息空间。假设 I1 是齐威王的信息空间,I1=上中下,上下中,中上下,下上中,下中上,中下上,I2 同 I1,因为他同样
14、不知道对方的策略。 在“田忌赛马”这个非完全信息动态博弈中,还有一个很重要的因素需要我们注意,即参与者可能临时改变策略,这也更带来了决策的复杂性和不稳定性。因为一场赛马是由三局比赛构成的(非同时进行) ,假设第一局结束后,参与者肯定要根据这一局得结果变换策略,同时也能观察到一部分对方的策略,这么说来,双方获胜的概率就不是齐威王5/6,而田忌 1/6 的概率了,需要更复杂的计算。 客观而言,直到今天理论界也没有找到能适用所有非完全信息动态博弈的均衡概念,也缺乏一个普遍的方法来求解动态博弈的序列均衡。B13 结论 “田忌赛马”博弈不是人们想象中的那么简单的一个博弈,反而是博弈类型中最复杂的非完全信
15、息动态博弈,应该对这个博弈有一个全新的认识。并且,在这个博弈中,至少包含着两个子博弈,这更加剧了此博弈的复杂性。博弈论思想虽然在实际生活中适用性差,但它教会我们一种思考问题的方法,对合理规避风险,获取最大收益还是有指导意义的。 (作者单位:四川大学) 注解 姚国庆:博弈论 ,北京:高等教育出版社,2007 年,第 1 页。 王俊冰:“白话博弈论” , 理论学习 ,2006 年第 6 期,第 63 页。郭磊:“博弈论简论” , 山东经济 ,1999 年第 6 期,第 17 页。 胡静:“博弈论在数学中的应用” , 商情 ,2006 年第 4 期,第213 页。 孙子吴起列传第五 , 史记卷六十五
16、,中华书局,2007 年 4月。 “黄金”在古代是一种货币,不同于现代意义上的黄金;“黄金一千”只一千两黄金的意思。 周翰光:“论孙膑的对策论和辩证法” , 齐鲁学刊 ,1984 年第 3期,第 36 页。 胡静:“博弈论在数学中的应用” , 商情 ,2008 年第 5 期,第213 页。 逯彦彦:“博弈论前瞻探讨” , 商丘职业技术学院学报 ,2009 年第 1 期,第 33 页。 胡静:“博弈论在数学中的应用” , 商情 ,2008 年第 5 期,第213 页。 11“自然”指在动态贝叶斯博弈中参与博弈,无收益,但可以决定不同历史发生概率的参与者。 12 姚国庆:博弈论 ,北京:高等教育出版社,2007 年,第 220页。 13 姚国庆:博弈论 ,北京:高等教育出版社,2007 年,第 218页。