1、 博弈论考试1、完全信息静态博弈1“老师点名和学生逃课”的案例构建如下模型: 老师点名 不点名学生 逃课 a1,b1 a2,b2不逃课 a3,b3 a4,b4结果:(1)老师每次点名,学生每次不逃课a3 a1 ,b3 b4 ,a2 a2 , b4 b3 , a1 a4 , b1 b2 , b3 a4 , b2 b1 , a3c,采用激进激进纯战略纳什均衡当 ac/2 时,太过于激进,收益反而下降,所以运动员在竞争时,尽力是好的,但过度激进,比如服用兴奋剂,反而会使运动生涯过早的结束。(2)卖假烟 卖假烟者 A限量 过量卖假烟者 B 限量 a,a 0,2a过量 2a,0 a-c,a-cC 指损失
2、,a 指卖假烟的收益,分析照上面,当 P=a/c 时为均衡点现在山寨是很流行的,卖假烟在一定程度上不能认为是违法行为的,有时可以缓解经济压力、充面子等,当然这只限于假烟的销量控制在一定范围内,如果过量造成假烟泛滥,则会使市场变得混乱,收益反而会下降,而贩卖假烟本身也可能因此坐牢,这是危害社会和个人的事情。(3)腾讯 QQ 和 360 之间的竞争QQ(退)和平相处 过度竞争(进)PA360 和平相处 PB 0,0 2,0过度竞争 2,0 -3,-3E(B 退)=P(A 进)*0+P(A 退)*0 E(B 进)=P(A 进)*-3+ P(A 退)*-2当两者相等时,得出 P(A 进)=0.6 P(
3、A 退)=0.4P(B 进)=0.6 P(B 退)=0.6两者都选择和平共处时是(0,0) ,然而当它们都为自己的利益而过度竞争,相互斗争时,收益反而下降,它们的用户大量减少,这是双方都受损的情况,因而过度反而是不对的。(4)对美国“9.11”事件的态度官员 A鹰 鸽官员 B 鹰 2,2 10,0鸽 0,10 5,5最好的是自己选择鹰战略,对方选择鸽战略鸽派立足美国自身做出反思,主张从自身寻找消除恐怖主义的途径,在国际关系中奉行多边合作,促进美国发展;但鹰派相反,更加强硬,主张先发制人消除威胁,如伊拉克战争等。可鹰派的行为并未使自身安全,他们的盟友如英国、埃及惨遭打击,他们的过激行为反而阻碍了
4、美国前进。“租值消散”理论指无主的、没有归属的收入,在竞争下会消散,在边际上会下降为 0,如公海没有业主,钓鱼不收费,他的边际租值为 0.中国巨额的土地红利往往会带来巨大的竞争竞争人 A a 指土地红利合作 竞争 c 指过度竞争带来的损失竞争人 B 合作 a,a 0,2a 分析可照上面竞争 2a,0 a-c,a-c他们都是对自身利益最大化的追求,因而选择(竞争,竞争)概率很大,当过度竞争时,往往会造成贪污腐败,土地减产,价值下跌,暗箱操作等不良问题,反而使自己的投入得不到回报对于中国土地红利,我个人认为中国国民消费过于保守,投资理念始终停留在对国有银行的存款利息,从根本上让房产投资者土地升值。
5、我想正是因为它的巨大红利才会造成对土地竞争者的泛滥,供小于求,使得总收益下降,只有少部分获利,贫富差距拉大,妨碍了土地的整合和规模经济,而同时土地红利会造成资源的过度使用甚至是浪费。3、石头、剪子、布假设 A、B 两人玩“石头、剪子、布”的游戏, A 是说准备出石头的人,但是这并不可信。因此两个人所出的仍然是随机的,可作如下标准式收益矩阵。B石头 剪刀 布石头 0,0 1,-1 -1,1剪刀 -1,1 0,0 1,-1 A布 1,-1 -1,1 0,0既然 A 说会出石头,他认为 B 受其影响极可能出 “布” ,则自己最好出“剪刀” ,理性个人 B 预料到 A 会这么想,因此出“石头” 最有利
6、,并且 A 出布的可能性很小;况且如果他真的出石头,而自己再出剪刀岂不是自投罗网,显得“很没面子” ,所以出剪刀的可能性最小。如果我是 A,实际上我会出“布” ,因为根据以上分析, B 最可能出石头,而我出“布”的胜算最大,我认为言语在利益对立的博弈中能起作用。例子:抛硬币。甲乙可自行绝对所抛出的硬币为正面还是反面,若方向相同,则甲胜;若方向相反,则乙胜。收益矩阵如图所示:乙正 反正 1,-1 -1,1 甲反 -1,1 1,-1如果甲说他准备出“正” ,理论上乙的最优仅在是出“反” , “正”的概率各位1/2,与甲不说时相同。但实际上,言语对参与者而言打了一场心理战,甲认为乙会受影响而出“反”
7、 ,他实际上很可能出“反” ,乙也会意识到这点,因此他出“正”的概率反而会比“反”大。所以我认为言语能在利益对立的博弈中起作用。同样正如“石头、剪子、布”的游戏,A 说会出石头,同样 A、B 两人因为这句话而打起了心理战。4、 “万元陷阱”“万元陷阱”是竞拍者利用人们对巨大利益追求的心理而从中获利的手段,(参与者都是自愿的) ,一旦参与者选择参与,多人竞争会使他们的喊价不断工作,组后则是鹬蚌相争,渔人得利。参与者如果想要赢利,应该把握以下准则:1 确定投入的极限及预先的约定,譬如投资多少钱或是多少时间?2 要坚持到底(止损原则)3 自己打定注意,不必看别人 4 保持良好的心态 5 别指望能以很
8、低的价格买入 6 不要随波逐流,有自己的主见和底线。7 尽快传递“势在必得”的信号 8 合作,与他人共享,打倒其余的竞拍者。具体事例:1 如现实生活中购买彩票,抽奖活动,赌马,赌球,股票等,这些都是所谓的“万元陷阱” 。这些活动利用了人们追求巨大利益的心理,他们为此都不断投入精力去做,但最终不一定会有等价的回报,他们通常有两种动机:经济上和人际关系上。想赢回自己的损失,有时却会导致更大的损失,而另一方面为了挽回失败的面子,证明自己。2 学校设立的期末奖项评比,也可看作是“万元陷阱” ,为此学生想得奖来证明自己的能力,要付出很大的精力来学习,但是奖项是有限的、困难的,最终不一定会有所收获。3 企
9、业的年终奖金评比,企业为了调动员工们的工作积极性,以年终奖来诱惑他们,员工们就陷入一种“万元陷阱”中,将不断投入精力去争取。因此止损策略是十分重要的,它既要求我们不要无止境地把精力投放在某件事上,反而会得不偿失;又同时要求我们学会坚持到底,在确定极限后,不轻易更改,这样你就能获得最后的胜利,因此它教会我们有张有弛。同时跟谁博弈比“怎么博弈”更加重要, “万元陷阱”中更理性的一方恰恰是损失更大的一方,虽然自己理性地选择,但是对象是属于“不理性”的,那么你最终反而会失利。在选择竞争对手时,也要兼顾他与自己的比较,同样不能过于理性,有时要打定注意,坚持到底。5、征税博弈理解:首先做一个关于征税博弈的
10、收益树状图A 百姓养鱼 不养鱼重税 B B 政府(-2,10) (4,4) (0,0) (0,0)轻税若政府事后违约,百姓即使养鱼仍收重税,那么百姓的实际收益反而下降,这是因为政府是强势的一方,没有关在笼子里,所以认为能建立有效的机制,把他们关在笼子里,才能增加百姓收入,建立和谐社会。建一个收益矩阵 甲养鱼 不养鱼乙 养鱼 2,2 0,1不养鱼 1,0 5,5此时有两个均衡点,但在都不养鱼的时候,是革命胜利的收益,但如果(不养鱼,不养鱼) ,可能会有损失的风险,往往会达成(养鱼,养鱼)的均衡,这样就革命失败了,没有完成把统治者关进笼子里的想法。囚徒困境 A认罪 不认罪B 认罪 10 年,10
11、年 0,20不认罪 20,0 1,1他们都是从自我利益出发,A 会想假定 B 认罪,他不认罪要判 20 年,B 不认罪,他不认罪要判 1 年,综上认罪比不认罪要好,他们两人都这么想,结果得到一个相对较劣的结果。在希望把统治者关进笼子里时,不同的人都从自己的利益出发,不愿直接和统治者相抗衡,想等其他人革命而暗中得利,但每个人都是这么想的,因而无法实现把统治者关进笼子里的愿望。同时要注意是否可行,比如给猫挂铃铛的故事,老鼠们为了反抗统治者相出这么个自认为可行的方法,但这是个人利益最大化和集体利益最大化的矛盾。如何做:1 统治者获胜的关键在于他能离间所有人之间的关系,也就是如果想推翻他,就要学会团结
12、,认识到统治者在损害自身利益,全体集中反抗。2 猫本身是一个暴者,统治者在危害人民利益,因而可从笼子方面着手,建立有效的法律机制,人质机制,让政府守信。3 人民掌握监督权,统治者只享受有限的权力,减少腐败的可能迫使统治者关注人民的利益,对人民负责。4 关注贫富差距,统治者在征税时要区别富人和穷人的征税额度。5 健全福利保障。6 雇主与雇员的监督博弈(1) 记雇主检查的概率为 P,雇员偷懒的概率为 qY 主检查= (-C+F)*q+(V-W-C)*(1-q)Y 主不检查=-W*q+(V-W)*(1-q)当 Y 主检查=Y 主不检查时,得出 q=C/(W+F)Y 员偷=-F*P+W*(1-P) ,
13、 Y 员不偷= ( W-H)*P+(W-H)*(1-P)当 Y 员偷=Y 员不偷时,P=H/(W+F)(2)由上可知,在混合战略纳什均衡时,雇主 Y 检查 =Y 不检查所以 Y 主=P*Y 检查+ (1-P )*Y 不检查=Y 不检查=V-W-q*V=V-W-CV/(W+F)(Y 主) , =-1+CV/(W+F) 2当 Y 主 , =0 时,W=(VC) 1/2-F所以综上,W=(VC) 1/2-F 时,雇主的期望收益是最大的。(3) 与不能没收雇员的抵押金 F 相比,雇主检查的概率与雇员偷懒的概率 q 都下降了,因为当没收抵押金时,雇员偷懒所造成的经济损失增加,就不敢偷懒,而雇主也知道雇员
14、不敢偷懒,自然检查也就松懈了。(4) 怎样建立信任机制:他们可以通过增加工资,改善工作环境,完善员工的福利保障制度,增加年终奖金,多与下属员工进行良好的平等沟通,密切关系等。(5)是,应禁止收取抵押金。因为收取抵押金不利于创造和谐的工作环境,甚至影响雇主和员工之间的关系,会在一定程度上带给员工内心的恐惧与不安全感,这是不符合社会福利最大化标准的。并且根据计算,雇主得到最大利益时,收取抵押金 Y 员=(VC) 1/2-F-H,不收取时为 Y 员=(VC ) 1/2-H,可见雇员的工资收益也有所降低。7 合法伤害权的价值具有合法伤害权的是处于博弈的优势方,不具有合法伤害权的处于博弈的劣势方。权力越
15、大,越能带来巨大的经济利益,对自己越有利。以上述例子作一个收益矩阵:设贪污的钱为 A,检查成本为 B,C 为贪污后的处罚成本,设贪污的概率为 P,检查的概率为 Q。贪污 P 不贪污 1-PQ 检查 (C+A-B,-C) (-B,0)1-Q 不检查 (-A,A) (0,0)Y 查=(C+A-B)*P+(-P)*(-B)=-A*P即 P=B/(2A+C)-C*Q+(1-Q)*A =0, P=A/(A+C)当贪污的 P 大于 B/2A 时,检查时最优选择。上述例子中,得益的都是贪污的人,打 1 拳代表的是官权,只要有权,不行使也能得利,如新闻中局长付德武要求他的弟弟将罪名全部承担,而弟弟迫于贪官的权
16、力而被迫承担下来。贪官可以利用自己的权力采用“双规”手段对付别人,使自己得利,博弈双方是权力者和无权力者,而这个权力就是迫使别人低头用的,有能力压迫别人做某事,但不一定真的耍手段,他要压迫别人,只要有这个权力即可,这就是均衡。在这里博弈是多重的,各种利益的博弈,规则与人性的博弈,个体与规则的博弈,贪官为了追求更大的利益而运用合法伤害权,同时摒弃了规则与人性,在一种潜规则下与人达成了均衡,它的本质是为了谋利,当一方具有合法伤害别人的权力时,他会充分利用来达到使自己收益最大化的目的,而他们贿赂贪官,除了想得利,也是希望他们不迫害自己。8For Whom the Bell Tolls枪打出头鸟的收益
17、矩阵,分为甲乙造反、不造反甲造反 不造反乙 造反 (-1,-1)或(1,1) (-1,-1)不造反 (1,1) (-2,-2)从收益矩阵中可以看出(不造反,不造反)是均衡点,可造反的人若是失败,则收益为负;若是成功,躲在后面的人也会跟着得利,造反的人不论是哪种情况,都是没有好处的。因为理性群体哦都市向往自身利益最大化,他们绝不愿未出力的人跟着得益,因而最终得到均衡点(不造反,不造反) ,所以说“枪打出头鸟” ,哪些率先造反的人往往要做出很大牺牲。也可以做一个猎人和鸟的收益矩阵,更清晰地表示“枪打出头鸟” 。鸟 鸟出头 不出头猎人 打 (0,0) (-10,-10)不打 (0,10) (5,5)
18、所以猎人在鸟出头的时候最好的决策就是打,猎人指的是“暴政者” ,出头的鸟指“造反的人” 。躲在后面的鸟仍然要付出代价。出头鸟为前瞻者,追随者为前瞻者,前者没有积累足够的经验,损失很大;而后者为了前者的铺垫,懂得如何规避,所以他们得到很大的利益,但不能说他们就没有损失。躲在后面的鸟就是不造反的人,在反对压迫者时只要大多数人同时行动,很容易成功,但有人躲在后面,意味着造反的人要付出很大的代价,同时意味着造反很可能失败,那么躲在后面的人仍然要受剥削者的压迫,集体的利益受到损害,个人利益也会受到牵连。枪打出头鸟的经典案例:智猪博弈,是多劳不多得小猪行动 等待大猪 行动 5,1 4,4等待 9,-1 0,0从矩阵中可以看出小猪的占优策略是等待,而大猪是行动,却分了部分利益给小猪,这是一种“搭便车”的行为。而躲在后面的鸟会有两种情况,一种出头鸟成功,后人得益;另一种出头鸟失败了,后面的人不得不再次面对出不出头的困境,并继续深受暴政者的压迫。