博弈论中的几个经典问题.doc

上传人:99****p 文档编号:1453608 上传时间:2019-02-28 格式:DOC 页数:4 大小:39.50KB
下载 相关 举报
博弈论中的几个经典问题.doc_第1页
第1页 / 共4页
博弈论中的几个经典问题.doc_第2页
第2页 / 共4页
博弈论中的几个经典问题.doc_第3页
第3页 / 共4页
博弈论中的几个经典问题.doc_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

1、几个博弈论中的经典问题博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支, 博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。几个重要的概念1、 策 略 (strategies): 一 局 博 弈 中 , 每 个 局 中 人 都 有 选 择 实 际 可

2、 行 的 完 整 的 行 动 方 案 ,即 方 案 不 是 某 阶 段 的 行 动 方 案 , 而 是 指 导 整 个 行 动 的 一 个 方 案 , 一 个 局 中 人 的 一 个可 行 的 自 始 至 终 全 局 筹 划 的 一 个 行 动 方 案 , 称 为 这 个 局 中 人 的 一 个 策 略 。 如 果 在 一个 博 弈 中 局 中 人 都 总 共 有 有 限 个 策 略 , 则 称 为 “有 限 博 弈 ”, 否 则 称 为 “无 限 博弈 ”。2、 得 失 (payoffs): 一 局 博 弈 结 局 时 的 结 果 称 为 得 失 。 每 个 局 中 人 在 一 局 博 弈

3、结 束 时 的得 失 , 不 仅 与 该 局 中 人 自 身 所 选 择 的 策 略 有 关 , 而 且 与 全 局 中 人 所 取 定 的 一 组 策 略有 关 。 所 以 , 一 局 博 弈 结 束 时 每 个 局 中 人 的 “得 失 ”是 全 体 局 中 人 所 取 定 的 一 组 策略 的 函 数 , 通 常 称 为 支 付 ( payoff) 函 数 。3、 次 序 ( orders) : 各 博 弈 方 的 决 策 有 先 后 之 分 , 且 一 个 博 弈 方 要 作 不 止 一 次 的 决 策选 择 , 就 出 现 了 次 序 问 题 ; 其 他 要 素 相 同 次 序 不

4、同 , 博 弈 就 不 同 。4、 博 弈 涉 及 到 均 衡 : 均 衡 是 平 衡 的 意 思 , 在 经 济 学 中 , 均 衡 意 即 相 关 量 处 于 稳 定 值 。在 供 求 关 系 中 , 某 一 商 品 市 场 如 果 在 某 一 价 格 下 , 想 以 此 价 格 买 此 商 品 的 人 均 能 买到 , 而 想 卖 的 人 均 能 卖 出 , 此 时 我 们 就 说 , 该 商 品 的 供 求 达 到 了 均 衡 。5、 纳 什 均 衡 (Nash Equilibrium): 在 一 策 略 组 合 中 , 所 有 的 参 与 者 面 临 这 样 一 种 情 况 ,当 其

5、 他 人 不 改 变 策 略 时 , 他 此 时 的 策 略 是 最 好 的 。 也 就 是 说 , 此 时 如 果 他 改 变 策 略他 的 支 付 将 会 降 低 。 在 纳 什 均 衡 点 上 , 每 一 个 理 性 的 参 与 者 都 不 会 有 单 独 改 变 策 略的 冲 动 。 纳 什 均 衡 点 存 在 性 证 明 的 前 提 是 “博 弈 均 衡 偶 ”概 念 的 提 出 。 所 谓 “均衡 偶 ”是 在 二 人 零 和 博 弈 中 , 当 局 中 人 A 采 取 其 最 优 策 略 a*,局 中 人 B 也 采 取 其 最优 策 略 b*,如 果 局 中 人 B 仍 采 取

6、 b*,而 局 中 人 A 却 采 取 另 一 种 策 略 a, 那 么 局 中 人A 的 支 付 不 会 超 过 他 采 取 原 来 的 策 略 a*的 支 付 。 这 一 结 果 对 局 中 人 B 亦 是 如 此 。经 典 的 博 弈 问 题1、 “囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(和)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严“,如果两人都坦白则各判年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判年;如果都不坦白则因证据不足各判年。在这个例子里,博弈的参加者就是两个嫌疑犯和,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他

7、们的支付。可能出现的四种情况:和均坦白或均不坦白、坦白不坦白或者坦白不坦白,是博弈的结果。和均坦白是这个博弈的纳什均衡。这是因为,假定选择坦白的话,最好是选择坦白,因为坦白判年而抵赖却要判十年;假定选择抵赖的话,最好还是选择坦白,因为坦白判不被判刑而抵赖确要被判刑年。即是说,不管坦白或抵赖,的最佳选择都是坦白。反过来,同样地,不管是坦白还是抵赖,的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑年。在(坦白、坦白)这个组合中,和都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果和都选择抵赖,各判刑年,显

8、然比都选择坦白各判刑年好得多。当然,和可以在被警察抓到之前订立一个“攻守同盟“,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。2、海盗分金币问题在一座座荒岛上,有 5 个强盗掘出了 100 块非常珍贵的金币。他们商定了一个分配金币的规则:首先抽签决定每个人的次序,排列成强盗一至五。然后由强盗一先提出分配方案,经 5 人表决,如多数人同意,方案就被通过,否则强盗一将被扔入大海喂鲨鱼。如果强盗一被扔入大海,就由强盗二接着提出分配方案,如多数人同意方案就被通过,否则强盗二也要被扔入大海。以下依次类推。假定每个强盗都足够聪明,都能做出理性的选择,那么,强盗一提出什么样的分配方案

9、,能够使自己得到最大的收益?对于这个问题要采用方向推导方法:如果 1 至 3 号强盗都喂了鲨鱼,只剩 4 号和 5 号的话,5 号一定投反对票让 4 号喂鲨鱼,以独吞全部金币。所以,4 号惟有支持 3 号才能保命。3 号知道这一点,就会提出“100,0,0”的分配方案,对 4 号、5 号一毛不拔而将全部金币归为已有,因为他知道 4 号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。不过,2 号推知 3 号的方案,就会提出“98,0,1,1”的方案,即放弃 3 号,而给予4 号和 5 号各一枚金币。由于该方案对于 4 号和 5 号来说比在 3 号分配时更为有利,他们将支持他而不希望他

10、出局而由 3 号来分配。这样,2 号将拿走 98 枚金币。同样,2 号的方案也会被 1 号所洞悉,1 号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃 2 号,而给 3 号一枚金币,同时给 4 号(或 5 号)2枚金币。由于 1 号的这一方案对于 3 号和 4 号(或 5 号)来说,相比 2 号分配时更优,他们将投 1 号的赞成票,再加上 1 号自己的票,1 号的方案可获通过,97 枚金币可轻松落入囊中。这无疑是 1 号能够获取最大收益的方案了!答案是:1 号强盗分给 3 号 1 枚金币,分给 4 号或 5 号强盗 2 枚,自己独得 97 枚。分配方案可写成(97,0

11、,1,2,0)或(97,0,1,0,2)。1 号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。而 5 号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。在“海盗分金”中,任何“分配者”想让自己的方案获得通过的关键是,事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。3、旅行者困境两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来,他们都买了花瓶。提取行李的时候,发现花瓶被摔坏了,于是他们向航空公司索赔。航空公司知道花瓶的价格大概在八九十元的价位浮动,但

12、是不知道两位旅客买的时候的确切价格是多少。于是,航空公司请两位旅客在 100 元以内自己写下花瓶的价格。如果两人写的一样,航空公司将认为他们讲真话,就按照他们写的数额赔偿;如果两人写的不一样,航空公司就认定写得低的旅客讲的是真话,并且原则上按这个低的价格赔偿,同时,航空公司对讲真话的旅客奖励 2 元,对讲假话的旅客罚款 2 元。为了获取最大赔偿而言,本来甲乙双方最好的策略,就是都写 100 元,这样两人都能够获赔 100 元。可是不,甲很聪明,他想:如果我少写 1 元变成 99 元,而乙会写 100 元,这样我将得到 101 元。何乐而不为?所以他准备写 99 元。可是乙更聪明,他算计到甲要算

13、计他写 99 元,于是他准备写 98 元。想不到甲还要更聪明一个层次,估计到乙要写 98 元来坑他,于是他准备写 97 元大家知道,下象棋的时候,不是说要多“看”几步吗,“看”得越远,胜算越大。 你多看两步,我比你更强多看三步,你多看四步,我比你更老谋深算多看五步。在花瓶索赔的例子中,如果两个人都“彻底理性”,都能看透十几步甚至几十步上百步,那么上面那样“精明比赛”的结果,最后落到每个人都只写一两元的地步。事实上,在彻底理性的假设之下,这个博弈唯一的纳什均衡。4、枪手博弈彼此痛恨的甲、乙、丙三个枪手准备决斗。甲枪法最好,十发八中;乙枪法次之,十发六中;丙枪法最差,十发四中。如果三人同时开枪,并

14、且每人只发一枪;第一轮枪战后,谁活下来的机会大一些?一般人认为甲的枪法好,活下来的可能性大一些。但合乎推理的结论是,枪法最糟糕的丙活下来的几率最大。我们来分析一下各个枪手的策略。枪手甲一定要对枪手乙先开枪。因为乙对甲的威胁要比丙对甲的威胁更大,甲应该首先干掉乙,这是甲的最佳策略。同样的道理,枪手乙的最佳策略是第一枪瞄准甲。乙一旦将甲干掉,乙和丙进行对决,乙胜算的概率自然大很多。枪手丙的最佳策略也是先对甲开枪。乙的枪法毕竟比甲差一些,丙先把甲干掉再与乙进行对决,丙的存活概率还是要高一些。我们计算一下三个枪手在上述情况下第一轮枪战中的存活几率:甲:24%(被乙丙合射 40% X 60% = 24%

15、)乙:20%(被甲射 100% - 80% = 20%)丙:100%(无人射丙)第二轮枪战中甲乙丙存活的几率粗算如下:(1) 假设甲丙对决:甲的存活率为 60%,丙的存活率为 20%。(2) 假设乙丙对决:乙的存活率为 60%,丙的存活率为 40%。第一轮:甲射乙,乙射甲,丙射甲。甲的活率为 24%(40% X 60%),乙的活率为 20%(100% - 80%),丙的活率为 100%(无人射丙)。第二轮:情况 1:甲活乙死(24% X 80% = 19.2%)甲射丙,丙射甲甲的活率为 60%,丙的活率为 20%。情况 2:乙活甲死(20% X 76% = 15.2%)乙射丙,丙射乙乙的活率为

16、 60%,丙的活率为 40%。情况 3:甲乙皆活(24% X 20% = 4.8%)重复第一轮。情况 4:甲乙皆死(76% X 80% = 60.8%)枪战结束。甲的活率为 12.672%(19.2% X 60%) + (4.8% X 24%) = 12.672%乙的活率为 10.08%(15.2% X 60%) + (4.8% X 20%) = 10.08%丙的活率为 75.52%(19.2% X 20%) + (15.2% X 40%) + (4.8% X 100%) + (60.8% X 100%) = 75.52%通过对两轮枪战的详细概率计算,我们仍然发现枪法最差的丙存活的几率最大,枪法较好的甲和乙的存活几率仍远低于丙的存活几率。对于这样的例子,有人会发出“英雄创造历史,庸人繁衍子孙”的感叹。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 课件讲义

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。