1、管 理 运 筹 学 1第十五章 对策论1 对策论的基本概念2 矩阵对策的最优纯策略3 矩阵对策的混合策略4 其他类型的对策论简介管 理 运 筹 学 2 在竞争过程的各方为了达到自己的目标和利益,必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案,也就是说要研究采取对抗其他竞争者的策略,这就是对策问题, 对策就是决策者在竞争场合下作出的决策。 对策论是研究对策的理论与方法,也叫博弈论。 所谓 博弈 是指局中人按一定规则,在充分考虑其他局中人可能采取的策略的基础上,从自己的策略集中选取相应策略,并从中得到回报的过程。管 理 运 筹 学 3第十五章 对策论由 “齐王赛马 ”引
2、入管 理 运 筹 学 41 对策论的基本概念对策模型的三个基本要素:1.局中人 :参与对抗的各方,可以是一个人,也可以是一个集团,可以是两方,也可以是多方;2.策略集:局中人选择对付其它局中人的行动方案称为 策略;某局中人的所有可能策略全体称为 策略集 ;3.一局势对策的益损值:局中人各自使用一个对策就形成了一个局势 ,一个局势决定了各局中人的对策结果(量化)称为该局势对策的 益损值 。管 理 运 筹 学 5出赛的次序是一个策略“齐王赛马 ”齐王在各局势中的益损值表(单位:千金)1 对策论的基本概念管 理 运 筹 学 6其中:齐王的策略集 : S1= 1, 2, 3, 4, 5, 6 ,田忌的
3、策略集: S2= 1, 2, 3, 4, 5, 6 。下面矩阵称齐王的 赢得矩阵 :3 1 1 1 -1 11 3 1 1 1 -1A= 1 -1 3 1 1 1-1 1 1 3 1 11 1 1 -1 3 11 1 -1 1 1 3 1 对策论的基本概念管 理 运 筹 学 7二人有限零和对策 (又称 矩阵对策 ):局中人为 2;每个局中人的策略集的策略数目都是 有限 的;每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的 益损值之和为零 。通常将矩阵对策记为 : G = S1, S2, AS1:甲的策略集; S2:乙的策略集;A: 甲的赢得矩阵。“齐王赛马 ”是一个矩阵策略。1 对
4、策论的基本概念管 理 运 筹 学 8在甲方的赢得矩阵中:A=aijmni 行代表甲方策略 i=1, 2, , m ; j 列代表乙方策略 j=1, 2, , n ; aij 代表甲方取策略 i, 乙方取策略 j, 这一局势下甲方的益损值。此时乙方的益损值为 -aij(零和性质)。在考虑各方采用的策略时,必须注意一个前提,就是双方都是理智的,即双方都是从各自可能出现的最不利的情形选择一种最为有利的情况作为决策的依据。2 矩阵对策的最优纯策略2 矩阵对策的最优纯策略管 理 运 筹 学 9 在矩阵博弈 A中, aij表示局中人 1的收益,因此,局中人 1希望收益值 aij越大越好;同时 aij表示局
5、中人 2的支付或付出(局中人 2的收益为 - aij ),因此局中人 2则希望付出的 aij越小越好。因此,矩阵博弈完全是对抗的。 一般地,如果局中人 1采用他的第 i个策略,则局中人 2会选择策略使局中人 1的收益最小,即 这就是支付矩阵第 i行元素中的最小元素。 局中人 1不存在侥幸心理,不冒险,而又追求收益越大越好,因此,他会从各行的最小元素中选择最大的,从而确定自己的策略。 这就是说,局中人 1可以选择 i,使他得到的支付不少于 (能够稳妥地保证得到该收益)管 理 运 筹 学 10 同样,如果局中人 2采用他的第 j个策略,由于局中人 1希望自己的收益值(局中人 2的支付)越大越好,即局中人 1会选择策略使局中人 2的支付最大, 由于局中人 2希望自己的支付越小越好,因此,他会从支付最大中选择最小。 这就是说,局中人 2可以选择 j,保证他失去的不大于