ImageVerifierCode 换一换
格式:PPT , 页数:44 ,大小:427.50KB ,
资源ID:448671      下载积分:12 文钱
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,省得不是一点点
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.wenke99.com/d-448671.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(对策论(一)-HomeforComplexSystemsResearchCenter.ppt)为本站会员(ga****84)主动上传,文客久久仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知文客久久(发送邮件至hr@wenke99.com或直接QQ联系客服),我们立即给予删除!

对策论(一)-HomeforComplexSystemsResearchCenter.ppt

1、对策论(一),刘志新 2003.10.21,主要内容,1.基本概念2.二人零和有限对策3.二人非零和有限对策4.二人零和无限对策,基本概念,1.对策论2.局中人:决策的主体3.支付:局中人从对策中获得的利益4.行动:局中人在某时点上的决策变量5.战略:局中人的行动规则6.支付函数,基本概念,7.合作对策&非合作对策8.两人对策&多人对策9.零和对策&常和对策&变和对策10.静态对策&动态对策&重复对策11.完全信息对策&不完全信息对策,一个例子,囚徒困境,研究对策论常用的两种模型,(一)展开型(二)正规型,展开型对策,例:,展开型对策,定义1:有n个局中人的对策树是指具有以下性质的三元组 ,使

2、得: 为树,且 为一映射, 为局中人的集合 为一映射,展开型对策,定义2:设 为对策树,称 为由 产生的n人对策,对策 也称为展开型对策.定义3:在对策 中,设有策略组 使对于任何的 及 均有: ,则称 为对策 的一个平衡点.,展开型对策,定理:设 为对策树,则 有一个平衡点,正规型对策,定义1:给定三元组 其中 均为集合,而 是定义在 上的实值函数,则称 为一个对策.定义2:若有策略 ,使 称 为甲的保守策略.,正规型对策,定义3:若有 满足: 则称策略对 为对策的非合作平衡解.定义4:对于对策对 ,若不存在策略对 ,同时有 , 则称为对策的Pareto最优,二人零和有限对策,策略的表示:(

3、矩阵),二人零和有限对策,保守解策略是如下的策略 ,一般的,二人零和有限对策,我们希望 定义:在二人零和有限对策 中,若甲的支付函数为 ,设有值 则称对策 有鞍点,公共值 称为对策的值,相应的策略对 为对策的鞍点.,二人零和有限对策,有些时候鞍点是不存在的.例:,混合策略,引入混合策略记考虑期望收益,定义:对于 , 若有策略对 满足 , 其中 ,则称 为 的鞍点.,混合对策的存在性定理,定理:设 都是紧的,且 上连续,对于 ,有(方法1:用凸集分离定理 方法2:用Kakutani不动点原理 方法3: ),优策略,定义:对于值为 而支付函数为 的对策,凡使 的策略 称为甲的优策略.而使 的策略

4、称为乙的优策略.,优策略的性质,性质1:每个局中人的优策略集是一个凸集.性质2:若 是乙的优策略,并设 则对甲的任何优策略 ,必有: 其中 表示甲取策略 ,乙取策略 时的支付.,优策略的性质,性质3:设 为对策值, 为甲的任何优策略,有若对某个 ,有 则对乙的任何优策略 必有性质4:设 为对策值,若对乙的任何优策略 有 则甲必有一个优策略 ,使得:,优策略的性质,性质5:若矩阵 可写作分块矩阵 若 中的每一列严格超出 中列的凸组合,又设 中的每一行严格的被 中行的某个凸组合超出,则 , , 均可删去而不影响甲乙的优策略集.,优策略的计算,定理:设对策值为 , 支付矩阵为 的对策 其优策略 为端

5、点优策略的充要条件是存在 的子方阵 ,使得: 式中 表示 的伴随矩阵.,优策略的计算,例: 可取 可得:,二人一般和有限对策,双矩阵对策:定义:在对策 中,若有策略对 ,使得: 则称 为 的一个非合作平衡点,存在性定理,定理:对每个双矩阵对策 至少存在一个非合作平衡点. 对 作改进:,判断平衡点,为平衡点,平衡点的Lemke_Howson算法,定理:当对策 为非退化时,对策肯定存在平衡点. (矩阵A非退化是指: 每个方 子阵都是非奇异的(除去最后的零矩阵),平衡点的Lemke_Howson算法,例: 选取,谈判问题,可行集谈判的基点(各自的保守收益)谈判的结果找 ,使得双方都满意即存在映射 ,

6、使得 .,Nash的谈判公理体系,公理1(个体合理性):公理2(可行性):公理3(Pareto最优性)若 且 则 .公理4(无关方案的独立性):若 , 且 ,则 .,Nash的谈判公理体系,公理5(线性变换的无关性)设T是由S经如下线性变换 而得到的,如果 则必有 其中 为正常数, 为常数.公理6(对称性) :若S是对称的,即若 有 ,且若 ,则有 .,谈判定理,定理:对于所有的谈判问题 ,存在唯一的满足以上公理的 .,“恐吓”问题,考虑以下的双矩阵对策: 都有独立的恐吓策略,谈判的基点:,二人零和无限对策,问题的描述:定义:在二人零和无限对策中,若存在 使得对所有 都成立 ,则称 ( ) 为

7、鞍点. 在无限对策中,鞍点不一定存在.,定义:在对策 ,点 称为 鞍点,若下式对任意的 都成立,鞍点,无限对策中的混合扩张,定义: :集合X的子集的 代数 y:集合Y的子集的 代数 : ,y上所有的概率测度组成的集合 称 为对策 的混合扩张, 其中,混合扩张的平衡点,定义: 为二人零和无限对对策, 为对策的混合扩张,若存在 使得对所有的 都有: 称 为对策的混合扩张的平衡点.,具连续支付函数的对策,定理:二人零和无限对策 中,X,Y为紧集,H为一连续函数,则存在混合策略对 使得 对任意的 都成立.此时有,凸策略与凹策略,定义:设X,Y为紧集,并且Y为凸集,支付函数 是连续的,且对任意固定的 ,H(x,y)关于y是凸的,则对策 称为凸对策.当X为凸集,支付函数H是连续的,且对任意固定的 ,H(x,y)关于x是凹的,则称对策为凹对策,凸策略与凹策略,定理:设对策 为凸对策,则对局中人来说都存在一个最优存策略,且策略的值为 .,Thank You,

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。