囚徒困境在博弈演化中的自适应行为研究【毕业设计】.doc

上传人:一*** 文档编号:22906 上传时间:2018-04-30 格式:DOC 页数:17 大小:406.66KB
下载 相关 举报
囚徒困境在博弈演化中的自适应行为研究【毕业设计】.doc_第1页
第1页 / 共17页
囚徒困境在博弈演化中的自适应行为研究【毕业设计】.doc_第2页
第2页 / 共17页
囚徒困境在博弈演化中的自适应行为研究【毕业设计】.doc_第3页
第3页 / 共17页
囚徒困境在博弈演化中的自适应行为研究【毕业设计】.doc_第4页
第4页 / 共17页
囚徒困境在博弈演化中的自适应行为研究【毕业设计】.doc_第5页
第5页 / 共17页
点击查看更多>>
资源描述

1、本科毕业设计(20届)囚徒困境在博弈演化中的自适应行为研究所在学院专业班级理论物理学生姓名学号指导教师职称完成日期年月I摘要【摘要】演化博弈论是把博弈理论分析和动态演化过程分析结合起来的一种理论,强调的是一种演化的动态稳定。演化博弈能够更真实地反映行为主体的多样性和复杂性。由于复杂系统中的个体具有自适应性,即个体能够依据环境变化进行自我反馈调节,而在20世纪末出现的复杂网络能对复杂系统进行刻画和描述,成为复杂系统研究的重要方法。本篇论文中,我们把演化博弈与复杂网络相结合,通过借助经典的囚徒困境模型来研究博弈个体的自适应行为。通过MONTECARLO模拟结果表明通过引入“信誉”的作用,即实施奖惩

2、措施能提高系统的合作水平。【关键词】囚徒困境;演化博弈;自适应行为。ABSTRACT【ABSTRACT】EVOLUTIONARYGAMETHEORYISACOMBINATIONOFGAMETHEORYANDDYNAMICEVOLUTIONTHEORYEVOLUTIONARYGAMETHEORYCANREFLECTTHEDIVERSITYANDCOMPLEXITYOFTHEPLAYERBETTERCOMPAREDTOTHECLASSICGAMETHEORYTHECOMPLEXNETWORKSWHICHAPPEAREDINTHEENDOF20THCENTURY,CANDESCRIBETHESTRU

3、CTURECHANGEOFTHECOMPLEXSYSTEMWELL,ANDITBECOMEAUSEFULTOOLTOSTUDYTHECOMPLEXSTRUCTUREOFCOMPLEXNETWORKSINTHISTHESIS,BASEDONEVOLUTIONARYGAMETHEORYANDCOMPLEXNETWORKTHEORY,WESTUDYTHEADAPTIVEBEHAVIOROFTHEPLAYERSBYADOPTINGTHEPRISONERSDILEMMAGAMETHEORYASAMETAPHORITISFOUNDTHATWHENTHEREPUTATIONINTRODUCED,THECOO

4、PERATIONINCREASESOBVIOUSLY【KEYWORDS】EVOLUTIONARYGAMETHEORY;PRISONERSDILEMMA;ADAPTIVEBEHAVIORII目录摘要IABSTRACTI目录II1绪论111演化博弈理论及囚徒困境1111博弈论概述1112“囚徒困境”模型1113传统博弈论的局限3114演化博弈论312复杂网络4121规则网络4122随机网络5123小世界网络6124无标度网络62囚徒困境博弈在随机网络中的演化721复杂系统及合作现象722合作的演化7221均匀混合体系中的合作演化723囚徒困境在随机网络中的演化924引入信用的作用后合作的演化103

5、模拟结果的分析与讨论104总结与展望13参考文献14致谢错误未定义书签。附录错误未定义书签。1绪论11演化博弈理论及囚徒困境111博弈论概述经典博弈论是研究依据其他参与者的效用情况,理性参与者策略之间相互作用的一门科学。博弈的思想自古就有,但是真正的博弈论开始于20世纪20年代。1928年,冯诺依曼证明了博弈论的基本原理,宣告了博弈论的诞生。1944年,冯诺依曼和摩根斯坦的论著博弈论与经济行为将二人博弈推广到多人博弈的情形,奠定了博弈理论的基础,并形成理论体系。1950年至1951年,约翰福布斯纳什在他的两篇开创性的论文N人博弈的均衡点,非合作博弈中给出了纳什均衡概念,利用不动点定理证明了均衡

6、点的存在,这个均衡点又叫纳什均衡点。纳什均衡理论为博弈论的数学化和一般化奠定了坚实的基础。此外,些其他的科学家比如赛尔顿、哈桑尼也对博弈论的发展起到很大的推动作用。如今,博弈论已经成为一门比较完善的学科。博弈论的要素有两点参与博弈者的目标或利益的相互冲突,以及博弈者为理性人。博弈论就是想表明在所有参与博弈的博弈个体都想获胜或者希望自己的收益最大化的情况下,博弈个体可以通过借助博弈理论分析计算后找到一种最优策略,即最好的办法。博弈的结果不仅取决于参与博弈的博弈个体自身的策略,同时也取决于其他所有参加博弈的博弈个体的策略。112“囚徒困境”模型“囚徒困境”是博弈论中一个非常著名的例子,它是由美国普

7、林斯顿数学家阿尔伯特塔克在1950年提出来的,它的提出奠定了非合作博弈论的理论基础1。曼昆的经济学原理中说囚徒困境,两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是非常困难的。2图11“囚徒困境”示意图资料来源WKHAROLDEDITOR,1997,CLASSICSINGAMETHEORY,PRINCETON,NJPRINCETONUNIVERSITYPRESS具体的“囚徒困境”模型说的是,两个犯罪嫌疑人甲和乙作案后被抓后,分别被警察关在不同的屋子里审讯。警察告诫他们如果他们两个人都认罪,各判3年如果两个人都保持沉默,各判1年可能是由于证据不足如果其中一个认罪

8、另一个沉默,认罪的放出去,不认罪的判刑5年。甲沉默甲认罪乙沉默二人同服刑1年乙服刑5年,甲即时获释乙认罪甲服刑5年,乙即时获释二人同服刑3年图12惩罚表格示意图图12中的表格给出了“囚徒困境”博弈矩阵。这里,每个囚徒有两种策略沉默或认罪。在这个模型中,如果甲沉默,那么乙认罪比沉默所获的罪刑少;如果甲认罪,那么乙还是认罪获刑比沉默获刑较少。也就是说无论甲做出什么样的选择,对于乙来说他的最优策略是认罪。同样的,对于甲来说他的最优策略也是认罪。也就是说在这个“囚徒困境”博弈中,双方都认罪是纳什均衡。从“囚徒困境”博弈中我们很容易发现,如果两个人都沉默,各判一年,比两个人都认罪,各判3年好。但是由于他

9、们都从自身的利益处分,所以并没有选择对双方都有利的策略。所以,“囚徒3困境”模型反映了个体理性与集体理性的矛盾。在讨论囚徒困境时,我们经常把单独背叛成功所得令为T(TEMPTATION背叛诱惑);共同合作所得令为R(REWARD合作报酬);共同背叛所得(PUNISHMENT背叛惩罚);被单独背叛所获(SUCKERS受骗支付)。并且有TRPS,以及2RTS。在单轮博弈中,博弈个体都背叛是纳什均衡。但是重复博弈的结果将会跟单轮博弈的不同,因为在重复囚徒困境中,两个个体间的博弈可以多次重复进行,所以博弈个体将会有机会对前面背叛他的个体实施惩罚,这样欺骗的动机可以被可能受到惩罚的威胁所克服,从而提高整

10、体的合作水平。113传统博弈论的局限在传统或者经典博弈论中,所有的博弈参与者都是完全理性的,也就是所有参与者的策略组合以及相应的利益将会作为一种常识。某件事成为常识,并非像我们日常生活中理解的那样,只要所有的人知道就可以了。在博弈论中,常识就意味着你知道,他也知道,你知道他知道,他也知道你也知道。某事成为常识需要信息充分地交流,但是要实现还是不是想象中的那么简单。但是在现实生活中,人们做一件事或做一个决定并不是当作单独博弈进行的,他可能会考虑长远的利益,也会受个人的习惯、信仰、理念影响,还会受社会道德、伦理等很多因素的影响。并且在博弈时,博弈参与者们所得到的信息也是不对等的,也就是由于知识背景

11、、信息收集掌握程度等一系列原因,他们可能做出不同的判断。所以说传统博弈论是将博弈规则简单化、抽象化后想成的一种理论。这种理论在分析情况比较简单的博弈时效果还是不错的,但是要分析复杂问题时,比如生物学、经济学等领域的问题可能就会太过简化而与现实背离。114演化博弈论演化博弈理论思想是源自于生物学家对生态现象的解释,生态学家发现在很多情况下动植物的进化结果都可以用博弈论的纳什均衡来解释。在经典博弈中都是假定博弈个体是充分理性的,但是生物不具有理性,生态的演化是基于达尔文的“优胜劣汰”环境选择进化理论。这种巧合意味着我们可以假定博弈者并不是是充分理性的。1973年至1974年,生态学家斯密斯(MAY

12、NARDSMITH)和普瑞斯(PRICE)提出了演化稳定策略(EVOLUTIONARILYSTABLESTRATEGYESS)标志着演化博弈理论的诞生。斯密斯和普瑞斯没有假定生物体是充分理性的,而是假定生物体是有限理性的,生物的演化就是生物体间相互竞争,并且根据环境实现自身进化的过程。他们的工作使人们对经典博弈中理性的认识更加深入,此后,演化博弈理论又经过其他一些科学家的发展,比如萨缪尔森、克瑞斯曼等,现在演化博弈理论已经成为体系,也相对完善,并且在分析解决经济等各种问题中起到了重大作用。4一般的演化博弈理论是把随着时间变化的某一种群作为研究对象的,把试图理解种群演化的动态过程,并解释为何这一

13、种群会达到这一状态以及是如何达到的作为研究探索的目的。影响群体变化的因素是多方面的,既包括一些随机的,突变产生的因素,又包括通过演化过程中的选择机制而呈现出来的规律的因素。大部分演化博弈理论的预测力在于具有一定惯性的群体选择过程,但是同时,这个过程也应该具有突变的动力,这样才能不断更新种族特征。几乎所有的演化博弈理论的模型都是建立在选择和突变这两个规则的基础上的。选择就是指在理论上能够获得较高支付,以及以后将会被更多种群中的其他个体采用的策略。而突变是种群中的少数个体以随机的方式选择与种群不同的策略。突变其实是一个试错过程,但是同时也是学习与模仿的过程,在这个过程中,个体的适应性是不断变化的,

14、适应性较强的个体可以进行生存和繁殖,适应性较差的个体就只能被淘汰了。所以从本质上来说,突变也就是一种选择,只不过没是有悖于常理的选择,但是只有好的策略才能生存下来。总之,演化博弈理论是建立在以下三个基本的原则上的(1)异质性,即每个个体并不是完全相同的,不同种群间,同种群的不同个体间都是不同的;(2)适应性,即符合达尔文的自然选择原理的,只有适合当时环境的个体才能生存和延续;(3)选择性,即适者生存的。12复杂网络在一个系统中,或者在一个多人参与的演化博弈中,个体之间总是相互作用的。那怎么样去描述这些个体间的相互关系呢网络成为描述博弈个体间相互作用的做好方法。“就博弈论而言,参与博弈的个体就可

15、以抽象表示为网络中的节点;而个体间的相互关系或相互作用就可以抽象为网络的边。虽然节点和边可以具体表达很多特性,但我们通常只关心节点之间有没有边相连,而不考虑节点的位置,以及边的长短、形状等等。我们把网络这种不依赖于节点的具体位置和边的其体形态就能表现出来的性质叫做网络的拓扑性质,相应的结构叫做网络的拓扑结构”8但是,真实网络到底是怎么样的呢从古至今人们从来没有停止去探索。随着计算机技术的迅猛发展,人们发现大量的真实网络具有小世界效应和无标度效应。美国康奈尔大学的WATTS及其STROGATZ教授在NATURE上发表了题为“小世界”网络的集体动力学的文章,阐述了复杂网络的小世界效应,并建立了相应

16、的模型。美国NOTREDAME大学的BARABASI教授及其博士生ALBERT在SCIENCE上发表随机网络中标度的涌现一文,阐述了复杂网络的无标度特性,并建立了相应的模型。至今,复杂网络主要有规则网络、随机网络、无标度网络、小世界网络这四种基本模型。121规则网络节点按照一定的规则连接起来而得到的网络就被称作规则网络。规则网络又通常被称作格图或D一格,D一格是带有标号的、无权、无方向的简单图形。规则网络具有均匀的度分布,也就是每5个格点的度都是相等的,并且具有相对比较大的聚类系数和比较小的平均路径长度。如图11,列举了两种规则网络图(A)一个个体对应着四个邻居(B)一个个体对应着三个邻居图1

17、1规则网络示意图资料来源CHRISTOPHHAUERTMICHAELDOEBELISPATIALSTRUCTUREOFTENINHIBITSTHEEVOLUTIONOFCOOPERATIONINTHESNOWDRIFTGAME,NATURE428,6432004122随机网络由于本文重点研究的是惩罚策略对合作行为的影响,所以对网络结构的考虑比较少。在本文中主要是研究“囚徒困境”模型在随机网络上演化产生的自适应行为,所以,本文将重点介绍介绍随机网络,但是对小世界网络和无标度网络也会做简单的介绍。随机网络的几何性质以及模型,是由PAULERDS,ALFRDRNYI和BLABOLLOBS在五六十年代

18、提出的。它的模型建立如下首先生成N个节点,这N个节点中的任意两个之间以概率P连接起来形成一条边。这个模型看起来非常简单,但是当时的提出还是非常困难的。随机网络的特征是每个节点的度相差不大,都比较接近平均值,因此平均聚集程度低而平均路程长度较短,但大规模的随机网络没有聚类特性。并且随机网络的结构和性质都是随着概率P的变化而变化的,它的很多重要性质都是在某个临界P值处突然涌现出来。6图12节点数N10,连接概率分别为01、03、08生成的随机网络资料来源HISASHIOHTSUKI,CHRISTOPHHAUERT,EREZLIEBERMANMARTINANOWAKASIMPLERULEFORTHE

19、EVOLUTIONOFCOOPERATIONONGRAPHSANDSOCIALNETWORKS,NATURE441,5022006123小世界网络从真实的世界来看,真实网络不可能像上述的规则网络那样完全规则,也不可能像随机网络那样完全随机。就比如在人类社会中,人们总会跟自己的亲人和朋友一起形成一个小团体,即有一定的聚类特性;但同时,人们也会有一定的几率去认识新的朋友,即有一定的随机性。于是,正如前所述,美国康奈尔大学的WATTS及其STROGATZ教授在NATURE上发表了题为“小世界”网络的集体动力学的文章,阐述了复杂网络的小世界效应,并建立了相应的模型,简称WS模型,这个模型具有较高的聚类

20、特性和较短的平均路程。WS模型的构造算法如下“给定一个含有N个节点的一维环状有限规则网络,其中每个节点都与它最近邻的K2M个节点相连。以概率P随机地重新连接网络中的每个边,即将边的其中一个端点保持不变,而另一个端点取为网络中随机选择的一个节点。在随机化重连的过程中应该保证没有重边和自环。”124无标度网络上述三种网络结构都是均匀的,也就是度是比较平均的,但是事实上真实网络并非如此。1998年,ALBARABASI等开展一项描绘万维网的研究。他们发现网络的节点是呈幂率分布的,即大多数节点的度很小,而少部分节点的度很大。因此如前所述,美国NOTREDAME大学的BARABASI教授及其博士生ALB

21、ERT在SCIENCE上发表随机网络中标度的涌现一文,阐述了复杂网络的无标度特性,并建立了相应的模型,简称BA模型。其模型的建立过程如下首先,给定一个具有N0个随机分布的节点的网络,在每一步长中增加一个新的节点,这个新节点选择NN0个已存在的节点并连接到这些节点上,新节点连接到另一个节点上的概率正比于这个已存在节点的度K,重复上述这个过程就形成BA网络。72囚徒困境博弈在随机网络中的演化21复杂系统及合作现象由于复杂系统中的个体具有自适应性,即个体能够依据环境进行自我反馈节,因此复杂系统有时又被称为复杂自适应系统。复杂自适应系统的一些概念和研究模型与基于自然选择的达尔文进化理论具有紧密的联系。

22、达尔文认为演化有两个驱动力,即选择和变异。在此基础上,哈佛大学NOWAK教授认为合作是演化过程中的第三个原动力3。在本文中,我们研究的是囚徒困境博弈模型,所以我们主要讨论的就是合作的演化。在自然界中,合作现象是非常普遍的,从微生物到植物到动物再到人类社会,你都会发现生物体间的合作。比如我们比较熟悉的有蚂蚁在寻找食物时的合作。当一只蚂蚁发现了食物的时候,由于自身比较弱小,根本不可能独自把食物搬走,所以它就会返回蚁穴,将这个消息以他们的方式告诉其它的蚂蚁。然后它们就会一起前往食物所在地,然后一起搬食物。这种在捕食上的合作还会发生在蜜蜂等其它一些生物种群中。还有一些生物的合作不是在同种生物间的,比如

23、海葵和寄居蟹。海葵有时会在寄居蟹的螺壳上,当寄居蟹长大要迁入另一个较大的新螺壳时,海葵也会主动地移到新壳上。这样海葵和寄居蟹双方都得到好处。由于寄居蟹喜好在海中四处游荡,使得原本不移动的海葵随着寄居蟹的走动,扩大了觅食的领域。对寄居蟹来说,一则可用海葵来伪装,二则由于海葵能分泌毒液,可杀死寄居蟹的天敌,因此保障了寄居蟹的安全。人类社会中也有许多的合作现象。一支足球队的队员之间的合作;同学们在学习上的互相合作;一个公司研发部门和生产部门之间的合作等等。22合作的演化依据达尔文的进化理论,生物的不同个体间以及不同种群间是相互竞争的关系,生物个体为了生存总是想把自身取得的利益最大化,那么我们便不能解

24、释上文所提到的自然界中以及人类社会中的合作例子。那到底是什么促进并维持合作的产生,或者说自然界中以及人类社会中到底存在着什么样的机制维持着合作的产生,这是很多生物学家、社会学家、经济学家等在努力研究的问题。为了理解合作的问题,科学家们也建立了各种各样的模型,引入了学习策略、惩罚策略、记忆、互惠策略等等机制。221均匀混合体系中的合作演化早期人们通常是在均匀混合群体的框架中研究进化行为。所谓均匀混合群体指的是群体中的任8意两个个体之间相遇的概率都相同。关于均匀混合群体中的进化研究最经典的模型是MORAN过程6图21。MORAN过程步骤如下在每一个时间的长中,以正比于适应度的概率选择一个个体进行后

25、代繁殖,并且其后代带将会带有跟它父代同样的基因或性状。然后随机地选择一个个体使其死亡,它所空出的位置就被先前选中繁殖个体的后代所取代。不断进行这个过程,直至最后稳定。图21MORAN过程示意图资料来源LIEBERMANE,HAUERTC,NAWAKMAEVOLUTIONARYDYNAMICSONGRAPHSJNATURE,2005,433312MORAN过程的收益矩阵为其中参数B二T/R表示当博弈个体B采取合作策略时,博弈个体A采取背叛策略所获得的收益与采取合作策略所获得的收益之比。因此,B值表征背叛的诱惑力,当B值增大时,背叛的个体有9可能获得更大的收益,因此背叛行为对个体将具有更大的吸引力

26、。假设最初群体中的每个个体都随机采取合作或背叛的策略,然后在每一个模拟步长中,每个个体随机选取群体中的另外一个个体进行囚徒困境博弈并记录各自的收益。再以正比于收益的概率进行繁殖、死亡和替代过程。模拟结果如图所示,其中纵轴为合作频率只,它定义为采取合作策略的个体占整个群体的比例。由图可见,即使在B值很小的情况下,均匀混合群体最后也会落入全部山背叛者所组成的EES状态中。23囚徒困境在随机网络中的演化从上文可以看出,在没有有效的机制促进合作的情况下,一个系统中的合作很难维持。但是这是与现实世界中普遍存在合作的现象是不符合的。因此科学家们希望通过引入良好的机制以促进合作。ZIMMERMANN等人认为

27、个体可以依据博弈结果调整与邻居的边来实现合作者与合作者之间的联合,从而有利于合作行为的涌现和维持56因此,我们通过FORTRAN来建立模型,以研究学习策略、随机网络结构的变化以及奖惩措施对合作水平的影响。我们的模型建立如下我们的研究是以囚徒困境为模型的,在本文中我们的收益矩阵为CDC10D1UU图2收益矩阵因为要满足囚徒困境的要求,所以其中的U值的取值范围为大于0小于1首先,随机产生1000个个体,并随机地2让其中的500个个体为合作者C,另外500个个体为背叛者D,并以一定的平均度K(在本文中度K分别取2,4,6,8,10)使个体间形成连接。以度为2为例,就是要使每个个体平均与两个个体形成连

28、接。我们研究的是其中的CD连接,先分别比较CD连接中C和D的总收益,然后以一定的概率P使收益低的向收益高的学习,即一定的概率变成CC连接或DD连接。在不学习的情况下就是C和D断开。断开后,C可以从其他原先没跟他连接的个体中随机连接一个;而D个体则没有重连的机会。重复这个过程,直至系统中没有CD这种连接,然后统计其中的C和D的个数,即可判断出最后的合作水平。然后不断改变U值(以002为间隔,使U值在0到1之间改变),重复这个过程,直至最后整个系统中不存在CD这种连接,然后研究稳定后C个体所占的百分比。1024引入信用的作用后合作的演化在人类社会中,人们一方面要受对自身有利的利益的诱惑,但另一方面

29、又要考虑其他一些因素,比如亲情、道德、以后的发展等等因素。所以,在上述模型的基础上,我们又引入信誉的作用,看信誉的引用是否能促进合作。我们的做法是首先给每一个个体一个信誉初始值,C个体的信誉初始值为1;D个体的信誉初始值为0。后面的博弈过程中,个体每合作一次信誉值就加1,每背叛一次,信誉值就减1,记录每个个体的信誉值的变化。在上述的断开重连过程中,C个体不是随机去连接一个个体,而是去选择信誉比较好的个体连接,在本文中我们选择信誉值大于等于1的个体连接。如果系统中所有的信誉值大于1的个体都是这个C个体的最近邻,或中系统中已经不存在信誉值大于1的个体,那么在断开重连时,就从不是它的最近邻中随机选择

30、一个个体连接。重复上述过程,直至最后没有CD这种连接,然后查看稳定后C个体占总数的百分比,改变U值,重复上述过程。3模拟结果的分析与讨论在平均度K取不同值时(K分别取4,6,8),我们分别计算了断开后随即重连以及断开后选择信誉值比较高的个体连接两种情况,我们得出了以下结果。图31平均度K4时,比较示意图11图32平均度K6时,比较示意图图32平均度K6时,比较示意图在上述图中,横坐标表示变量U值的大小,纵坐标代表合作率,即C个体占总数的百分比。黑色B线条代表的是引入信誉作用的合作率随U值变化曲线;红色C线条代表的是断开随机重连的合作率随U值变化曲线。从上图曲线走势变化可以看出两种情况下,合作百

31、分比都是随着U值的增大而减小的。但是引入信誉作用后的曲线明显比断开随机重连的曲线下降缓慢,也就是说引入信誉作用,能够维持合作进行。并且,我们还可以从图中看出,在U值比较大的时候,即背叛收益比较大的时候,引入信誉作用后的曲线值都大于断开后随机重连的曲线值,而且相比于断开重连在U值较大时,合作百分12比将会趋于0,我们的引入信誉作用后的曲线在U值较大时,合作百分比还是能维持在一个较大的值。从FORTRAN模拟结果看来,在U值较大的时候,及背叛收益或背叛诱惑较大的时候,引入信誉能够大大提高并维持合作率。引入信誉值的作用相当于一种惩罚措施,在模型中,C个体断开后选择信誉值较大的个体连接,即是对背叛多于

32、合作的个体的一种惩罚,这使得这些信誉值小的个体的最近邻个数减小,也就降低了这些个体的总收益。在现实生活中,其实也有类似情况的,其实信誉在我们的生活中也是会影响我们的判断和选择的。比如在现在比较流行的购物方式网购中,我们发现商家的信誉是一个消费者决定要不要在这家店买的重要影响因素。在价格相差不大,但是商家信誉相差很多的情况下,绝大多数人都会选择商家信誉比较好的那家。这也促使商家要注重自己商品的质量,也就是要合作。所以说,我们的这项工作还是有现实意义的。134总结与展望复杂系统以及复杂性科学是这些年来研究比较热的领域。就自然界以及人类社会中的复杂系统而言,其中的个体具有自适应性,即它们能够依据环境

33、变化而进行自我调整。从生态系统、人类社会等复杂系统中抽象出来复杂网络,能够对一个复杂系统中的个体进行比较好的描述与刻画,因而成为研究复杂系统的有力工具。博弈论原是数学运筹中的一个支系,用于严格地处理在战略博弈中参与者最理想的行为和决定拮据的均衡,或者使具有理性的竞争者找到他们应采用的最佳策略。在此基础上发展起来的演化博弈理论,能够分析环境变化而选择不同的策略,比起经典的博弈理论,演化博弈理论无疑更加贴近实际。在本篇论文中,我们把演化博弈理论,复杂网络以及囚徒困境理论结合起来,以此来探究囚徒困境在演化博弈中出现的自适应现象。经过模拟计算,结果表明通过引入信誉的作用,一种惩罚机制,可以促进合作行为

34、的产生,维持合作行为的延续。惩罚机制可以使得受背叛的合作者可以对背叛者进行报复,使得背叛的自私个体无法侵入有合作者形成的团簇中,无法通过剥削合作者获取额外的高收益。从真实的人类社会来看,信誉也是在约束人类行为方面起到一定作用的。所以我们的研究是有现实意义的。从前人的研究可以发现,网络的结构也是可以影响合作的。也就是合作是受多种因素影响的。当然,本篇论文中对于信誉的计算方式可能还是有点过于简单,以后如果接着研究,可能还要在信用的传播机制上进行改进,以使其更加符合实际情况。复杂网络和博弈动力学的共演化是目前演化博弈研究中的热点。目前,大部分的结论都是计算机仿真的结果。如何提高模拟计算的能力,记录每

35、个个体的各种信息,从而进行高精度的仿真,是演化博弈理论发展的一个方向。还有探索别的促进合作的机制,是另外一个发展方向。14参考文献1HAROLDWKEDITOR,1977CLASSICSINGAMETHEORY,PRINCETON,NJPRINCETONUNIVERSITYPRESS2ERD0SP,RNYIAONTHEEVOLUTIONOFRANDOMGRAPHSJPUBLMATHINSTHUNGARAEDASCI,1960,517一603王龙,伏锋演化动力学与合作复杂性2009中国自动化大会暨两化融合高峰会议会议论文4王龙,伏锋,陈小杰,楚天广,谢广明演化博弈与自组织合作系统科学与数学,27

36、3,2007,6,3303435ZIMMERMANNM,EGUILUZVM,MIGUELMSCOEVOLUTIONOFDYNAMICALSTATESANDINTERACTIONSINDYNAMICNETWORKSJPHYSREVE,2004,690651026ZIMMERMANNMG,EGUILUZVMCOOPERATION,SOCIALNETWORKS,ANDTHEEMERGENCEOFLEADERSHIPINAPRISONERSDILEMMAWITHADAPTIVELOCALINTERACTIONSJPHYSREVE,2005,720561187MARTNGZIMMERMANN,VCTOR

37、MEGULUZ,ANDMAXISANMIGUELCOEVOLUTIONOFDYNAMICALSTATESANDINTERACTIONSINDYNAMICNETWORKSPHYSICALREVIEWE69,065102R20048YASHANCHEN,HAILIN,CHENXUWU,EVOLUTIONOFPRISONERSDILEMMASTRATEGIESONSCALEFREENETWORKS,PHYSICA38520073793849NOWAKMAANDSIGMUNDKEVOLUTIONARYDYNAMICSOFBIOLOGICALGAMES2004SCIENCE303,79310DOEBELIM,HAUERTCANDKILLINGBACKTTHEEVOLUTIONARYORIGINOFCOOPERATORANDDEFECTOR2004SCIENCE306,859

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。