1、中南大学CENTRALSOUTHUNIVERSITY本科毕业论文设计论文题目游戏公司访问权限管理系统论文学生姓名谷锋指导老师任波学院中南大学继续教育学院专业班级11级软件工程JAVA2班完成时间2014年7月中南大学毕业设计(论文)任务书软件工程专业2011级姓名汪上毕业设计(论文)题目机器人救援仿真系统中策略制定和协作研究起止日期2013年12月1日2014年6月10日指导教师任波毕业设计(论文)要求(包括日程安排和进度)一、日程安排和进度二、论文要求毕业论文由题目(标题)、摘要、引言(前言)、正文、结论、参考文献和附录等几部分构成。整篇论文字数不少于8000字左右,书写方式必须为计算机打印
2、。要求数据正确、思路清晰、观点正确,逻辑合理,语句通顺,文本格式符合规范要求。阶段阶段内容起止时间总体设计设计内容的主要构架章节和重点难点内容101211111资料收集通过现场调研、文献查阅、网上搜集等收集资料111111215初稿撰写根据总体设计和有关要求撰写并完成设计初稿1121511425修改补充根据导师意见对初稿进行修改补充1142511525文档整理按毕业设计格式要求整理文档,准备答辩1152511610答辩1161211615审查意见院(站)负责人年月日注本任务书由指导教师填写并经审查后,复印一份交学生装订在毕业设计(论文)的封面之后,原件存函授站中南大学毕业设计(论文)成绩单专业
3、软件工程姓名成绩毕业设计(论文)题目机器人救援仿真系统中策略制定和协作研究指导老师评语指导老师建议成绩指导老师签名年月日评审意见评审人签名年月日I目录摘要II第一章绪论111机器人救援系统的研究背景112国内外研究现状及分析2121国外研究现状及分析2122国内研究现状及分析313主要研究内容与章节安排4131主要研究内容4132文章组织结构5第二章救援仿真系统简介621引言622救援仿真系统简介623救援仿真系统服务器端详解7231服务器端的内部模块7232模块之间的工作原理9233仿真平台的评分标准1124救援仿真系统客户端详解11241客户端AGENT的组成11242客户端AGENT总体
4、框架13243客户端AGENT的通信模型14244客户端AGENT的感知模型15245客户端AGENT的行动模型1625本章小结17第三章策略制定和协作研究1831警察AGENT协作策略18311警察AGENT的清障任务18322清障任务的优先级设置1933多警察AGENT的合作方法2032医疗AGENT协作策略21321救援任务集合21322基于距离的多救护AGENT的合作方法2133消防AGENT协作策略23331消防AGENT的任务分配24332消防AGENT任务分配模型2534本章小结25第四章总结与展望2641总结2642工作展望27参考文献28II摘要近几年来,自然灾害的发生愈发频
5、繁,如何通过现代科学技术来有效减少这些自然灾害的发生成了近几年研究的热点课题。随着信息科学技术的不断普及,用计算机来模拟自然灾害发生的情况从而智能地找到最佳的救治方法,已经成为当前科学研究的热点之一。机器人救援仿真系统(ROBOCUPRESCUESIMULATIONSYSTEM,简称RCRSS),就是一种基于灾害中救治伤员和减少物质损失的仿真救援模拟信息系统。系统中共有三类智能体医疗人员、警察和消防员。系统模拟现实生活中发生的地震、火灾等情况,随着系统时间的加长,由于房屋倒塌或火灾而造成的平民死伤的人数也逐渐增多。本系统正是基于这一点,研究如何使三类智能体间拥有最佳的合作机制,从而使死伤平民的
6、数量和房屋烧毁的程度达到最小。据此,提出一种基于优先级的多警察AGENT合作方法,同时,为了能尽可能地营救更多的市民AGENT使比赛分数提高,本章针对在多救护AGENT下如何进行任务合作,提出了一种基于距离的多救护AGENT的合作方法并进行了详细阐述。除此之外,针对在多消防AGENT下如何进行任务合作,提出了基于消防AGENT的任务分配策略。关键字救援,医疗,警察,消防员机器人救援仿真系统中策略制定和协作研究第一章绪论1第一章绪论11机器人救援系统的研究背景近年来,世界各地地震频频发生,这些自然灾难给人们带来了恐慌与不安。除了阿尔及利亚、日本、印度尼西亚、菲律宾等地外,中国特别是中国的台湾地区
7、也是频频发生地震等自然灾害。自古以来,自然灾害对于人类的威胁都是人们难以应对的问题。随着人类社会城市化进程的日益完善,地震类的自然灾害对人类的危害也越来越大。由于现有技术对地震的预测以及控制均不可行,因此寻求一种良好的灾后救援方式成为一项值得研究的问题。地震灾后救援过程是一个复杂的系统过程,研究人员发现使用现有的数学方法已经很难对地震灾后救援中的大规模、复杂结构、非线性等高度复杂的环境进行描述,在这种情况下,他们发现系统建模和仿真的方法可以较好的解决传统方法所面临的难题12。在这种环境下,ROBOEUPRESCUE机器人救援仿真项目应运而生。ROBOCUPROBOTWORLDCUP,即机器人世
8、界杯足球锦标赛。它是国际上的一项为提高人工智能、机器人技术相关领域的教育和研究水平而举行的大型比赛和学术活动,同时也是一个国际性的研究机构和教育组织。它通过提供一个标准任务来促进分布式人工智能、智能机器人技术、及其相关领域的研究与发展3。ROBOCUPRESCUE项目作为ROBOCUP的一个新的研究领域,它的主要目标是建立理性智能的搜救和调度系统,并在灾难来临时,使社会损失尽可能减少到最低。ROBOCUPRESCUE的提出是源于1995年1月17日的日本神户大地震。这次地震对神户这座城市造成了极大的破坏,大量的市民在地震中伤亡,公共设施被毁坏,直接经济损失高达10亿多美元。更可怕的是地震引起了
9、300多处火灾,而且火情很快的蔓延。由于灾区交通阻塞并且没有充足、准确的信息,救火队,救护队和救援队不能及时到达灾难现场而无法进行救援,进一步的加大了地震灾害的破坏程度。从神户地震中可以看到,我们需要精力充沛的,动力、智能、有效的智能体,需要它们之间有效率的协作,将地震灾害的影响减小到最低。机器人救援仿真系统正是能够充分模拟地震等复杂的灾难环境的平台。在这个平台上,我们可以模拟许多在灾难环境中的智能体,其中包括消防中心、救护中心、警察局这样的不可移动的中心智能体。还可以模拟消防队员、救护队员、警察这样的可移动智能体。机器人救援仿真系统就是一个研究在地震等灾难发生了的情况下,怎样组织智能体之间的
10、通信,怎样组织救援工作的进行才能达到一个最大的救援效率,将机器人救援仿真系统中策略制定和协作研究第一章绪论2灾难的影响降低到最低。它致力于得到一种能够应用于实际救灾过程中的高效的智能体协作和规划模型。12国内外研究现状及分析121国外研究现状及分析ROBOCUP救援仿真项目于2001年正式成为ROBOCUP世界杯的比赛项目,经过多年的发展,吸引了来自美国、日本、英国和伊朗等国家的参赛队伍参与其中,由于其参与该项目的时间比较早,所以研究成果也更为突出。伊朗作为最早参与到该项目研究的国家,其优势垄断地位是无法撼动的,来自伊朗的参赛队伍获得了2002、2003、2004、2005、2006、2007
11、、2009年度ROBOCUP世界杯救援仿真项目冠军,加上每年度获得亚军和季军的成绩,伊朗在该项目的实力是显而易见的,比较著名的主要包括以下三只队伍伊朗沙力夫理工大学的IMPOSSIBLES队4曾用名ARIAN取得了ROBOCUP世界杯救援仿真项目冠军2次、亚军2次、季军1次的辉煌成绩。该队的源码构建了一个世界模型,底层框架由四大模块构成,用以实现火灾的预测、受困市民的搜索、优先级的消息传递等功能。任务分配采用了拍卖和合作的机制,路径规划则主要依靠启发式强化学习,具体采用BFS、DIJKSTAR、MST等算法实现。在队伍通信方面则采用了通过计算权重的优先级消息传递机制,采用上述方法使得该救援队伍
12、具备出色的火势控制能力和显著的市民营救效果。伊朗AMIRKABIR科技大学的SOS队5。伊朗是一只取得了优秀成绩的比赛队伍,总共取得了ROBOCUP世界杯救援仿真项目冠军2次、亚军1次、季军1次,该队在火灾预测方面采用BP神经网络对建筑的温度进行预测,神经网络的权值则采用离线数据作为训练样本参考。该队最大的特色在于使用了聚类的方法把建筑物群进行归类分区,根据建筑物材料、距离属性划分其灭火等级,从而达到对建筑物分区的目的。在比赛过程中,根据建筑物的着火等级并通过计算建筑物之间的距离和温度辅助完成着火时间的预测,确定最终的消防灭火方案。伊朗的MRL队6是伊斯兰阿扎德大学管理下的一个独立研究实验室,
13、其主要活动之一就是参加机器人世界杯竞赛并取得了骄人的成绩,获得了ROBOCUP世界杯救援仿真项目冠军2次,亚军2次,该队采用简单的线性预测方法预测火灾在不同建筑物之间的蔓延。采用了分区的思想用聚类的方法对建筑物建立分区,然后通过评价函数评价多个不同分区的建筑物的灭火优先级。根据此优先级消防AGENT可以有轻重缓急的扑救不同优先级的火灾。日本的RIONE队7是ROBOCUP救援仿真项目的后起之秀,并于2012年取得机器人救援仿真系统中策略制定和协作研究第一章绪论3了ROBOCUP世界杯救援仿真项目的冠军,该队对于任务分配采用动态任务分配和静态任务分配两种处理方式,在路径规划中用到了A算法、深度优
14、先搜索方法用以制定最优的路径规划方案,网络通信则根据地图的信息自动选择使用动态或者静态网络模型。122国内研究现状及分析随着ROBOCUP救援仿真项目的不断发展,其影响力在国内也不断扩大,先后吸引了中南大学、东南大学、浙江大学、大连理工大学、广东工业大学等队伍队加入其研究,通过国内比赛选拔出来的优秀队伍同时也在国际赛场大放异彩,先后取得ROBOCUP世界杯ROBOCUP救援仿真项目2008、2011年度冠军、2012年度亚军,具备了与国外传统强队对抗的实力,并为ROBOCUP机器人世界杯在中国的发展起到了推动与模范作用。浙江大学ZJUBASE队2007年第一次参加ROBOCUPCHINAOPE
15、N2007ROBOCUP救援仿真项目比赛便获得了该项目冠军,显示了其参赛队伍的非凡的实力,并且通过后续的研究与努力,在ROBOCUPCHINAOPEN2008、2009年度蜂联了ROBOCUP救援仿真项目的冠军,取得了三连冠的好成绩,同时也成为了该项目的最好成绩保持者。在国内比赛表现突出的ZJUBASE队于2008年参加了ROBOCUP世界杯救援仿真项目比赛并获得了冠军,开创了中国参赛队获得该项目世界冠军的历史,同时分别于2010、2012年取得了ROBOCUP世界杯该项目的季军、亚军,并逐步成为活跃在该项目研究领域的新兴强队。该队构建了一个三层的系统框架,其中底层主要完成世界模型和通信模型的
16、建立,信道的分配使用了自适应动态分配法,使得在限定通讯条件下各个AGENT之间信息的最大化共享;中层主要采用最短路径原则得出合理路径规划方法完成市民的搜救任务,改进了MUMI方法提高市民生命值预测的准确性;高层为行为决策层,主要实现具体环境下多个机器人完成任务时的任务分配与协作,警察AGENT和救护AGENT采用了集中式的任务分配方案,消防AGENT则采用分布式任务分配与集中式任务分配相结合的方案。火灾的预测则采用计算建筑物之间的距离同时考虑附近建筑物的数量来确定救援的优先级,最后利用闭环PID策略完成消防灭火任务。东南大学SEU队是最早参与该项目研究的团队,经过近5年的积累沉淀,2011年参
17、加ROBOCUP世界杯救援仿真项目比赛获得了该项目的冠军,成为了继浙江大学后第二支在国际赛场获得该项目冠军的队伍;在刚刚过去的ROBOCUPCHINAOPEN2012ROBOCUP救援仿真项目中也荣获冠军,逐步成长为一只在国际、国内赛场都实力突出的队伍。该队最突出的地方在于使用了粒子滤波算法来预测市民的生命值和死亡周期,获得了最为接近于真实情景的市民生命值和死亡周期机器人救援仿真系统中策略制定和协作研究第一章绪论4参数,此两项参数对于救护和消防AGENT的决策起到了非常重要的指导性作用。消防AGENT采用集中式和分布式相结合的决策模型,通过权重计算各个消防AGENT距离着火建筑物距离、被建筑物
18、围困的市民数量、建筑物温度等参数,最后结合最短距离的交通模型实施最合理、价值最大化的任务分配方案。比赛队伍的通信则构建了一个自适应的通信模型,根据有无中心AGENT自适应的选用通信方案,完成了优先级高的消息优先收发的目的,实现了各个AGENT的有效信息最大化共享。中南大学CSU_YUNLU队是国内最早参与ROBOCUP救援仿真项目研究的队伍,同时也是国内传统强队之一,先后取得了ROBOCUPCHINAOPEN2010、2011救援仿真项目冠军。该队为ROBOCUP救援仿真项目在中国的发展与推广做出了巨大的贡献,采用基于拍卖算法的多AGENT任务分配方案和状态预测方案构建了一个基于模糊Q函数的机
19、器人合作模型,同时建立任务评价函数,结合带权与或树和AOE网的动态任务规划,实现最优的任务分配。在路径规划方面,充分利用了震前地图中的拓扑信息,提出了一种基于目标吸引的蚁群算法来实现的路径规划方案的方法,保证了震后动态环境下路径规划的适应性与健壮性。经过近一段时间的发展,ROBOCUP救援仿真项目已经成为了验证各种先进算法和策略的理想平台,为人工智能、救援等学科的发展提供持续可靠的动力。中国的各个参赛队伍也逐步成长为该项目的有实力竞争者,在该研究领域占据了一席之地。各个国家新的参赛队伍的加入,使这个项目向各个领域的发展成为可能,其研究成果能够指导人们在灾后的救援中实施安全、有效的救援方案。13
20、主要研究内容与章节安排131主要研究内容根据前面所介绍的机器人救援仿真系统的具体研究现状可以看出,ROBOCUP救援仿真在国内也已经发展的相当成熟,尤其是我校的救援仿真项目也已经相当成熟,然而,不论是国内外哪一个参赛队伍开发此项目,智能体行为的策略制定和协作机制依旧是研究的重点,只有拥有完美的合作策略和协作机制8,才能知道智能体更好的完成救援仿真工作,从而在比赛中取得好成绩。因此,本文的主要研究内容就是如何制定良好的智能体行为策略与协作机制,从而使整个系统的救援效率达到最高。文中首先会对整个系统平台做基本的介绍,然后,通过对每个智能体行为特点的具体分析,本文提出分区、集群和分小组的不同协作方法
21、,是每个智能体都有各自适合的行为策略,这样,可以更好的实现智能体间的相互合作。并通过系统运行结果证明本文所制定策略的正确性与有效机器人救援仿真系统中策略制定和协作研究第一章绪论5性。132文章组织结构一个良好的策略和协作机制是指导整个系统更好地完成救援工作的关键,本文主要对分区、集群和小组三个策略进行了主要研究。文章的具体安排如下第二章从服务器端和客户端分别介绍了ROBOCUP救援仿真比赛系统各个部分的结构与功能。第三章提出了三类智能体各自制定的行为策略分区、集群、分组方法。第四章是论文总结,总结了本文主要的研究工作以及下一步需要研究解决的问题。机器人救援仿真系统中策略制定和协作研究第二章救援
22、仿真系统简介6第二章救援仿真系统简介21引言ROBOCUP救援仿真系统是一个通过模拟现实自然灾害如地震倒塌和火灾蔓延等,以及模拟在灾难条件下人的一些救援行为的系统。它属于分布式控制的实时的多AGENT系统,为模拟救援提供仿真平台。通过该平台,研究可以应用到实际救援行动中的理论和策略。各个开发队伍通过建立自己的客户端AGENT的体系框架,研究救援的先进算法,使仿真AGENT的救援行为更加理性智能。下面对ROBOCUP救援仿真系统涵盖的两大部分进行详细论述。22救援仿真系统简介ROBOCUP救援仿真系统ROBOCUPRESCUESIMULATIONSYSTEM,简称RCRSS是一个由多个模块通过网
23、络连接起来而构成的实时分布式的仿真系统,它为机器人救援仿真比赛提供比赛平台9,其开发模式采用典型的C/S体系结构由于系统是分布式的仿真系统,因此可以将仿真系统的不同模块做为一个独立的程序运行在不同的计算机上,从而能够将计算任务分散到不同的计算机上。由于救援仿真系统的体系结构采用的是C/S开发结构,所以该系统由服务器端和客户端两大部分组成。整体的仿真系统是由五个模块组成子仿真器SUBSIMULATORS、地理信息系统GIS、监视器VIEWER、内核KERNEL和AGENTAGENTS,其中,地理信息系统GIS、监视器VIEWER、内核KERNEL和子仿真器SUBSIMULATORS属于仿真系统的
24、服务器端,AGENTAGENTS属于仿真系统的客户端。这五个模块之间通过TCP/IP和UDP/IP协议进行通信,该通信属于异步通信,所有的信息均要经过内核转发。在救援仿真比赛中,由仿真服务器负责加载运行比赛专用地图,目前比赛专用地图分为6类地图,根据不同地图的置参数来确定该地图下的比赛分数和AGENT总数。每个仿真周期约为300个时间周期,可以根据需要来修改比赛地图的配置参数中的仿真时间。客户端的AGENT分为三大类警察AGENT、消防AGENT和救护AGENT,正常情况下将每种AGENT运行到一台计算机上,也可将二种以上的AGENT连接运行到一台计算机上,不过这样对计算机的硬件要求较高。救援
25、仿真的系统结构图如图21所示。机器人救援仿真系统中策略制定和协作研究第二章救援仿真系统简介7图21救援仿真系统结构图23救援仿真系统服务器端详解231服务器端的内部模块服务器由子仿真器SUBSIMULATORS、地理信息系统GIS、监视器VIEWER、内核KERNEL四个模块组成。1子仿真器SUBSIMULATORS仿真器模块在救援仿真中的作用是根据现实灾害的现场情况进行模拟,同时还需要模拟出救援队伍的救援行为,其模拟遵循一定的自然规律。本仿真系统的子仿真器主要由火灾仿真器、建筑倒塌仿真器、道路阻塞仿真器、交通环境仿真器和其他仿真器等构成。火灾仿真器仿真灾难空间上的建筑物燃烧情况以及相邻建筑之
26、间的火灾蔓延情况;建筑倒塌仿真器仿真由于地震导致的桥梁、房屋以及道路坊塌情况;道路阻塞仿真器仿真建筑物倒塌后形成的道路上的阻塞块情况和救援行为中警察AGENT清理阻塞块的情况;交通环境仿真器仿真各个移动AGENT在各种路况下的移动情况,如移动速度,被路障阻塞不能移动、多个AGENT在狭窄的路况下的拥堵等。根据仿真器内部的状态和从内核接收到的信息和命令来计算世界模型中将要发生的事情,包括AGENT的动作,以及他们的动作带来的效果,机器人救援仿真系统中策略制定和协作研究第二章救援仿真系统简介8然后把结果返回给内核。2地理信息系统GIS地理信息系统主要负责从指定的比赛地图配置文件中读取相应的地理信息
27、,通过解析地图参数构造仿真系统的地理信息模型。在仿真开始初期,为系统提供世界模型的最初配置,像房屋、道路、市民和AGENT的坐标值等。值得注意的是,由于地理信息系统要提供一些地理信息的初始化条件,所以地理信息系统是先于内核启动的。3监视器VIEWER图22系统监视界面监视器负责对仿真系统内发生的一切仿真动作进行动态地映射,把仿真系统的世界模型通过一个2D图形界面形式显示出来。通过该监视器界面可视化地观察到建筑丹塌、火灾蔓延、市民被埋、警察清障、消防员灭火和救护队救护市民等现象。监视器界面每一个仿真周期更新一次。通过该监视器界面能够直观地观测AGENT的一些救援行为,从而根据这些行为验证救援策略
28、或相应算法是否有效。监视器界面如图22所示,图中采用的是KOBE地图。从图中标题栏可以看见参赛队伍的名字TEAM、当前的仿真时间TIME以及实时的得分情况SCORE。图中,有颜色的实心圆代表AGENT蓝色实心圆代表警察AGENT,红色实行圆代表消防AGENT,白色实心圆代表救护AGENT,绿色实心圆代表市民;块状四边形代表建机器人救援仿真系统中策略制定和协作研究第二章救援仿真系统简介9筑物浅蓝色块状四边形代表已经被扑灭的建筑物,黄色块状四边形代表刚着火的建筑,红色块状四边形代表燃烧旺盛的建筑,黑色块状四边形代表已经烧过的建筑;纵横交错的长方形细线条代表道路;黑色的十字交叉代表路障;用实心圆有发
29、光的光圈代表AGENT在执行任务,其中红色实习圆与着火建筑之间的连线代表消防员正在灭火。监视器界面还可以显示AGENT移动的踪迹,通过选择界面上的选项卡选择要想要观测的界面,例如,可以屏蔽所有路障情况观测建筑和道路分布,屏蔽所有道路与其他建筑等的路径连线,屏蔽AGENT只显示移动情况等。4内核KERNEL内核是整个仿真系统的核心,所有的通信均由内核调度,主要是各类信息的转发,因此仿真系统内的通信属于异步通信机制。内核负责控制与各个模块之间的通信,管理整个仿真过程。在仿真系统中,一次完整的仿真实验是由多个仿真周期组成的,具体的仿真周期要根据不同的地图参数来确定,一般一个仿真周期约为L000MS,
30、通常略大于L000MS。在救援仿真过程中,从内核的任务调度角度来分析,每个仿真周期都是划的,前500MS用十把从子仿真器发来的各类仿真信息进行分折计算然后发送给地理信息系统和监视器,通知监视器进行更新包括更新仿真周期,500MS用于和客户端AGENT的交互,等待AGENT动作命令的回复,因此,内核必须在后500MS内接收到客户端发来的消息,否则下周期该AGENT的上个命令动作将不会模拟仿真。232模块之间的工作原理救援仿真开始前,各模块要与内核连接进行初始化操作,其连接整合步骤下1地理信息系统首先与内核进行连接,地理信息系统通过读取地图文件配置信息把灾难现场的初始化数据发送给内核;2子仿真器和
31、监视器分别与内核进行连接,接收由内核发来的一些系统初始化条件;3开发的救援AGENT和系统的AGENT市民AGENT与内核进行连接,接收由内核发来的一些系统初始化条件。经过以上三步,地理信息系统、子仿真器、监视器和AGENT分别与内核连接完毕,在所有的AGENT开发的AGENT和市民均得到有内核发送来的灾害现场初始化数据后,内核就完成了初始化救援仿真系统的工作。以上只是完成仿真前的各个模块连接初始化步骤,在这些初始化动作完成后仿真才正式开始。仿真正式始后,仿真过程是由每个仿真周期组成的,而在每个仿真周期中涵盖了7个重复迭代的步骤,其各模块间的通信流程如图23所示。下面介绍每个仿真周期中的各个模
32、块间的通信流程机器人救援仿真系统中策略制定和协作研究第二章救援仿真系统简介101内核根据每个AGENT的位置收集该坐标点周围的感知信息,感知信息包括视觉信息和听觉信息,视觉信息指该AGENT所处位置半径为10米以内所能看见的空间视觉量,听觉信息指该AGENT所处位置半径为30米以内所能听见的任何声音,通常为了尽可能接近现实情况,内核会给发送给每个AGENT相应的听觉信息中加入一定的噪声。然后内核把从每个AGENT那收集来的感知信息发送给对应的AGENT。2各个AGENT根据由内核发送来的对应位置的感知信息进行行为决策并将决策后的原子命令供开发使用的API,例如移动、清理、救护和灭火等,能够被底
33、层识别与执行发送给内核,若AGENT由于各种原因没有发送原子命令则内核视为无动作。图23各模块间的通信3内核接收到发自AGENT的原子命令后对不符合要求的命令过滤,然后将过滤后的原子命令转发给各个具体的子仿真器。需要注意的是,若在AGENT向内核发送消息的过程中出现丢包的情况,内核不予处理,将会转发接受到的完整信息包。4各子仿真器根据从内核发来的原子命令和当前已经存储的灾难环境模型进行综合分析和计算未来发展变化的灾难模型,然后将计算得到的灾难模型发送给内核。如果内核在发送AGENT原子命令到各子仿真器的500MS内没有收到相应的反馈信息的话,仿真状态将不会发生变化,也就是说本仿真周期和上个仿真
34、周期的仿真结果相同。5内核接收到子仿真器发来的仿真灾难现场模型后,将这些仿真信息集成机器人救援仿真系统中策略制定和协作研究第二章救援仿真系统简介11后分别发送给地理信息系统和监视器。同时,内核将仿真时钟增加。6监视器接到内核的仿真更新通知后,向地理信息系统发送请求信息,要求返回更新后地理信息系统的世界模型。7地理信息系统得到监视器的请求后,将更新的地理信息发送给监视器。以上的7个步骤就是仿真开始后迭代完成的,其中在仿真的第一个周期,第1步和第2步是不执行的。233仿真平台的评分标准仿真周期结束后,仿真的服务器端会给出每个队伍的比赛得分,该分数能够客观地评价各个队伍开发的各类AGENT的优劣。基
35、于救援仿真平台的比赛系统,有一个统一标准的分数计算公式来计算每个参数队伍针对不同地图的得分情况。其分数随着仿真周期的增加而递减,仿真完毕的最后得分就是该队伍的比赛分数。具体的分数计算公式如公式21所示公式(21)其中,P表示当前仿真周期中存活的市民AGENT的个数,S表示当前仿真周期中存活的市民AGENT的生命值之和,表示初始时所有市民AGENT的生命值之和,马表示仿真初始时建筑总面积,B表示当前仿真周期中未被烧毁的建筑总面积。由以上分数计算公式可以看出,存活的市民数量和未被烧毁的建筑总面积是取得较高分数的两个关键因素。该分数计算公式比较合理地反映了客观事实在规定的时间里,火灾控制得越好未燃烧
36、的建筑面积就越大、市民营救得越及时存活的市民数量就越多,只有这样才能达到理性有效的救援目的。在仿真中对应的比赛分数越高,说明消防AGENT的灭火性能和救护AGENT的救援性能越高,同时也反映出警察AGENT前期清障工作的性能优越。24救援仿真系统客户端详解241客户端AGENT的组成客户端AGENT指的是比赛队伍需要开发的AGENT,而非类似于市民这样的服务器端提供的AGENT。从可否移动角度来分,客户端AGENT包括两大类可移动AGENT和中心AGENT不能移动只能发消息;从功能角度来分,客户端AGENT分为三大类清理路障的警察AGENT、灭火的消防AGENT和救护其他AGENT的救护AGE
37、NT。具体的客户端AGENT就是这六种警察AGENTPOLICEFORCE和警察中心机器人救援仿真系统中策略制定和协作研究第二章救援仿真系统简介12AGENT又称警察局,POLICEOFFICE、消防AGENTFIREBRIGADE和消防中心AGENT又称消防中心,FIRESTATION、救护AGENTAMBULANCETEAM和救护中心AGENT又称救护中心,AMBULANCECENTER。不同AGENT所拥有的行为动作能力存在异同所有AGENT包括市民AGENT均具有了解周围环境的感知能力SENSE、听见周围声音的听觉能力HEAR和通过语言沟通的说话能力SAY;除了三个中心AGENT不具有
38、移动行走能力MOVE其他均具备该能力;除了市民AGENT不具有无线通讯能力TELL,其他6种AGENT均具备该能力;另外,警察AGENT还具有清理路障的专业能力CLEAR,消防AGENT具有灭火的专业能力EXTINGUISH,救护AGENT具有救援RESCUE、载上LOAD、载下UNLOAD的专业能力。各种AGENT所具备的能力如表21所示。仿真服务器连接客户端AGENT的最大数量为70个。其中,警察AGENT和消防AGENT最大连接数量为20个,救护AGENTL5个,中心AGENT5个。表21各类AGENT的能力类型能力CIVILIANSENSE,HEAR,SAY,MOVEAMBULANCE
39、TEAMSENSE,HEAR,SAY,TELL,MOVE,RESCUE,LOAD,UNLOADFIREBRIGADESENSE,HEAR,SAY,TELL,MOVE,EXTINGUISHPOLICEFORCESENSE,HEAR,SAY,TELL,MOVE,CLEARAMBULANCECENTERSENSE,HEAR,SAY,TELL,SPEAKFIRESTATIONSENSE,HEAR,SAY,TELL,SPEAKPOLICEOFFICESENSE,HEAR,SAY,TELL,SPEAKAMBULANCETEAM行为代码示例机器人救援仿真系统中策略制定和协作研究第二章救援仿真系统简介1324
40、2客户端AGENT总体框架客户端AGENT代码组织框架釆用分层的框架模型,包括三层底层、技术层和策略层,如图24所示。底层与服务器端交互紧密,主要是与内核进行通信,包括原子命令的发送、视觉和听觉信息的接收和综合分析世界模型;技术层中封装了开发队伍的一些先进算法,包括火灾蔓延的预测、市民生命值的预测、路径规划和市民探索等主要技术,为高层的策略层提供技术支持;最上层为策略层,是开发队伍进行策略逻辑组合的一层,例如,分区的消防策略、基于拍卖的多AGENT协作方法和基于粒子滤波的红外目标跟踪方法等策略逻辑策略的好坏直接影响开发AGENT性能的优劣。在这三层结构中,技术层和策略层是需要比赛队伍重点研究和
41、开发的,在这过程中能够研究出很多先进的算法和优良的策略,这两层也是AGENT体系结构中的核心部分。客户端AGENT内部维护着七大模块感知模块、状态模块、推理模块、决策模块、合作协议模块、通信模块和执行模块。正是这七大模块的存在,才使得AGENT的行为模拟机制得以建立,能够完成视觉、听觉、推理、说话、行走、执行任务和相互合作等类人行为。图24AGENT框架结构机器人救援仿真系统中策略制定和协作研究第二章救援仿真系统简介14243客户端AGENT的通信模型客户端AGENT具有一定的通讯能力,能够加强AGENT之间任务的合作,使得救援任务能够快速有效地完成。AGENT彼此之间的信息交互主要是靠语音通
42、信进行的,仿真系统是不允许通过内存的方式来实现信息的共享,语音通信包括有中心通信和无中心通信两种情况下的通信方式。AGENT的通信模型如图25所示。1有中心通信在有中心AGENT的情况下可以进行有中心通信。可移动AGENT能够与中心AGENT通信,并且三类中心AGENT彼此也可以进行信息共享。从2007年开始,仿真系统用信道进行通信,共计有10条信道,其中9条用于无线电通信,另外1条用于普通声音通信。由于每条信道的通信容量大小有限,因此每个AGENT的通信能力受到限制。同时需要一提的是,每条信道都有丢包的可能性,内核将不予处理。中心AGENT就好像一根“天线”一样,能够收集辖下的移动AGENT
43、动态信息并且能够向他们进行广播中心消息。每个AGENT在发送信息时需要指定信道。在有中心通信的情况下,移动AGENT拥有两种通讯方式使用无线电通信TELL可以实现全局范围的通信和使用说话方式SAY进行局部有效范围为30米的语言交流。在某些地图上会出现缺乏某类中心AGENT的情况,该类中心AGENT下属的移动AGENT的通信带宽将受到限制,此时可利用其它中心AGENT来收集该类移动AGENT的通信信息,因为中心AGENT的通信带宽是移动AGENT的两倍,所以中心AGENT有足够的信道容量允许多类AGENT的同时通信。图25AGENT通信模型2无中心通信当服务器端加载的某张地图中没有中心AGENT
44、只有移动AGENT时,移动AGENT只能通过说话方式SAY进行局部有效范围为30米的语言交流来实现信息的共享。此时,AGENT接收到其他移动AGENT的语音信息后更新自身灾难现场的世界模型,机器人救援仿真系统中策略制定和协作研究第二章救援仿真系统简介15并且将些重要的空间状态变化如有新的着火建筑、某建筑物已被扑灭、道路上的路障被清理完毕、发现有市民被障碍物掩埋等再通过说话的方式来告知该AGENT周围的AGENT。在无中心通信的情况下,为了能够尽可能拿到最新最准确的灾难世界模型相当于每个AGENT手上的地图,除了说话告知的方式外,AGENT还可以釆取巡查的方式通过获取更多的可靠的视觉信息来更新自
45、身的灾难世界模型。244客户端AGENT的感知模型所谓移动AGENT的感知SENSE是指像人类一样能够获取到当前所在位置周围的环境变化,这就包括视觉和听觉量。移动AGENT是通过自身的感知模块来进行决策的,可以感知仿真系统灾难环境中建筑的变化、道路路况的变化、市民的健康状况以及其他AGENT的行动包括呼叫和说话等。移动AGENT用视觉采集来的信息是绝对可靠的,而用听觉采集来的信息不一。图26AGENT的感知模型定可靠,因为听觉信息中有内核添加的噪音并且听到的消息也有可能是其他AGENT转发的错误消息。移动AGENT的感知是有范围的,视觉范围为半径10米以内的实体对象,听觉范围为半径30米以内的
46、任何声音。移动AGENT的感知模型如图26所示。事实上,对于移动AGENT的听觉来说是由内核把该AGENT所在位置30米以内的所以的声音加上噪音发给AGENT的,而对于视觉来说移动AGENT并非真正拿到其所在位置10米以内的所有物体。内核对移动AGENT视觉信息的处理是这样机器人救援仿真系统中策略制定和协作研究第二章救援仿真系统简介16的以该AGENT所在坐标为中心做射线,从这些射线上截取10米的线段,线段与某物体相交的距离最短则为看见的物体,若该线段上没有与任何物体相交则视为该方向上无物体存在于视野。245客户端AGENT的行动模型移动AGENT的行动是经过几个模块层层执行的,主要有这几个模
47、块感知模块、世界模型模块、行为决策模块、路径探索模块和动作执行模块。移动AGENT的决策模型如图27所示。1感知模块移动AGENT通过自身感知周围的环境情况与外界信息进行交互,同时还可以通过其他AGENT发来的感知信息来实现信息的共享。2世界模型模块移动AGENT的世界模型模块相当于手中的“地图”,对感知模块釆集来的信息在原有的世界模型的基础上进行分析和融合,维护一个最新的世界模型。3行为决策模块行为决策模块内部维护的是开发队伍的决策系统,根据当前世界模型模块提供的最新灾难模型做出行为决策。决策的结果将决定AGENT的任务目标。决策系统的做出的决策需要技术层提供的算法技术支撑,因此技术层提供的
48、算法技术好坏直接影响到决策层决策的好坏。4路径搜索模块路径搜索模块为AGENT寻找目标提供最优路径方案,该模块内部维护技术层的路径搜索等算法技术。该模块提供的路径搜索技术直接影响到整体的救援效率。5动作执行模块动作执行模块根据路径搜索模块提供的最优路径方案加上行为决策模块提供的任务策略执行相应的动作行为,控制AGENT的未来发展。机器人救援仿真系统中策略制定和协作研究第二章救援仿真系统简介17图27AGENT的决策模型25本章小结本章首先对救援仿真系统做了概况性的介绍,然后对仿真系统的服务器端和客户端进行了详细地介绍。介绍了服务器端的模块组成、各模块间的连接与工作原理以及介绍了客户端AGENT
49、的组成、总体框架、通信模型、感知模型和行动模型。还介绍了比赛平台的评分标准。机器人救援仿真系统中策略制定和协作研究第三章策略制定与协作研究18第三章策略制定和协作研究31警察AGENT协作策略多AGENT环境下,需要处理好系统中AGENT间的任务合作问题。其中,在仿真前期警察AGENT的清障任务最为关键,主要表现为对一些关键任务的处理上,比如说某些路障块掩埋了其他AGENT、路障块阻碍市民前往避难所、路障块阻碍消防队员前往避难所取水、路障块阻碍消防队员前往火灾区、路障块阻碍救护队员前去救护受伤的市民等,因此其自身的任务合作处理显得极其重要。在多AGENT系统中,任务是通过各个AGENT间协同工作来完成的。协作的成功与否,任务完成的质量好坏,在很大程度上取决于子任务分配时AGENT之间所进行的协商。在AGENT相互协作问题上,目前流行研究采用BAM的模糊控制、MRL的线性加权模型以及共享规划模型等评价模型或控制方法来完成所有AGENT间的协作。本章提出一种基于任务优先级的任务合作机制,通过该机制能够使重要任务得到优先完成,提高整体救援效率。311警察AGENT的清障任务在救援仿真中,由子仿真器模拟出地震建筑倒塌等产生的道路上的障碍块区,是警察AGENT的任务目标,而警察AGENT间属于同构AGENT,因此每个警察AGENT独立完成清障任务的能力相同。一个障碍物块区是由多个路障体组成