1、地质矿产点源信息系统的网格体系结构探讨摘 要 讨论了网格计算的有关概念及其最新的研究进展,并在此基础上提出了融合计算网格、数据网格、服务网格的地质点源信息系统网格的概念、特点及其体系结构。旨在为目前地矿点源信息的共享严重滞后于网络技术发展的速度而得不到有效利用和应用的提供新的解决方案,并为有效解决在点源地矿信息方面诸如动态异构、资源共享、信息孤岛、数据庞大、处理速度等相关问题提供了新的思路。 关键词 地矿信息;网格 GIS;数据网格;计算网格;服务网格;地学信息1 引言美国阿尔贡国家实验室(Argonne National Laboratory)的资深科学家、美国著名的网格计算项目 Globu
2、s 的主持人之一 Ian Foster,曾在 1988 年主编过题为网格:一种新计算的基础设施的蓝图1的一本书。他是这样描述网格:“网格是构筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通老百姓提供更多的资源、功能和交互性。互联网主要为人们提供电子邮件、网页浏览等通信功能,而网格功能则更多更强,能让人们透明地使用计算、存储等其它资源。 ”由此可见,实际上 Internet 实现了计算机硬件的联通,Web 实现了网页的联通,而 Grid试图实现互联网上所有资源的全面联通。它要把整个互联网整合成一台巨大的虚拟超级计算机,实现计算资源
3、、存储资源、通信资源、软件资源、信息资源、知识资源的全面共享。互联网的第三次浪潮的实质,就是要将万维网(World Wide Web)升华为网格(Great Global Grid)2。网格的构想源于电力供应网(Power Grid) ,其基本思想就像人们日常生活中从电网中获取电能一样获取高性能的计算能力。传统因特网实现了计算机硬件的连通,Web 实现了网页的连通,但网站(信息孤岛) 上的信息并不能按照用户的指令进行有意义的交流。人们不能共享广域网络中的异构资源;不能将运行在通过 Intranet 或 Internet 连接的分布式服务器上的应用集成在一起,构架松散偶合的企业应用;不能聚集分散
4、的计算能力,形成超级计算的能力,解决诸如虚拟核爆炸、生物医药、航天、气象预报和环境保护等重大科学研究和工程技术应用领域的问题。解决这一问题的途径是建立连接和统一各类不同远程资源的网格结构,实现网络虚拟环境上的资源共享和协同工作,消除信息孤岛和资源孤岛。网格技术凭借其独特的计算力联合和分布式计算模式,在学科研究、企业信息处理、电子政务、个人娱乐方面拥有广泛的应用前景。在我们平常所接触的信息中,地理空间信息的比例可以占到 80%左右3,然而在地学信息在网络上的传送的信息比例中所占的比例远不达到这一数字。这是因为虽然随着地球信息相软件的日益应用与普及,但其发展速度发展远不及网络的发展,绝大多数系统还
5、停留运行于单机环境下,即便是网络也只是在局域网层次应用,数据也不能充分广泛的应用、共享、更新,无法在社会广大范围内充分发挥作用。造成这种局面的原因,涉及许多方面技术因素及社会原因,而网格的出现给解决这些问题提供强有力的工具,它从硬构成(计算机性能、网络、及他们的结合)上着手,弥补了仅从软构成如在程序、算法等方面出发,实现在地矿信息系的两条腿走路。 网格的出现将会加快世界数字地球、数字城市的进程,也将促进我国“数字中国”和“数字国土”战略计划的发展。2 地质矿产点源信息系统网格特点与一般的信息不一样,空间信息具有关系复杂、非结构化、数据量大、多比例尺、随时间变化等特点8。而且地矿数据具有多源、多
6、类、多量、多元、多维和多主题的特征,点源信息系统就是充分地抓住了这些特征的基础上发展起来的。所谓“国土资源点源信息系统”是指建立于基层勘查单位(数据采集点) 的基础信息系统。它以属性数据库和空间数据库为核心,把实现地质矿产勘查全过程数据资料采集、处理计算机化,与实现地质数据资料管理、检索计算机化、网络化的目标结合起来是一种集数据采集、数据管理、数据分析、空间信息处理、图件编绘和预测评价于一身的高功能基础勘查信息系统. 它将实现地质矿产勘查全过程数据资料采集、处理计算机化,与实现地质数据资料管理、检索计算机化、网络化这两大目标结起来,在面上是信息齐全的地矿信息网络结点,在点上是功能齐全的地矿勘查
7、工作站9 。网格的核心观念是“网络就是计算机” ,网格一些自己独有的特征,且对于地质矿产点源信息系统而言这些特性得到了很好的发挥:(1) 异构性。网格可以包含多种异构资源,包括跨越地理分布的多个管理域。构成网格计算系统的超级计算机有多种类型,不同类型的超级计算机在体系结构、操作系统及应用软件等多个层次上可能具有不同结构。地质矿产点源信息系统是在已有的计算机硬件、软件、网络技术的基础上发展起来,这些平台配置,数据库类型与网络架构不大相同。而网格正好弥补这分面的不足,简化了地质矿产点源信息系统平台沟通的进程。为数据共享和软件共享双重性能充分实现提供了可行性。(2) 可扩展性。网格可以从最初包含少数
8、的资源发展到具有成千上万资源的大网格。由此可能带来的一个问题是随着网格资源的增加而引起的性能下降以及网格延迟,网格必须能适应规模的变化。网格是一个从无到有,从小到大,从高到低级发展起来的。这个过程与地质矿产点源信息系统逐级逐步完善的过程相一致,互不影响发展进程。(3) 可适应性。在网格中,具有很多资源,资源发生故障的概率很高。网格的资源管理或应用必须能动态适应这些情况,调用网格中可用的资源和服务来取得最好的性能。与一般的局域网系统和单机的结构不同,网格系统由于地域分布和系统的复杂使其整体结构经常发生变化,网格系统的应用必须能适应这种不可预测的结构。可适应性是相对于可扩展性而言,是其独特的另一面
9、,一旦网格的局部网络、主机或数据资源出现故障并不影响网格的运行,基性能也很少发生变化。这样给地质矿产点源信息系统的运行带来很大的隐定性、结勘查数据库管理、勘查数据处理和地矿资源预测评价三大功能提供了安全保障。(4) 结构的不可预测性。动态和不可预测的系统行为。在传统的高性能计算系统中,计算资源是独占的,因此系统的行为是可预测的。而在网格系统中,由于资源的共享造成系统行为和系统性能经常变化。这要求地质矿产点源信息系统的设计应当有一定的访问规则、数据安全机制、数据的备分、数据镜相、数据安全极别等措施,使整个系统有条不紊地进行。(5) 多级管理域。由于构成网格系统的超级计算机等资源通常属于不同的机构
10、或组织并且使用不同的安全机制。在实际应用中,由于不同行业、不同部门有不同内容的专业信息,空间数据的生产、维护都分散在不同的单位进行,很难进行全部统一集中8。因此,比较可行的办法是各个行业、部门相对集中地分而治之,通过合理的技术途径,为其他部门提供服务。因此需要各个机构或组织共同参与解决多级管理域的问题。多级管理使资源符合使用重要性与最大效用上合理调度。在网格底层加上多级管理,更有利于数据的安全,整个资源顺利运作,可以有效克服不可预测性带来的不良后果。以上是网格平台具有的普遍特点,它是源于计算网格的最初设计的特性,网格已经为地学信息提供了这么强有力的平台,大大地简化地质矿产点源信息系统设计。同时
11、地学网格平台也是软件资源,网络资源、信息资源连成一个逻辑整体。因此作为地质矿产点源信息系统网格又具有自己独有的特点:(1)具有数据整合能力。地学数据异常庞大, 大多为适应各个时期没有统一标准的主题数据库且它们分散在各个基层勘查单位(数据采集点)上,地质矿产点源信息系统的网格平台要将这些有一定时空关系的数据结合起来组成一个低冗余少缺陷的整体。另外,地质矿产点源信息系统网格要可以根据用户的要求自动地生产信息即空间分析结果、合成信息、升成信息等10。(2)具备强大的搜索引擎。地矿信息浩如烟海,既使具有完整统一标准的数据,如果没有强大搜索引擎来支撑,也是无法快速地从庞大的数据找到适合当前主题的数据。网
12、格中的数据成千上万,信息计算技术应该支持基于属性的访问,允许用户根据属性查找所需要的数据集11。3 地质矿产点源信息系统网格体系结构图 1 地矿点源信息系统的网格体系地质矿产点源信息系统网格与其它网格一样由 6 个部分实体组成,即网格结点、数据库、贵重仪器和设备、可视化设备、宽带网和网格软件。主干网将所有网格结点联成一体,其带宽可达 GBPS 量级。网格软件提供单一系统映像、透明胜、负载平衡和资源共享等功能。网络系统中的网格操作系统层提供网格的底层管理功能;为编程和使用环境提供用户接口,使一般应用和专门为网格开发的应用能方便和有效地利用网格资源。网格结点、数据库、设备、主干网和网格系统软件构成
13、了一个网格平台12。由于地矿信息的异常复杂,地质矿产点源信息系统意义上的网格涵盖了计算网格、数据网格以及服务网格三类(如图 1) 。地学信息需要计算网格处理地学方面的庞大数据、模拟一些地质现象、空间分析、资源评价等;利用数据网格来存储智能存储、交换、复制、备份、访问数据资源;使用服务网格为应用(评价评估,储量计算、决策支持、模拟再现)提供支撑,应用是整个平台的最终目的。地质矿产点源信息系统的计算网格是整个网格的核心。在地矿点源信息系统中计算网络担负着巨大数据计算的能力如储量的计算、矿山模型的模拟、地质构造的模拟以及一些剪切、开挖分析等任务,这些任务都需要强有力的网络计算去支撑。地质矿产点源信息
14、系统的数据网格是规则地存放整合后的庞大异构数据资源,旨在解决数据密集型计算应用中,方便高效使用分布式数据资源的问题,是地矿点源信息系统网格体系的重点研究对象。其研究内容主要集中在广域、异构、分布环境下如何对数据进行管理;如何从地理分布的各种异构数据资源中获取数据;并通过地域分布的协作和处理,从数据源中获取有用信息13。数据网格主要研究海量分布式空间数据统一管理和高效访问。关键技术包括元数据目录和资源代理等(如图 3) ,元数据目录实现网格中的各种实体对象,包括所有空间数据的统一逻辑视图,为空间数据的统一管理和高效访问打下基础,是空间数据网格的核心,其信息注册与发布服务支持新实体的注册和利用元数
15、据目录进行数据发布;资源代理用于将高层用户的存储、检索数据的请求映射为网格的底层操作14。地质矿产点源信息系统的服务网格也可称为应用网格,是将一些功能性的模块类似于插件方式分布在网络上,它是一些特定功能逻辑表达式,既可能是一些公用的应用子程序,也可是面向主题或任务特定模块,这正是网格知识生产性的体现。在网格操作系统的支持下,网格用户可使用其提供的可视化工具或环境开发各种应用系统,用户可以方便地共享网格中的各种资源,可视化界面起着重要作用。在本网格体系中,服务网格是整个网格的外层,具有响应用户需求、整合海量数据的一些知识生产能力。对外充当用户接口和资源获取的途径,对内充当行动指挥;数据网格是数据
16、的提供者,具有一定的自我维护功能。它作为本网格体系的中间层,向外响应服务网格的数据简单查询功能,向内满足计算网络的数据需求;计算网格是响应来自服务网格具体大型任务的执行者,它处在本网格体系的内层随时提供大型运算。4 结语本文讨论了网格计算的有关概念及其最新的研究进展,并在此基础上讨论了地质矿产点源信息系统的平台概念、特点及其体系结构。将网格最新技术融合到地质矿产点源信息系统信息存储和管理中是目前最先进的互联网技术与思想同地学信息科学的紧密结合,也是对发展数字地球、数字城市等的关键技术的探讨。尽管从目前的现成的基于网络发展到基于网格的地矿点源信息系统还有一段相当长的路要走。但网格技术的发展可以解
17、决当前地球空间信息的共享严重滞后于网络技术发展的速度和改变“数字地球“等区域数字模型发展停滞不前的局面。本文将地矿信息系统的网格分成了三种不同的类别:计算网格、数据网格、应用网格,并分别描述各自的功能与组成及其三者相互间的关系。本文认为,针对当前网格的优点,充分利用浩如烟海的网络资源,将传统的地学信息技术与网格技术结合在一起,构建基于网格的地质矿产点源信息系统,是十分有效而又必要的。它应该成为下一阶段地矿信息化发展的重点领域。同时由于“数字地球”等区域数字模型发展存在广泛的应用情景,计算机科学推进网格计算技术到地学领域,有着广阔的发展前景;而且网格技术的发展及应用将对地学领域的发展起到极大的推
18、动作用。参考文献1 李勇.大规模 VOD 及其支撑技术的研究D.博士学位论文,20002 孙培德.网格计算的研究新进展.计算机工程与应用,2003(16):653 Mckee L.Building the GSDIR.The Open GIS Consortium, 1996-084 Foster I, Kesselman C. The Grid: Blueprint for a New Computing Infrastructure. San Francisco, CA: Morgan Kaufmann Publishers,19985 Foster I, Kesselman C. The
19、 Grid: Blueprint for a New Computing Infrastructure. San Francisco, CA: Morgan Kaufmann Publishers, 19986 汪 洋. 因特网的第三个大浪潮网格(Grid).国际技术经济研究,2002,(40)7 赛迪网. 我国网格研究现状. http:/ 李德仁, 朱欣焰等. 从数字地图到空间信息网格. 武汉大学学报信息科学版. 2003 , 28 (6):6429 吴冲龙. 地质矿产点源信息系统的开发与应用.地球科学中国地质大学学报,1998, 23 (2) : 193 - 198.10 龚 强. 基于网格解决空间信息问题的思考. 测绘与空间地理信息, 2004, 27(5):11- 1211 王意洁, 肖 侬等. 数据网格及其关键技术研究.计算机研究与发展, 2003, 39(18):94412 天极网. 网格技术与知识管理革命. http:/ 何 戈, 徐志伟. 数据网格技术研究 . 微电子学与计算机. 2003(4):3- 1014 于雷易. GIS 网格体系结构探讨. 武汉大学学报信息科学版. 2004, 29(2):153- 156