1、1云计算基础设施层的研究摘要:本文重点讨论了云计算基础设施层的工作原理、功能概述以及构建核心技术,对于深度解析云计算服务架构有重大意义。 关键词:云计算 基础设施层 基础设施即服务 1 概述 目前国外云计算领域内产生重大贡献的有 Google App Engine、甲骨文的 Salesforce.Com 和 Amazon EC2 等,对它们的云计算产品研究后都不难发现,他们取得的成就多是在平台及服务层和软件即服务层,而在基础设施即服务层的成就是相当少的,基础设施层的代表产品有 Google的 Google Storage、Amazon 的 Amazon S3 等一些存储服务,业界在基础设施层的
2、领袖当首推 IBM,IBM 的“蓝云”解决方案在虚拟化、数据优化和数据保护方面的技术贡献是有目共睹的。云计算的服务模式按照由底向上层次分为三种:基础设施即服务、平台及服务和软件即服务,上层服务依赖于下层服务的部分功能,同时又可以按需调用下层服务的部分功能,所以,云计算三层服务模式协调工作的实现与否取决于最底层即基础设施层的构建。 2 云计算概述 云计算一词的最早出现是在 2006 年的搜索引擎大会上,由 Google首席执行官 Eric Schmidt 首次提出,但云计算并非全新的技术,它是由分布式技术、虚拟化、HTML 等技术整合而来的,纵然如此,它却是公认2的继个人计算机变革、互联网变革之
3、后的第三次 IT 浪潮,云计算风靡全球的本质原因在于云提供商能为用户提供海量的(大量计算机构成的资源池) 、随心所欲(动态可伸缩) 、廉价(按需收费)的计算能力,这种计算能力包括硬件、软件,从而大大减少用户在维护运行环境、初期投资、规模扩展等的成本,也是“环保”IT 发展的一个方向。 3 云计算基础设施层概述 云计算基础设施层的构建关系到整个云计算架构能否正常工作,所以说基础设施层是云计算构建的重中之重。 3.1 云计算基础设施层工作原理 基础设施层将经过虚拟化的计算资源、存储资源和网络资源以基础设施即服务的方式通过网络提供给用户使用和管理。 3.2 云计算基础设施层功能、核心技术 虽然不同云
4、提供商的基础设施层在所提供的服务上有所差异,但是作为提供底层基础 IT 资源的服务,核层一般都具有以下基本功能4。 3.2.1 资源虚拟化。由云计算基础设施层的工作原理可知,设计云计算基础设施层的首要工作便是将大量的基础设施、操作系统等资源虚拟化,从而实现资源管理的高层次逻辑,达到简化硬件资源表示、访问和管理,同时定义标准的输入、输出接口达到资源的交互的目的。目前流行的虚拟化技术有内存虚拟化、桌面虚拟化、系统虚拟化等,限于篇幅本文在此以内存虚拟化为例探讨虚拟化相关技术。内存虚拟化技术的核心是在屏蔽硬件资源差异的基础上,控制地址转一致性,如分配内存、页表、管理 TLB 等,要让 VMM 必须对物
5、理内存有最终的控制权,严格控3制将客户物理地址空间映射到主机物理地址空间的操作,保证顺利实现内存虚拟化,最终以统一的资源池方式对内存资源整合、管理。 3.2.2 资源功效监控。资源功效监控又叫资源监控,是保证硬件基础资源工作效能的关键步骤。云计算基础设施层要实现负载管理的前提首先便是对资源进行监控,由于硬件资源参差不齐各有差异,针对不同资源监控的指标也不尽相同,比如,对内存空间的监控,则看中使用率,主要监控内存的读写频率,而对于网络资源监控重在对输入输出流量、路由状态等的监控。资源监控的核心在于要在资源虚拟化的基础上建立一个针对全局资源的监控方案,即资源监控模型,该资源监控模型要能实现对资源监
6、控对象、监控指标的描述,而且,资源监控模型随不同虚拟化资源层次、虚拟化的粒度不同而体现随机应变的功能,能够对虚拟化资源进行整体和局部的有效监控。 3.2.3 节点负载管理。云计算基础设施层就是一个大规模的硬件资源的集群环境,在这样的集群环境中每一个硬件资源节点(虚拟资源节点)的负载并不相同,甚至是起伏不定不带规律的,虽然不能消除硬件资源节点之间负载的差异,但是如果不能通过一定的机制实现“负载均衡” ,将造成的危害是严重的也是必然的。负载过重会关联到系统效率低下、数据危机增高,负载过低又会导致宝贵的资源大大浪费,节点资源管理便显得尤为关键。云计算基础设施层节点负载管理的核心就是将资源节点通过自动
7、化的平衡机制进行合并,然后全局分摊负载,进而提高资源利用率保证本层及上层资源的服务性能维持在理想范围之内,使得基础设施层资源负载能够自动化的转移,整体资源负载和利用率保持在4一个平衡度上。比如理想的处理器负载应该控制在 60%至 80%之间,才能很好得调节性能和利用率。 3.2.4 资源存储管理。基础设施层资源存储管理即存储虚拟资源文件的存储和管理,通常云计算基础设施层会运行上千个的虚拟机,怎样合理存储海量的虚拟机镜像文件、保存在虚拟机内的业务文件以及随应用程序运行而带来的存储数据等资源和对这些资源的科学管理是一个关键问题。云中数据都是相当重要但用途不尽相同的,资源存储管理的核心技术在于解决数
8、据存储和基础设施层高可用性、负载均衡的矛盾,建立一个保证基础设施层高可用性的存储机制是很重要的。比如,应用程序产生的存储数据和虚拟机镜像文件都是虚拟化资源的核心数据,镜像文件内存大且随虚拟机运行而逐渐增加,是虚拟机系统运行核心文件,而应用程序运行过程中产生的业务数据直接关系到云应用的可用于否。在这种两难问题上,业内已经有了很好的解决方案。将应用的业务数据保存到虚拟机外,一旦某台虚拟机出现故障,便可迅速开启另一虚拟机并调用保存在特定位置的业务数据,使得整个集群环境不会因为一台虚拟机出现故障而整体瘫痪,系统高可用性能大大提高。 3.2.5 资源自动化部署。资源自动化部署即基础设施层通过一个部署流程
9、将虚拟化资源自动化分配给上层应用,以使得基础设施层服务可用。资源自动化部署并非一劳永逸的,通常当资源虚拟化环境准备就绪,应用程序开始构建的时候,会进行第一次资源自动化部署,称为资源部署初始化。随着应用程序运行对底层资源需求增多,会进行多次自动化部署,称为动态部署。如果系统能够通过增加资源以满足不断增长的性5能需求,或通过缩减资源以降低成本,则称这种系统是可伸缩的。由云计算基础设施层资源部署机制工作原理可知,资源部署的自动化和云计算基础设施层的动态可伸缩性息息相关。云应用会随用户需求和服务状态变化而调整,自动化进行资源部署,以解决应用程序工作负载高、故障恢复和硬件维护等“紧急问题” 。 3.2.
10、6 资源安全管理。研究机构 Gartner 发布的一份名为云计算安全风险评估报告,其中列出了云计算技术存在的七大风险。即特权用户的接人、可审查性、数据位置、数据隔离、数据恢复、调查支持和长期生存性。云计算基础设施层资源安全管理正是应对以上风险而专门设计的功能,另外,为了合法保护基础设施层的虚拟化资源不被恶意盗用、破坏,保护合法用户的切身权益,在云计算基础设施层的资源安全管理环节,数据中心通过设计类似计算机防火墙专用的隔离手段,以进一步提高资源的安全性。 3.2.7 收费管理。云计算的收费方式是按需收费,虽在不同的层次和服务上,收费选取的变量不同,本质却是一致的“按需收费” 。这种合理的收费方式
11、给用户以极高的“性价比” ,成为云计算蓬勃发展的一大因素。按需收费即是针对用户在一段时间内所占用的存储资源、网络资源等计价收费,业界通用的收费方式大致有两种:实时计费,真正用多少资源就收多少费;为用户预设几种固定资源配置类型,每种类型都有单位时间内的计费标准,用户选择一种类型使用并根据使用时间长短进行付费。第一种方式对各种资源使用的监控准确度要求很高,因此很少被真正采用;而第二种是一个相对折中的办法,使用时间长短和所选择的资源配置类型是计费变量,实施起来比较容易,因此被广泛采6用4。 4 结束语 由于云计算三个层次之间是相互依赖的,它的每个层次的设计都不是一独立的过程;基础设施层是以硬件资源为
12、中心的,它的搭建关系到整个云计算架构的功能实现,基础设施层的功能复杂、工作量大,它由内而外,直接面向硬件资源(虚拟化) ,同时又直接向上层、应用程序提供服务(存储数据) ,设计一个动态灵活的基础设施层在云计算架构搭建过程中显得尤为重要。 参考文献: 1云计算核心技术剖析M.人民邮电出版社,2011.5. 2王鹏.走近云计算M.北京:人民邮电出版社,2009. 3杨正洪,郑齐心,吴寒编著.企业云计算架构与实施指南M.北京:清华大学出版社,2010.4. 4战略蓝图与技术架构/虚拟话与云计算小组编著.云计算时间之道M.北京:电子工业出版社,2011.1. 5洪燕.基于 Linux 的可伸缩服务器集群的研究与设计J.2005.3. 通讯作者:沐士光(玉溪师范学院信息技术工程学院) 。