1、用虚拟化技术进行信息系统应用级容灾的建设本文通过对信息系统利用虚拟化进行应用级容灾的优势与必要性以及需求进行分析,简述在虚拟化环境中构建应用级容灾系统的过程,探讨了应用级容灾的方式,为信息中心建立应用级容灾系统提供一种参考方法。容灾是企业数据管理中的一个重要环节。近年来,国内频频发生的自然灾害事件给企业 CIO 提出了一个问题,灾难备份到底要做成什么程度才能满足企业的业务连续性要求1灾备建设参考法规和标准11信息系统灾难恢复规范(GBT 20988 2007)我国至今已发布一系列的文件对灾难备份建设进行指导和监督,其中国务院信息化工作办公室2005年发布的重要信息系统灾难恢复指南最为重要。20
2、07年7月, 重要信息系统灾难恢复指南正式升级成为国家标准信息系统灾难恢复规范(GBT 209882007 o 这是中国灾难备份与恢复行业的第一个国家标准,并在2007年11月1日开始正式实施。我国灾难恢复等级划分:大致可以分为两类:数据类、应用类。第1级:数据介质转移;第2级:备用场地支持;第3级:电子传送和部分设备支持;第4级:电子传送和完整设备支持;第5级:实时数据传送及完整设备支持;第6级:数据零丢失和远程。12灾备建设遵循标准各种灾难时间按照发生频率可排序如下:软灾难、硬件灾难、自然灾难。因此,软灾难的防范是数据灾备建设过程中重点考虑对象,同时要兼顾到硬件灾难与自然灾难。从技术上看,
3、衡量灾备系统有两个主要指标:(Recovery Point Object)和RTO(Recovery Time Object),其中 RPO 代表了当灾难发生时允许丢失的数据量;而 RTO 则代表了系统恢复的时间。在数据保护和灾备系统建设中主要有三个指标:PTO(Recovery Time Object,恢复时间目标)PTO 是将信息系统“从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态”所需时间,其中包括备份数据恢复到可用状态所需时间、数据处理系统切换时间、备用网络切换时间等,该指标用以衡量灾备方案的业务恢复能力。RPO(Recove
4、ry Point:Objective,恢复点目标)tkPO 是指业务系统所允许的灾难过程中的最大数据丢失量。数据保护的根本目的,就是在一定的预算和技术基础上,要求实现尽量小的 RTO、1KPO。当发生各种故障时,可以进行快速的系统和数据恢复,使得系统继续发挥作用,提供数据服务和业务服务能力。RR(RecOvery Radius,灾备半径)RR 即主站点与备份站点间的距离,指灾备系统能够承受多大物理距离内的灾难,应对自然灾害。2应用级容灾的功能特性以及传统容灾方式简介容灾,顾名思义是业务系统在灾难发生时的承受和抵御能力。业务系统通过容灾机制来保证数据的安全可靠,提高系统的可用性,并确保业务的连续
5、性。从对用户整个业务连续性的保障程度来看,容灾可以分为两个级别:数据级别和应用级别。21数据级别数据级别容灾的关注点在于数据,即灾难发生后可以确保用户原有的数据不会丢失或者遭到破坏。数据级的容灾较为基础,数据级别容灾是保障数据可用的最基本要求,当数据丢失时能够保证应用系统可以重新得到所有数据。该级别灾难恢复时间较长,延迟大,仍然存在较大风险,尽管有时候用户原有数据没有丢失,应用也会被中断,用户业务也会被迫停止。但这种方案的特点是成本低、构建简单。22应用级别对于业务应用繁多、而且系统需要保持7*24小时连续运行的企业来说,显然需要高级别的应用容灾系统来满足他们的需求。应用级容灾是在数据级容灾的
6、基础上,再把执行应用处理能力复制一份。应用级容灾系统能提供不间断的应用服务,让用户应用的服务请求能够透明地继续运行,而感受不到灾难的发生,保证业务系统提供的服务完整、可靠、安全,以及业务的连续。3构建在虚拟化环境中的容灾系统为信息系统建设带来的变革31虚拟化概述虚拟化就是淡化 用户对于物理计算资源,如处理器、内存、I0设备的直接访问,取而代之的是用户访问逻辑的资源,而后台的物理连接则由虚拟化技术来实现和管理。从而实现了灵活性、可靠性、可扩展性、安全性、降低成本。32如何定位业务连续性业务连续性就是将宕机时间缩短到最小 构建业务连续性解决方案的需求有以下四点:(1)构建在可靠的平台之上:这个平
7、台本身的可用性必须很高,并且不依赖操作系统或特定驱动装置;(2)独立于物理架构之外:这样物理架构的缺陷将不会导致业务系统的不稳定;(3)贯穿操作系统和应用程序的保护:虽然我们需要保护的是业务系统,但是与业务系统息息相关的操作系统、配置文件等也必须考虑进来;(4)广谱宕机因素的保护能力:这个系统必须能对计划内与计划外的宕机提供保护,同时对组件、服务器、数据以及站点灾难同样要提供保护。在虚拟化平台之上为业务连续性的每一个层面都能提供保护,当这些保护措施不足以满足我们业务连续性的要求时,还有更多的、专注单一层面解决方案,可以和虚拟化平台有机的进行结合。例如:在 VMware 环境中 Vizionco
8、re VVSP 的各个组件可以提供对虚拟化平台更加优化的管理,这其中包含容灾管理。33灾难恢复需考虑的要素3 3 1想要达成什么样的灾难恢复目标很重要,灾难恢复分为以下三种:本地高可用:冷备 有备机是否就已足够?热备,MSCS?VCS?VMware HA?VMware FT?系统级切换还是应用级别的切换?远程数据保护:仅有数据足够吗?在灾难恢复发生时,怎么让数据能够使用起来?仅有应用足够吗?在灾难恢复发生时,怎么去获得生产数据让应用能够发挥作用?任何情况下不间断运行:真的需要实时切换吗?实时切换的巨大投入(硬件、软件、线路、人力)是否能购承受?332灾难恢复的实现方式基于应用程序灾难恢复解决方
9、案:应用程序在本地、远端双写 I0,需要从写应用程序,周期长,不稳定;基于数据库复制的远程灾难恢复解决方案:数据库本身的远程复制(Oracle DB Guard),只能复制数据库自身的文件;基于主机的远程数据复制软件灾难恢复解决方案:复制软件在卷管理器层面截获IO,远程复制,支持异构存储平台,但是低效率、对主机的运行有影响,配置复杂;基于存储的远程数据复制灾难恢复解决方案:智能存储远程数据复制,相对安全、成熟、简单、高效、节省资源,但是对存储的要求比较高,一般要求同构平台;基于虚拟化平台的远程数据复制软件灾难恢复解决方案:复制软件在虚拟化存储层面截获 I0,远程复制,支持异构同构存储平台。在虚
10、拟架构下系统和数据采用同样的方式来保护,系统也是数据,保护系统的同时就保护了数据,反之亦然。虚拟机既存储系统也存储数据,整个系统封装在文件中:硬件配置,操作系统,应用及数据。这样我依靠虚拟化的硬件独立性,可以可靠地将虚拟机恢复到其他的硬件服务器上,并可将整个系统迅速转移到灾难恢复中心;由于关于系统的所有信息都以数据的方式存储在磁盘上,我们可以依靠虚拟化的封装性,用保护数据的方式保护整个系统;我们可以依靠虚拟化的分区和整合特性,保障生产中心与灾备中心服务器的比例不在是1:1;同时我们可以依靠虚拟化的资源池化特性,确保生产中心与灾备中心基础架构的一致性。这样使得在虚拟化环境中用任何你喜欢的方法(自动或者手动)将数据(包含系统、应用及数据)复制过去,然后启动虚拟机即可,从而获得最好的 RTO。4总结通过在虚拟化环境中部署应用级容灾软件,实现司信息系统高效安全的“两带三中心”容灾系统,提高了信息系统的稳定性,数据的安全性,促进信息化安全平稳运行。