1、惠普灾难恢复和业务连续性解决方案1. 业务需求在数据的增加和系统化管理进一步推进的同时,我们越来越重视对数据本身进行的风险管理。为了在发生故障时,能够用最快的速度重新展开继续工作,很多企业都已经把 BCP(业务连续性计划)的策划当成了自己的一项必须履行的义务。业务连续性是指一个企业为了维持其生存,一旦发生突发事件或灾难后,在其所规定的时间内必须恢复关键业务功能的强制性要求。业务连续性强调的是企业业务的不间断能力,即在灾难、意外发生的情况下,企业无论是组织结构、业务操作和 IT 系统,都可以以适当的备用方式继续业务运作。灾难恢复解决方案主要是解决 IT 系统的灾难恢复问题,是业务连续性的重要组成
2、部分。一般灾难恢复解决方案由 IT总监负责,业务连续解决方案由企业高级管理层负责。2005 年 1 月,国务院信息化工作办公室联合银行、电信、电力、铁路、民航、证券、保险、海关、税务等相关行业,专门就信息灾难备份的国家标准进行多次研讨,并出台了重要信息系统灾难恢复指南 ,该指南对灾难恢复的等级划分、容灾环境的实施层次、流程进行了详细定义和说明。惠普的灾难恢复和业务连续性解决方案完全符合该指南的要求。2解决方案概述HP 公司所提供的业务连续解决方案是端到端的整体解决方案,包括技术、流程、人员三个方面,涵盖从服务器,存储系统,光纤网络互连设备到软件、数据库在内的相关 IT 范围,还包含人员组织建设
3、,人员培训和容灾知识普及,灾难恢复流程设计及演练,以及实施完成之后的持续支持服务。HP 的灾难恢复和业务连续解决方案将从技术、流程、人员三个方面帮助客户进行系统建设,包括数据的远程复制、关键业务应用程序的紧急切换,进而实现关键业务的连续运行:帮助客户建立一套行之有效的业务连续计划和灾难恢复计划(BCP/DRP):业务连续性计划 Business Continuity Plan (BCP)是一套高级管理和规章流程,用于企业业务连续性的管理,使一个组织在突发性事件或灾难面前能够迅速作出反应,以确保关键业务功能可以持续,而不造成业务中断或业务流程本质的改变。业务连续性计划定义了系统的潜在风险和恢复关
4、键业务功能的补救措施。灾难恢复计划 Disaster Recovery Plan (DRP),从广义上说,就是事先计划和定义好的,在发生灾难时可以有准备的恢复IT 系统的措施。从狭义上说,就是一本记录了发生灾难时如何应对和详细恢复步骤的文档。BCP/DRP 包括多个关键流程如:灾难通知流程(Call tree),灾难界定与决策流程,紧急应对和业务切换流程,紧急运行管理流程,系统恢复和业务回切流程等等。使得业务连续成为有章可循,易于操作的系统。帮助客户建立一个业务连续团队:包括人员选择,制定相关的角色和职能,相关技术和流程培训等等。使得客户能够通过合格的人员与严格的制度来确保业务连续系统作用的有
5、效发挥。HP StorageWorks 则针对企业 BCP 的需求,提供了能够根据服务层选择相应持续性的最佳解决方案。集群解决方案Continental ClustersMetro ClustersClusters Extension复制解决方案Continuous AccessBusinessCopyOracle Data GuardOpenView Storage Mirroring恢复解决方案FRS2003Data Protector ZDBOBDR3. 方案特点HP 公司具有业内最先进的业务连续知识方法体系,有大量通过国家容灾协会 DRII 认证的业务连续专家。通过将国际标准的方法论和
6、 HP 长期的业务连续系统建设经验相结合,HP 提供的业务连续解决方案是从客户实际出发,符合客户业务需要的,切实可行的业务连续方案。HP 公司具备业界最全面的企业级产品体系,同时 HP 还可以采用其它经验证是业界领先的第三方产品来共同为客户设计和建设容灾系统。这样在采用先进技术手段的同时,充分保护了客户的投资、提高了客户设备的使用效率。HP 公司的业务连续方案不仅仅为客户提供数据级容灾,通过 HP 的主机和集群技术还可以帮助客户建设应用级容灾系统。通过 HP 业务连续专家的咨询服务,客户可以在此基础上进一步实现业务级的容灾系统,达到业务全天候连续运行的目的。HP 公司在国内具有大量的成功案例和
7、丰富的专家经验,可以帮助客户实现多种手段的业务连续/容灾系统的建设,在制造,金融,电信,政府等多个行业均有杰出表现。在电信系统HP 已经成功实施了中国移动集团公司、浙江移动、江西电信等。另外惠普具有真正的容灾系统真实切换经验,国内多个惠普实施的容灾系统经历了灾难或意外事件后,容灾系统切换成功。4. 业务价值HP 的灾难恢复方案适用于对应用系统要求 7x24 小时不间断运行的企业用户,尤其适用于对数据的完整性,实时性极为敏感的银行,电信,大中型企业用户。建设灾难备份/恢复中心有如下的意义: 为企业计算系统的正常升级,更换部件提供不停机环境。 重要业务数据在灾难发生后得以有效保护。最大限度地保护数
8、据的实时性,完整性和一致性。业务数据是用户最宝贵的资产之一,数据的损失就是企业资产利润的损失,所以保护业务数据是企业计算系统的主要功能之一。实施 HP 的容灾方案可以将用户数据的损失降至最低甚至为零。 重要业务在灾难发生后可以在设定的时间内恢复,从而实现业务的连续运行,极大降低企业业务在各种不可预料灾难发生时的损失,保证业务系统的 7x24 小时不间断运转。 业务计算机系统抵御突发性灾难的能力和级别提高 进一步提高企业声誉,增强客户及潜在客户的信心 扩大对同行业竞争对手的优势5. 系统架构在业务中,主要是进行数据处理,关键数据和数据库的备份操作已经成为日常运行处理的一个组成部分,以确保出现问题
9、时及时恢复重要数据。但是由于通常数据采用磁带离线备份,当数据量较大或突发灾难发生时,备份磁带无法真正及时恢复数据,所以 HP 公司专门为企业用户提供了一套完整的灾难恢复方案,包括服务器,存储设备,软件,特别对相关的备份和灾难恢复解决方案部分进行详细阐明。它由主数据中心和备份中心组成。主数据中心采用 HP高可靠性集群解决方案设计,备份数据中心与主中心通过光纤或电信网相连接。主中心系统配置主机包括两台或多台 HP UNIX 服务器以及其他相关服务器,通过安装 HP 公司的MC/ServiceGuard 软件组成多机高可靠性环境。数据存储在主中心存储磁盘阵列 XP 或 EVA 中。同时在异地备份中心
10、配置相同结构的存储磁盘阵列 XP 或 EVA 和一台或多台备份服务器。主、备中心距离少于 10 公里时,主中心存储磁盘阵列XP 或 EVA 可以通过光纤交换机互连的方式与备份中心的磁盘阵列 XP 或 EVA 连接;在距离 100 公里以内,可以使用DWDM 的连接方式;距离较远时,可租用电信的E1/E3、ATM 等通信方式。通过 HP 提供的灾难恢复软件(HP Continuous Access XP) 可以自动实现主中心存储数据与备份中心数据实时完全备份。在主数据中心,按照用户要求,还可以配置磁带备份服务器,使用 HP 备份软件 Data Protecter ,以及磁带库。备份服务器直接连接
11、到存储阵列和磁带库,控制系统的日常数据的磁带备份。 其结构图如下所示:备份中心必须满足以下条件:1.具备与主中心相似的网络,通信设置;2.具备业务应用运行的基本系统配置;3.具备稳定,高效的电信通路连接主中心,例如光纤,E3/T3,ATM,确保数据的实时传输;4.具备日常维护条件;5.与主中心相距足够安全的距离。在主数据中心,按照高可靠性原则,推荐用户利用 HP 公司的 MC/ServiceGuard 软件配置双服务器高可靠性环境。双机同时连接到存储阵列,HP 公司的 XP 或 EVA 上。任何一台服务器出现故障时,另一台服务器即可自动立即接管故障服务器的所有应用继续运行,保证用户业务应用的持
12、续运转。同时,按照 HP 公司提供的远程灾备方案,将用户数据随时通过 XP或 EVA 的远程连接通道实时传送到备份中心的 XP 或 EVA 存储阵列中。当灾难情况发生,为了确保企业的有效运转,保护企业关键数据,可以立即在备份中心的备份服务器上重新启动主中心应用系统,依靠实时备份数据恢复主中心业务。当主数据中心系统恢复后,备份中心存储系统的更新数据可以在应用运行不停机的情况下,一次性将数据重新拷贝回主中心继续使用。按照 HP 的灾难备份方案实施,还可以为用户提供灵活的备份方式,主备中心可以同时运行不同应用,互相备份。这样可以做到尽可能的利用机器设备,保护用户投资。三站点容灾解决方案对于关键的应用
13、和数据,许多大型企业需要采用三数据中心的容灾解决方案,在三数据中心的模式下,在主中心和邻近的热备中心之间,应用数据通过同步复制从主中心复制到中间数据中心,保持数据中心的完全同步。同时,数据被异步复制到一个任意距离的远程数据中心。在本地出现灾难的情况下,用户可以选择切换到中间数据中心或远端数据中心(有一些数据丢失) 。如果灾难影响到主中心和中间数据中心的地理范围,用户可以将应用切换到远程数据中心(有一些数据丢失) 。三数据中心的解决方案提供了最有实现最小数据丢失和停机时间的灾难保护方案。6. 典型配置 Unix 服务器,NonStop服务器,PC 服务器,IBM 主机系统 主机集群软件 HP X
14、P系列阵列或HP EVA 系列阵列 HP Continuous Access XP/EVA数据复制软件 SAN 交换机 DWDM设备或FC-IP协议转换设备(根据距离可选) 容灾集群解决方案Continental Clusters/Metro Clusters(可选 )7. 参考客户惠普公司在国内实施过大量业务连续和灾难恢复咨询和集成建设的项目,并获得了客户的极高的评价。部分实施案例如下:惠普国内容灾案例(部分)电信行业 金融行业 制造行业 公共行业上海热线 平安保险 中国石油 广州国税浙江移动 中国人寿 三星电子 东方航空中国移动总公司 浦发银行 一汽大众 上海社保中国网通 山东农行 华晨宝马 上海电力浙江电信 上海证交所 富士康 上海外高桥码头黑龙江联通 湖南建行 江铃汽车 广州电力福建联通 湖南农行 海力士半导体 COSCON 江苏电信 广西农行 上海大众 盐田港辽宁移动 云南建行 上海烟草 洋山港