1、第 1 页第 1 章 存储容灾为业务运营遮风挡雨1.1 构建存储容灾解决方案的重要性随着社会的发展和科技的进步,企业越来越依赖于数据处理来进行业务运营,对 IT 系统的依赖性也随之增加。然而,灾难就像灰尘一样伏击在企业周围,您的业务可能正在一个充满风险和威胁的世界里运行: 无法预知的 IT 硬件设备的损坏、断电、火灾、自然灾害、恐怖袭击等,造成数据丢失或业务的突然中断; 系统人员误操作造成意外宕机或关键数据丢失,无法避免; 手段频多的黑客攻击、病毒入侵、垃圾邮件、网络与系统的漏洞,造成网络瘫痪、系统崩溃。如果不能对风险采取有效治理,一旦数据由于上述某种原因丢失,就有可能造成整个企业在运营上的重
2、大不便和经济损失,企业的信誉也将受到影响。如果核心数据丢失,严重时完全有可能造成整个企业的瘫痪。由此可见,保证企业的业务连续运营及数据处理的高可靠性和高可用性,已经成为所有 IT 人员在建设 IT 基础架构中首先要考虑的问题。与此同时,我们需要考虑建立和加强企业的业务恢复计划,以便在发生系统灾难后能够从容应对风险。企业对存储系统提出了以下要求: 数据与存储系统的高可用性,保证数据 7X24 小时的连续访问; 将现有的存储技术集成,创造出一种更有效的数据存储管理,实现高效、高可靠性、低成本的数据管理; 需要对企业现有的数据库、邮件系统、文件服务器以及各种应用系统进行集中化、自动化的基于策略的保护
3、; 需要一套成熟度高,业内应用广泛的企业级软硬件整体解决方案; 易于IT部门日常的管理维护,界面友好,可操作性强; 一旦发生灾难(洪水、地震、火灾等 ),或者人为灾难 (用户失误、磁盘失效等)导致数据丢失或者业务中断时,能够快速、及时地恢复数据,保证业务的连续运行。第 2 页1.2 IBM 企业级存储 DS8000 容灾解决方案简述IBM 企业级存储容灾解决方案通过 IBM System Storage DS8000 企业级高端磁盘存储系统,结合 IBM 特有的数据复制技术 Metro Mirror(同步的数据复制)和 Global Mirror (异步的数据复制),在两套或多套 DS8000
4、 磁盘存储设备间建立数据复制关系从而实现高可用性,在数据存储方面提高您 IT 基础架构的整体可用性。方案配合 Power 服务器 AIX 操作系统的特色软件 PowerHA/XD及 IBM 全面的业务连续性计划配套服务,为您建立完善的灾难备份中心,从而保证关键数据的可恢复性与业务应用的可持续性。1.3 IBM 企业级存储容灾方案的价值IBM企业级存储容灾解决方案从多方面提高您的IT基础架构的整体可用性,使您能够有效地管理风险、保证业务的连续运行,并给您带来以下好处: 100% 的本地数据访问弹性; 提高系统可用性,增加业务的可持续性,关键业务应用程序免受故障影响; 根据业务规范制定全面的连续性
5、和恢复计划,确保程序和基础架构有效地恢复; 预测潜在崩溃,并实施计划来保持业务系统和资源的可用性; 在灾难和不可预知事件发生后,最快恢复关键业务数据,保障业务运营持续性; 加强风险管理,提高市场竞争力; 提高业务服务水平,提升客户满意度。第 3 页第 2 章 IBM 企业级存储 DS8000 容灾解决方案介绍2.1 DS8000 容灾解决方案介绍我们按照两地三中心、异地两地、本地存储 HA+异地灾备的方案架构分别介绍基于 DS8000存储系统的容灾解决方案。2.1.1 两地三中心方案(MGM) 灾备复制方法:Power Server + DS8000 + Metro/Global Mirror
6、 +Power HA XD 集群我们选用 IBM 的企业级存储系统 DS8000,结合磁盘层叠式数据复制技术(Metro Global Mirror,简称 MGM)为您建立两地三中心容灾解决方案:在本地生产中心的 DS8000 存储相应的业务数据,通过 Metro Mirror 数据同步复制技术将数据复制到同城灾备中心的 DS8000,可以实时保证数据的一致性。同时位于同城灾备中心的 DS8000 的同一份数据可以同异地远端的DS8000 通过 Global Mirror 数据异步复制技术进行数据镜像,实现异地的数据备份及保护。当同城灾备中心发生故障时,生产中心的 DS8000 可以向异地灾备
7、中心的 DS8000 通过 Global Mirror数据异步复制技术同步数据,实现异地的数据备份及保护。生产中心及灾备中心的数据库服务器均由 Power 服务器来承担,当生产中心所在地发生灾难时,生产中心的 Power 服务器 AIX 操作系统的 PowerHA/XD 功能将应用切换到同城灾备/异地灾备中心的 Power 数据库服务器,同时灾备中心的 Power 服务器接管灾备中心的存储,从而恢复数据的访问及业务的连续性。第 4 页方案技术优势: 同城范围镜像数据可以不丢失; 异地镜像数据根据灾难情形,尽可能降低数据丢失机率; 镜像网络中断恢复后,任意两站点之间可以通过增量方式实现再同步,无
8、需重传; 生产中心应用系统响应时间只受本地的两个中心的距离影响。生产中心 同城灾备中心异地灾备中心第 5 页 同城 RPO=0,距离 Max 303 公里, 异地 RPO 最短 3-5 秒,无距离限制,保证数据一致性,且可故障切换 带宽要求低(较友商磁盘级 DR),先进的复制机制提高带宽利用率 充分利用同城灾备中心的设备,DS8000 FlashCopy 的数据可用于系统查询、批处理、测试2.1.2 异地二地灾备方案(GM) 灾备复制方法:Power 服务器 + DS8000 + Global Mirror +Power HA XD 集群我们选用 IBM 的企业级存储系统 DS8000,结合磁
9、盘数据异步复制技术 Global Mirror 为您建立异地二地容灾解决方案:在本地生产中心的 DS8000 存储相应的业务数据,可以同异地远端的 DS8000 通过 Global Mirror 模式进行数据镜像,实现异地的数据备份及保护。生产中心及灾备中心的数据库服务器均由 Power 服务器来承担,当生产中心所在地发生灾难时,生产中心的 Power 服务器 AIX 操作系统的 PowerHA/XD 功能将应用切换到异地灾备中心的 Power 数据库服务器,同时灾备中心的 Power 服务器接管灾备中心的存储,从而恢复数据的访问及业务的连续性。第 6 页方案技术优势: 异地 RPO 最短 3
10、-5 秒,无距离限制,保证数据一致性,且可故障切换 带宽要求低(较友商磁盘级 DR),先进的复制机制提高带宽利用率2.1.3 存储 HA+异地灾备(HA+GM) 灾备复制方法: Power Server + DS8000 + Metro Mirror + Global Mirror +Power HA XD 集群我们选用两台 IBM 的企业级存储系统 DS8000,在本地生产中心的 DS8000 存储相应的业务数据,在生产中心通过数据同步复制技术 Metro Mirror 实现数据的实时同步,实现存储的高可用性,任意一台存储的宕机,也不会影响业务的运行。同时,结合磁盘数据异步复制技术Globa
11、l Mirror 为您建立异地二地容灾解决方案:本地生产中心的其中一台 DS8000 存储可以同异地远端的 DS8000 通过 Global Mirror 模式进行数据镜像,实现异地的数据备份及保护。生产中心及灾备中心的数据库服务器均由 Power 服务器来承担,当生产中心所在地发生灾难时,生产中心的 Power 服务器 AIX 操作系统的 PowerHA/XD 功能将应用切换到异地灾备中心的 Power 数据库服务器,同时灾备中心的 Power 服务器接管灾备中心的存储,从而恢复数据的访问及业务的连续性。方案技术优势:第 7 页 生产中心存储 HA,RPO=0 异地 RPO 最短 3-5 秒
12、,无距离限制,保证数据一致性,且可故障切换 带宽要求低(较友商磁盘级 DR),先进的复制机制提高带宽利用率 充分利用生产中心 HA 的设备,DS8000 FlashCopy 的数据可用于系统查询、批处理、测试上述三种方案共有的特色有: Power 服务器集群与基于 DS8000 数据镜像的理想集成方案 不依赖服务器、文件系统、数据库或操作系统,客户可自主实施、演练,发挥系统的最佳性能 可靠性高,技术成熟且应用最广泛 实施复杂度低,方案成熟 便于管理 易于扩展 开发投资小,服务成本低方案业务价值: 尽可能保障没有数据丢失影响; 为多种应用和业务提供保护; 为灾难后业务的恢复提供最好的数据基础;
13、远距离备份,提高灾难抵抗能力; 降低镜像网络成本。2.2 DS8000 存储容灾技术介绍DS8000 存储系统具有智能的数据复制功能,通过 FlashCopy(本地数据复制技术)、 Metro Mirror(远程数据同步复制技术 )和 Global Mirror (远程数据异步复制技术),在两套或多套 DS8000磁盘存储设备间建立数据复制关系从而实现高可用性。方案不消耗主机系统的资源,保证相关主机上的应用高效运行。第 8 页2.2.1 本地数据复制技术 FlashCopyFlashCopy 提供一个“ 时间点”的拷贝服务功能,从源卷到目标卷快速地复制数据。逻辑拷贝通常可以在数秒时间内完成,然
14、后就释放源卷,进行正常工作。而物理拷贝操作在后台进行。当物理拷贝进行过程中,拷贝和被拷贝数据都能被客户应用使用。Flashcopy 产生的目标卷可以进行查询、数据挖掘、后台分析、备份等。产生的目标卷的数据库也可以在指定的主机上 ONLINE 起来,进行备份,另外,Flashcopy 可以定制 COPY 的时间间隔,如 8 小时。对于主机的误操作如删掉一个表(8 小时之内),则可以通过 Flashcopy 的目标卷找回这个表,如果超过两小时,又可以通过备份的磁带回存找回。如果数据库处于归档模式(ARCHIVE MODE),对于误删除的表也可以通过磁带备份的 ARCHIVE LOG 来找回。Fla
15、shCopy 支持两个选项,它提供 NOCOPY 选项来支持灾备应用需求。关于 COPY 选项下图对 FlashCopy COPY 选项进行了说明,请注意,生产数据的一份真实拷贝是为其它的应用使用而产生。对于一般客户应用,需要实时生产数据的时间点物理拷贝,这样的应用示例包括日常重要卷的备份、日常报表生成、数据仓库和数据挖掘的应用等。COPY 选项能够在磁盘存储设备中产生一份生产数据的真实时间点拷贝。该选项可以满足以下的应用需求:1. 在磁盘存储设备中保存生产数据的一份时间点拷贝的业务需求。这方面的例子是日常工作系统备份。第 9 页2. 生产数据的时间点拷贝将被多个应用重复使用,特别是对每日的结
16、束处理和报表生成。3. 生产数据的时间点拷贝将被某些统计分析类应用,如MIS或数据挖掘应用频繁使用。无论是什么原因,只要需要生产数据的物理拷贝,就可以使用COPY选项来进行支持。关于 NOCOPY 选项(IBM 独有技术)IBM FLASY COPY 除支持 COPY 选项外, 还支持 NOCOPY 选项。该选项调用后,所有在源卷中被改变了的数据块才会从源卷拷贝到目标卷。而 COPY 选项是把所有在源卷的数据都拷贝到目标卷。另外,Flashcopy 可支持多种高级功能,包括:多关系 FlashCopy多关系 FlashCopy 允许源数据同时与多个目标建立 FlashCopy 关系。这种灵活性
17、允许您在一个指定的逻辑单元号(LUN)、卷或数据集上建立多达 12 个 FlashCopy 关系,而不需要首先等待以前的关系结束或终止以前的关系。增量 FlashCopy增量 FlashCopy 提供了对一个 FlashCopy 关系中涉及到的 LUN 或卷进行“刷新”的功能。以后发起建立 FlashCopy 时,将只拷贝将目标刷新到源数据的新时间点所需的数据。 “刷新”的方向可以逆转,即以前定义为目标的 LUN 或卷可以成为以前定义为源的 LUN 或卷的源数据,而以前定义为源的 LUN 或卷现在则变成目标。一致群组命令这一功能允许 DS8100 在发出 FlashCopy 一致群组命令之前挂
18、起 I/O 活动。一致群组可用于跨多个 LUN 或卷、甚至跨多个 DS8100 创建一致的时间点拷贝。2.2.2 远程数据同步复制技术 Metro Mirror点对点远程拷贝(PPRC)是一种同步远程镜像工具,可用于相隔距离最多可达 103 公里的两个 ESS 或 DS8000 系统中指定的逻辑卷。这一距离可以通过第三方提供的通道扩展器加以延长。PPRC 将确保如果备份卷不能被更新,那么即使源卷更新成功,整个写操作也会返回失败-彻底保证源卷和目的卷的数据彻底一致。同步方式可以保证数据不会丢失,更重要的是数据的第 10 页一致性在这种方式下能够得到很好的保证-数据的不一致意味着相关数据的丢失,此
19、时数据库的数据安全机制无法保证数据的安全,严重时有可能造成数据库无法启动。PPRC 的同步实现机制如下图所示:数据写入后备存储返回写操作完成信息返回数据写入成功信息1)、在生产系统中的应用程序将数据写到生产系统的磁盘。(主要是写入生产中心存储设备的CACHE和相应的NVS 当中)2)、备份机磁盘数据复制,备份磁盘复制生产系统数据。生产系统中的磁盘数据传输到备份中心的磁盘(主要是写入到备份中心存储设备的CACHE和相应的NVS 当中)3)、当生产数据都写入备份中心存储设备的CACHE和相应的NVS后,备份磁盘将写完操作信息返给生产磁盘4)、当生产系统收到灾备系统传回的已写信息之后,生产机的磁盘系统通知主机该写操作已完毕,在此之后生产系统应用继续执行。5)、重复进行以上的操作DS8000 及 ESS2105-800 在 PPRC 的工作模式下,可以保证数据库及应用的一致性,对电信行业需同城之间的灾备可以采用此种方式。现在同步复制技术 PPRC 已经正式改名为 Metro Mirror。数据写入存储