1、 - 1 - XXX 云计算 平台 项目 技术 方案 V1.0 2013年 4 月 11 日 - 2 - 目 录 第 1 章 建设云计算平台的重要意义 . - 3 - 1.1 传统 IT 面临的困境 . - 3 - 1.2 云计算概述 . - 5 - 1.2.1 什么是云计算 . - 5 - 1.2.2 云计算的价值 . - 7 - 1.3 H3CLOUD 云计算解决方案特色 . - 8 - 1.3.1 H3Cloud 云计算解决方案组件 . - 9 - 1.3.2 H3Cloud 云计算解决方案亮点 . - 13 - 第 2 章 需求分析 . - 18 - 2.1 项目背景 . - 18 -
2、 2.2 需求分析 . - 18 - 2.3 建设目标 . - 19 - 2.4 建设要求 . - 19 - 第 3 章 总体设计 . - 21 - 3.1 建设目标 . - 21 - 3.2 建设内容 . - 22 - 3.3 建设原则 . - 22 - 3.4 建设思路 . - 24 - 第 4 章 建设方案 . - 27 - 4.1 系统总体架构 . - 27 - 4.2 计算资源池 . - 30 - 4.3 存储资源池 . - 48 - 4.4 网络资源池 . - 56 - 4.4.1 网络设计要点 . - 56 - 4.4.2 网络资源池设计 . - 59 - 4.4.3 虚拟机交换
3、网络 . - 63 - 4.4.4 安全设计 . - 67 - 4.5 云层设计 . - 73 - 4.5.1 自助式云业务工作流 . - 74 - 4.5.2 详尽的用户分级管理 . - 76 - 4.5.3 数据 的集中保护与审核 . - 77 - 4.6 虚拟桌面部署 . - 78 - 4.7 应用系统迁移 . - 80 - 4.7.1 应用系统迁移规划 . - 80 - 4.7.2 物理机虚 拟化迁移( P2V) . - 82 - - 3 - 第 1章 建设 云计算 平台 的 重要意义 1.1 传统 IT面临的困境 自从上世纪 90 年代开始, IT 行业在全球范围内得到了迅猛的发展,
4、 IT 平台的规模和复杂程度出现了大幅度的提升,与此同时,很多企业的 IT 机构却因为这种提升而面临着一种新的困境:高昂的硬件成本和管理运营成本、缓慢的业务部署速度 以及缺乏统一管理的基础架构。 高昂的成本支出 随着 IT 规模的不断膨胀,数据中心内的服务器数量、网络复杂程度以及存储容量急剧增长,随之带来的是高昂的硬件成本支出以及运营成本支出(电力、制冷、占地空间、管理人员等)。 基础结构成本 :托管、冷却、连接服务器以及为服务器提供电源都会随着服务器数量的增长而导致成本大量增加。仅服务器电力需求一项就占总成本一大块,估计数据中心的 1000 台服务器的电力成本每年都在 45,000 美元以上
5、。 硬件成本 :每年服务器在容量和计算能力上都呈增长趋势。随着服务器变得越来越强大 ,最大化的利用这些超强资源也变得愈加困难。 IT 组织和应用服务用户习惯为每个应用服务部署一台独立服务器以确保完全控制该应用服务。几- 4 - 乎在所有情况下,部署这些功能强大的服务器将会使服务器过剩 50-500%。 软件成本 :通常服务器需要从操作系统或应用软件厂商那里获取许可证与支持。 管理成本 :迄今为止,管理成本是服务器成本中最大的一个部分,分析专家估计管理成本占服务器总拥有成本的 50-70%。 IT 技术 人员不得不对软硬件进行升级、打补丁、备份以及修复,部署新的服务器及应用,维护用户账户并执行许
6、多其他任务。随着服务器 数量的增长, IT 部门发现他们面临着满足相关服务器管理需求的挑战。 缓慢的业务部署速度 新的服务器、存储设备和网络设备的部署周期较长,整个过程包括硬件选型、采购、上架安装、操作系统安装、应用软件安装、网络配置等。一般情况下,这个过程需要的工作量在 20 40 小时,交付周期为 4 6 周。 分散的管理策略 数据中心内的 IT 基础设施处于分散的管理状态,具体表现为: 机房管理员遵循“根据最坏情况下的工作负载来确定所有服务器的配置”这一策略导致服务器的配置普遍过高。 容易出现大量“只安装一个应用程序”而未得到充分利用的 x86 服务器。 提交变更请求与进行运营变更之间存
7、在较长的延迟。 缺少 统一的集中化 IT 构建策略 ,无法对数据中心内的基础设施进行监控、管理、报告和远程访问。 - 5 - 1.2 云计算概述 1.2.1 什么是云计算 云计算是一种基于网络的计算服务供给方式,它以跨越异构、动态流转的资源池为基础提供给客户可自治的服务,实现资源的按需分配、按量计费。云计算导致资源规模化、集中化,促进 IT 产业的进一步分工,让 IT 系统的建设和运维统一集中到云计算 运营商处,普通用户都更加关注于自己的业务,从而提高了信息化建设的效率和弹性,促进社会和国家生产生活的集约化水平。 云计算主要包含两个层次的含义:一是从被服务的客户端看:在云计算环境下,用户无需自
8、建基础系统,可以更加专注于自己的业务。用户可按需获取网络上的资源,并按使用量付费。如同打开电灯用电,打开水龙头用水一样,而无需考虑是电从哪里来,水是哪家水厂的。二是从云计算后台看:云计算实现资源的集中化、规模化。能够实现对各类异构软硬件基础资源的兼容,如电网支持水电厂、火电厂、风电厂、核电厂等异构电厂并网;还能够实现 资源的动态流转,如西电东送,西气东输、南水北调等。支持异构资源和实现资源的动态流转,可以更好的利用资源,降低基础资源供应商的成本。 云计算的特征 - 6 - 基于网络 云计算是从互联网演变而来,云计算本质通过网络将计算力进行集中,并且通过网络进行服务,如果没有网络,计算力集中规模
9、、服务的种类和可获得性就会受到极大的限制,如集群计算虽然也是基于网络的计算模式,但是不能提供基于网络的服务,还不能称之为云计算。 支持异构基础资源 云计算可以构建在不同的基础平台之上,即可以有效兼容各种不同种类的硬件和软件基础资源。硬件基 础资源,主要包括网络环境下的三大类设备,即:计算(服务器)、存储(存储设备)和网络(交换机、路由器等设备);软件基础资源,则包括单机操作系统、中间件、数据库等。从横向维度考虑,支持异构资源,意味着在同一时期内,可以采购不同厂商的软硬件。对云计算平台的构建者而言,这种形式更为灵活;而从纵向维度考虑,意味着云计算平台既可以兼容当下采购的新设备,也可以兼容以前的老
10、设备,既可以兼容当前的新软件系统,也可以兼容以前遗留的老软件系统。支持异构的基础资源这一特性,在有效利用老资源的同时,也保证了新老资源的平滑过渡。 支持 资源动态扩展 支持资源动态伸缩,实现基础资源的网络冗余,意味着添加、删除、修改云计算环境的任一资源节点,亦或任一资源节点异常宕机,都不会导致云环境中的各类业务的中断,也不会导致用户数据的丢失。这里的资源节点可以是计算节点、存储节点和网络节点。而资源动态流转,则意味着在云计算平台下实现资源调度机制,资源可以流转到需要的地方。如在系统业务整体升高情况下,可以启动闲置资源,纳入系统中,提高整个云平台的承载能力。而在整个系统业务负载低的情况下,则可以
11、将业务集中起来,而将其他闲置的资源转入节能模式,从而在提高部分资源 利用率的情况下,达到其他资源绿色、低碳的应用效果。 支持异构多业务体系 - 7 - 在云计算平台上,可以同时运行多个不同类型的业务。异构,表示该业务不是同一的,不是已有的或事先定义好的,而应该是用户可以自己创建并定义的服务。这也是云计算与网格计算的一个重要差异。 支持海量信息处理 云计算,在底层,需要面对各类众多的基础软硬件资源;在上层,需要能够同时支持各类众多的异构的业务;而具体到某一业务,往往也需要面对大量的用户。由此,云计算必然需要面对海量信息交互,需要有高效、稳定的海量数据通信 /存储系统作支撑。 按需分配,按量 计费
12、 按需分配,是云计算平台支持资源动态流转的外部特征表现。云计算平台通过虚拟分拆技术,可以实现计算资源的同构化和可度量化,可以提供小到一台计算机,多到千台计算机的计算能力。按量计费起源于效用计算,在云计算平台实现按需分配后,按量计费也成为云计算平台向外提供服务时的有效收费形式。 1.2.2 云计算的价值 云计算是能够提供动态资源池、虚拟化和高可用性的下一代计算模式。如果把一个计算的资源,比如一台服务器,看成一个小水滴,当很多资源汇聚在一起的时候,它就形成了计算的云,正如我们不关心水滴是怎么产生的,用户也不需要关心计算 资源位于哪台物理的服务器上。用户关心的是需要什么样的计算能力,需要什么时刻拥有
13、这些计算能力。云计算管理平台可以为用户提供“按需计算”服务。 从资源共享方面 在整合 XXX 信息中心现有软硬件资源基础上建设云计算平台。充分发挥云计算平台虚拟化计算、按需使用、动态扩展的特性,为 XXX 各个部门提供计算、存储和信息资源服务,实现软硬件集中部署、统建共用、信息共享,避免重复投资。 - 8 - 基于云计算技术建设公共的云服务 平台来运行企业正常运行所需要的业务,可以将企业运维中共性的业务部分进行提炼和归纳,并实现,可以保证共性业务实现的规范性、安全性、全面性和稳定性,也避免了公共功能模块的多次开发实现所造成的冗余浪费乃至系统不兼容错误。更重要的是公共的云服务平台可以提供一系列支
14、撑服务,业务应用子系统在这些支撑服务的基础之上进行开发,大大降低了开发难度和成本,使各部门可以更加专注于其本身综合的、深层次的、相关联的业务需求,而不是基础设施的建设,把精力用在企业高效运行和企业创新的关键点业务需求上,比传统的建设模式更好的把握业务需求, 将会大大提高企业信息化的建设效益。 从管理工作方面 企业 工作的本质就是服务。如果各部门的业务应用子系统都是按照“ 企业 云计算”的统一标准进行开发实施、注册部署,可以方便的对机关各类业务工作进行标准化管理,从统一管理的的角度对系统进行规范管理,而不是各扫门前雪,在大大降低管理成本的同时,也大量的节约系统的运行成本。 从技术实现方面 基于云
15、计算的企业公共服务平台可以按照 SOA 的松耦合方式来建设,模块间通过标准协议实现相互调用和消息传递,这种技术架构较为成熟,具有较好的扩展性,可以确保信息系统技术层面可持续发展,更 有助于企业不同服务业务之间的信息共享,提高企业各部门业务之间的协同。 从标准化实现方面 基于云计算的企业公共服务平台可以提供一种标准化的建设模式,可以统一制定共性办公业务标准、管理工作实现标准、技术安全标准、保密安全标准、软硬件技术实现标准等,这对 企业 标准的实施和推广具有重要意义。 1.3 H3Cloud云计算解决方案特色 H3C 公司依托强大的研发实力、广泛的市场应用和技术理解,以客户需求- 9 - 为导向,
16、为企业新一代云计算数据中心基础架构提供一体化的云计算平台解决方案,帮助用户实现快速、可靠的虚拟化数据中心和云业务 应用部署。 H3Cloud云计算解决方案包含统一的计算资源池、统一的网络资源池、统一的存储资源池,并提供了一体化的监控和部署工具进行统一的虚拟化与云业务管理,通过简洁的管理界面,轻松地统一管理数据中心内所有的物理资源和虚拟资源,不仅能提高管理员的管控能力、简化日常例行工作,更可降低 IT 环境的复杂度和管理成本。 1.3.1 H3Cloud 云计算解决方案组件 H3Cloud 云计算解决方案面向于私有云 IaaS(基础设施即服务),主要包含以下几个部分: 云计算平台 现有的企业计算
17、环境通常是 x86 平台, H3Cloud 可以通过服务器 的虚拟化进行计算资源的整合与灵活利用,进行服务器计算资源的整合、动态调整、迁移。 H3C FlexServer 服务器系列定义了下一代 2U 双插槽机架式服务器的标准。借助可维护性方面的改进、无与伦比的性能、强大的配置灵活性和受用户启发的设计模式, H3C FlexServer 所提供的完美解决方案能满足当今不断扩展的数据中心所需的动态计算机要求。 H3C FlexServer 服务器支持 iLO 管理引擎,这是一套全面的嵌入式管理特性,可支持服务器的完整生命周期(从初始部署到运行管理、再到服务警报和远程支持)。 云存储 平台 实现
18、IaaS 的一个重要组成部分是云存储,一个云计算的基础设施要服务于很多个不同的业务系统或者应用,每个业务系统或应用都会有不同的存储需求,H3Cloud 可以通过存储虚拟化管理,进行存储需求的整合,灵活的容量控制。 - 10 - H3Cloud 云计算解决方案中的存储组件提供了经济实惠的企业功能,并具有全面的功能集,简化了对所有位置的集中管理,是具有各种虚拟服务器、客户端虚拟化、数据库、电子邮件和业务应用程序的环境的理想选择。 存储组件中集成了各种出色的应用程序可用性和灾难恢复功能,在任何情况下都可进行自动故障转移 /故障恢复, 并针对虚拟化环境进行了优化,并为用户和应用程序提供了即时满足需求的连续数据可用性。 虚拟化网络基础平台 随着云计算环境下虚拟化技术的大规模部署,传统的网络架构将面临着很多新的挑战,包括规格与性能、虚拟机接入与控制、大二层网络部署、流量突发与拥塞等等,如下图所示: H3C 虚拟网络方案通过数据中心级设备、网络虚拟化及虚拟机网络接入新标准( EVB)等产品与技术的创新,可以实现网络基础平台对云计算虚拟化环境的良好支撑,同时大大简化网络的运维管理。 云管理平台