1、1.1.1.1 云计算资源需求分析与规划1.1.1.1.1 数据中心服务器部署基本要求本项目关键业务数据库、数据仓库采用物理服务器独立部署(集群+同城双活) ,应用和管理类服务器采用虚拟机部署(同城双活) 。1.1.1.1.2 应用服务器采用虚拟化方案采用虚拟化技术是实现云计算的基础。通过为客户提供服务器整合和数量控制、业务连续性、测试/开发自动化、企业台式机管理等解决方案,从而实现降低成本、提高响应速度、实现零停机、灾难快速恢复等系列好处。通过虚拟架构整合服务器,可以控制 x86 服务器的蔓延,在一台服务器上运行多个操作系统和应用,并使新的硬件支持老的应用,数据中心撤退旧的硬件。虚拟基础架构
2、使企业能够通过提高效率、增加灵活性和加快响应速度而降低 IT 成本。管理一个虚拟基础架构使 IT 能够快速将资源和业务需要连结起来,并对其进行管理。虚拟基础架构可以使 x86 服务器的利用率从现在的 5-15%提高到 60-80%,并且在数十秒的时间内完成新应用程序的资源调配,而不需要几天时间。请求响应时间也改为以分钟计算。在维护上,可以实现零停机硬件维护,不需要等待维护窗口。服务器虚拟化是计算机资源逻辑组的过程,这种资源的新虚拟视图并不受实现,地理位置或底层资源的物理配置的限制。这种逻辑视图对信息基础设施有深远的影响。服务器虚拟化带来的益处:虚拟化技术可借助信息基础设施更好地提供服务,从而帮
3、助客户节省资金。与传统的物理服务器部署方式相比,虚拟化所带来的一些优势包括: 能够迅速保存、复制和供应虚拟机,从而实现零停机时间维护并支持全新的“go live(实时化) ”方案; 动态共享服务器平台中的闲置资源,从而在消除烟囱式(stovepipe)部署的同时,进一步提高性能和利用率;与此同时也能为应用提供一个隔离性的操作环境; 可以实现更高的技术标准化水平和流通率,从而降低运营和维护成本; 可在虚拟服务器组件发生故障时进行无缝故障切换,从而提高系统可用性; 降低复杂性,从而改进逻辑和物理灾难恢复。服务器虚拟化的软件平台选型原则在服务器虚拟化的软件平台方面,主流的软件提供商均提供了所有软件厂
4、商具有管理 CPU、内存、网络和硬盘资源的能力的服务器虚拟化软件,这些软件都同时支持 Windows 与 Linux 操作环境。目前,服务器虚拟化软件分为商用软件和开源软件,这些软件都提供了对于服务器虚拟化硬件平台的支持,然而之间存在细微的差别。此外不同的虚拟化软件的软件架构之间的差异较大,不同平台上的虚拟机并不能很好实现相互之间的兼容或迁移。在服务器虚拟化的软件平台选择中,应重点考虑以下几点: 系统稳定性和可扩展性 迁移的便利性,包括从物理服务器向虚拟机的迁移 对于虚拟化硬件平台的支持 良好的兼容性服务器虚拟化的硬件平台选型原则为服务器虚拟化选择适当的硬件平台正如选择适当的虚拟化软件一样重要
5、为了做出正确的选择,必须考虑到以下因素: 优越的性能:服务器虚拟化的主要目的是更加充分的利用资源。在单台服务器上增加的工作负载需要更高的系统性能,以保持所需的服务等级和应用响应时间。目前广泛采用的多核处理器架构,以及对多核处理器架构提供支持以充分利用其性能和能力的系统,可以进一步提高服务器的性能和吞吐率。在服务器性能需求方面,除了要考虑在非虚拟化模式下运行工作负载所需的性能之外,还需要考虑运行虚拟机(VM)所需的额外资源。硬件系统中的处理器与芯片组所包含的硬件辅助特性,可以在最大限度降低这一开销方面发挥作用。 能效与空间:在成本或物理限制影响最终用户正常工作的能力的情况下,例如,当成本超出预算
6、,或功耗要求超出可用资源时,功耗与散热问题最为明显。当不断扩展的 IT 占用空间导致数据中心或 IT 空间扩建时,占地空间就会成为一个大问题。虚拟化与整合有助于减少硬件占地空间和能源利用。更高能效的系统能够进一步降低功耗要求,从而节省能源和降低运营成本。功耗要求较低和/或性能功耗比较高的系统可帮助 IT 人员有效控制能源和空间要求。 总拥有成本(TCO)/投资回报(ROI):不断攀升的运营成本使资源与资本从旨在推动创新和提高 IT 价值的计划中抽离了出来。使用虚拟化环境将可以提高系统利用率,降低功耗与散热要求,减少空间要求,简化运营和降低系统管理要求。 优化的平台特性:组件与系统厂商将不断推出
7、多种专为虚拟化而优化的特性。例如,主流的硬件厂商均为处理器增添了虚拟化能力,也有针对大量 I/O、网络处理需求的平台虚拟化特性。这些能力既能简化强大虚拟化软件的设计,又能降低在虚拟化环境中运行应用通常所需的性能开销。对于 EHRS 上的大量文件处理,I/O 虚拟化的优化可进一步提升信息交换平台的处理与扩展能力。 良好的厂商协作:通过着眼于当前全行业范围内的协作,我们将能够更好地了解虚拟化的特征。鉴于虚拟化涉及多个层次上的软硬件组件,系统厂商、操作系统与应用厂商以及虚拟化厂商需要携手合作,共同制定出可行的解决方案。目前,多家行业合作伙伴正在全新平台上针对虚拟化进行优化。 良好的兼容性:保持各代平
8、台之间的兼容性是未来系统的一个重要特性。将 VM 从一台服务器迁移到另一台服务器上需要考虑架构问题,这样 IT 部门无需创建虚拟资源岛(islands of virtual resource) ,但却可以真正发挥出基础设施的最大灵活性。对虚拟机安全的考虑虚拟化使用户获得在效率、成本方面的显著收益,以及在数据中心更具环保、灵活的扩展性和减少实施时间方面的附加价值。数据中心的虚拟系统面临许多与物理服务器相同的安全挑战,并且还有自身的一些特点,如果不解决这些问题,安全最终将抵消虚拟化的优势。尤其在虚拟化体系结构将从根本上改变关键业务应用,包括设计、部署和管理的情况下,用户需要考虑哪种安全机制最适合保
9、护这些虚拟服务器。传统环境下的网络安全拓扑图,在网络出口处部署有防火墙,防毒墙,上网行为管理等安全设备,用来隔离内外网,过滤来自外网的恶意程序,规范内网用户的上网行为,同时在 DMZ 区使用防火墙隔离,部署 IDS 监控对服务器的非法访问行为,在服务器上部署防病毒软件,保护核心服务器的安全运行。根据传统的安全设计模型,需要在每个操作系统中安装防毒软件,在网络层部署入防火墙、侵检测或入侵防御系统,但是在这种在传统方式下合理的设计,在虚拟环境下会面临一些新的问题:未激活的虚拟机,物理机下关闭计算机后CPU停止运行,网络关闭,理论上不会有数据的交互,操作系统也就不存在被感染的可能;但是在虚拟环境下,
10、CPU,网络,底层的ESX 都在工作中,关闭的操作系统类似于物理环境下的一个应用程序,尽管这个“应用程序”没有运行,但仍然有被病毒感染的可能;资源的冲突,防毒软件在启用预设扫描后,当到了指定时间,会同时进行文件扫描的动作,这个时候防毒软件对CPU和内存的占用急剧增加,当系统资源被耗尽的时候就会导致服务器down机;管理复杂度,由于虚拟化的便利性,系统管理员可以非常方便的根据模板生成新的系统,这些新系统要打补丁,进行病毒代码的更新,也会增加安全管理的复杂度;虚拟化环境的动态特性面临入侵检测/防御系统(IDS/IPS)的新挑战。基于网络的IDS/IPS,也无法监测到同一台ESX 服务器上的虚拟机之
11、间的通讯;由于虚拟机能够迅速地恢复到之前的状态,利用VMware VMotion易于在物理服务器之间移动,所以难以获得并维持整体一致的安全性。所以虚拟化已经使“网络边界去除”的挑战更加明显,虚拟化对于安全的需求也更加迫切。安全虚拟机利用 API 来访问关于每一虚拟机的特权状态信息,包括其内存、状态和网络通信流量等。因为在不更改虚拟网络配置的情况下,服务器内部的全部网络通信流量是可见的。包括防病毒、防火墙、IDS/IPS 和系统完整性监控等在内的安全功能均可以应用于安全虚拟机中。1.1.1.1.3 数据库服务器性能需求分析区域卫生信息系统覆盖面广、业务极其复杂,各业务子系统之间交叉非常多,因此很
12、难通过搭建业务模型通过压力测试来进行系统性能的分析,所以,业内一般采用“售前估算法” ,通常的做法是:选择应用系统中业务重要性、业务频繁度、客户连接数最多、最具有代表性的一个业务进行估算,结合行业内其他项目的建设经验进行综合评价,得出最终的主要设备性能需求。本项目中,我们选择“以 EHR(居民电子健康记录)为基础的社区卫生信息系统”作为我们评估数据中心核心数据库服务器性能的参考业务系统,售前估算法主要涉及的要点见下表: 中山市区域卫生信息系统网内注册用户估算为 3000 个,预计高峰并发访问数在 1500 个左右;通过门户网站发起的业务申请用户估算为每天2000 个,预计高峰并发访问数在 50
13、0 个左右;因此,估算公式中的 U值为 2000; 假设每个用户每秒提交业务处理请求个数为 1 个,公式中的 Q 值; 平均处理每个业务处理请求所需要的时间应在 1 秒左右,公式中的 J 值; 假设每年并发用户增长率暂时考虑为 0,公式中的 G 值; 主机系统的平均使用计算资源率建议不超过 40%(双机热备) ,公式中的 B 值; 系统设计性能覆盖年限为 5 年左右,公式中的 N 值; 根据经验及对应用程序的分析,每个业务请求相当于 5-10 个 tpmC,本项目的主数据库服务器主要为 OLTP(联机事务处理)应用;公式中的S 值; 1 分钟为 60 秒,公式中的 T 值; 由此得出:UQJ(
14、100%+G)NTSB,根据以上数值,得出本系统所需的主机TPCC 性能要求为最低 1500000TPMC,最高 3000000 TPMC;本方案以 IBM Power 740 小型机为例,其 3.6GHz 的 Power7 CPU 的单核TPmC 值约为 100000,因此满足信息系统 5 年应用的服务器主机 TPmC 总值需要配 32 核 Power7 3.6GHz CPU。结合业务 724 小时不能停顿的系统高稳定可靠要求,以及节约成本考虑,建议配置 2 台数据库服务器做集群,两个节点可同时提供数据库处理,参照Oracle RAC 技术特性,双机集群后,整体性能为单机服务器的 1.5 倍
15、左右。综上所述,数据库主机系统的单机参考配置为:相当于 IBM Power7 16Core 3.6GHz CPU。数据库服务器内存需求分析如下:(1) 参照实际应用经验以及参考数据库的技术特性要求,信息系统数据库连接数约为 2000 个,每个连接占用 20M 内存,共计所需 40G 内存;(2) 以 3-5 年在线生成数据库数据将达到 500GB 左右的规模估算,一般医院信息系统的在线业务和查询业务都在同一数据库里执行,按照使用经验来看大概有接近 5%的热点数据,因此数据缓存使用的内容为按照 25G估算;(3) 在执行数据库备份时,为了加快备份速度,使用 5GB 左右的文件缓存;(4) 目前主
16、流的、最新版本操作系统建议保留使用 10G 左右的内存用于系统调配;综上,按照70%的系统内存使用阀值来计算,共计内存114GB ;在主机硬件配置时,应配置128GB内存。1.1.1.1.4 存储需求分析1.1.1.1.4.1 存储性能基本要求数据中心存储系统的磁盘阵列应采用支持多种转速的、热插拔硬盘的高性能存储设备,双控制器或多控制器模式保证磁盘阵列本身的高可用,阵列的控制器缓存建议少于32GB,采用8GB或以上FC 通道连接SAN ,并支持ISCSI 接口便于文件类的存储。针对数据库热点数据的存储,建议采用高性能的SSD盘;针对一般数据库存储和虚拟机文件存储,建议采用不低于10000转速的
17、SAS硬盘;针对影像文件、视频文件等存储,可采用成本较低的SATA硬盘;磁盘阵列通过存储虚拟化网关进行存储资源的池化,从而支撑数据库和虚拟机同城双活方案的实现;1.1.1.1.4.2 数据量估算(1)以 EHR 为核心的应用系统数据估算业务类别 数据类型 说明 数据量估算居民主索引数据 按 500 万人口计算 0.01M*500 万=50G居民健康卡数据 按 500 万人口计算 0.02M*500 万=100G出生证数据 按每年 4 万计算 1M*4 万*1 年=40G/年妇幼保健数据 按每年 80 万计算 1M*80 万*1 年=80G/年个人基本健康档案 按 500 万人口计算 0.1M*
18、500 万=500G专项疾病保健数据 按每年 6 万计算 1M*6 万*1 年=60G/年电子病历数据 按每年 4 万计算 10M*4 万*1 年=400G/年检验/检查结果数据 按每年 80 万计算 0.02M*80 万*1 年=16G/年处方/医嘱数据 按每年 160 万计算 0.01M*160 万*1 年=16G/年健康体检数据 按每年 14 万计算 0.1M*14 万*1 年=14G/年医学影像索引及图文报告系统数据 按每年 4 万计算 2M*4 万*1 年=80G/年EHR 业务其他诊疗数据 按 500 万人口计算 0.2M*500 万*1 年=1000G/年数据仓库 主题数据库 按
19、每年 100 万条 0.02M*100 万*1 年=20G/年数据资源数据库 按每年 2 万条数据 0.02M*2 万*1 年=0.4G/年方法库,模型库 估算 1G各种标准协议数据 估算 1G监控管理数据 按每年 0.6G 增量计算 0.6G/年其他数据系统其他数据(用户,日志等)按每年 0.2G 增量计算 0.2G/年合计 约 2829.2GB每年增量 约 600.2GB系统设计 5 年总数据量 5230GB以上数据存储应采用 SSD 和 SAS 混合形式(2)区域医疗主要数据估算应用系统 数据量估算HIS/EMR/LIS/HSS 等 300G,每年增量 30G疾控/卫监/急救等 500G
20、B,每年增量 50GB合计 约 800GB,每年增量 80GB系统设计 5 年总数据量 1200GB以上数据存储应采用 SSD 和 SAS 混合形式(3)其他应用系统数据估算应用系统 数据量估算基层卫生服务信息系统/综合运营数据 100G,每年增量 10G外网应用数据 500GB,每年增量 50GB视频数据(典型) 1000GB,每年增量 1000GB合计 约 1600GB,每年增量 1060GB系统设计 5 年总数据量 5840GB以上数据存储应采用 SAS 和 SATA 混合形式(4)数据中心系统平台存储资源占用估算系统 数据量估算虚拟机,预计 50 个虚拟机,每个虚拟机 200GB 10
21、000GB,每年增量 200G程序更新 10G,每年增量 1G配置管理 10G,每年增量 1G合计 约 10020GB,每年增量 202GB系统设计 5 年总数据量 10828GB以上数据存储应采用 SAS 和 SATA 混合形式根据上述分析可得数据中心存储系统可用容量应不低于:23098GB(23TB) ,考虑设计不少于 2 个数据存储副本,则建议容量不少于 69TB,可分期逐步扩容。1.1.1.1.5 服务器计算资源需求分析根据本项目的应用系统建设需求,分解各个应用系统对计算资源的需求,如下表:单个配置(core/G)合计资源(core/G)服务器名称 用途说明 机器数量CPU 内存 CP
22、U 内存关键数据库(物理机)电子健康档案资源库、电子病历资源库、全员人口信息库、卫生计生管理资源库、2 40 128 80 256数据仓库服务器(物理机) 基于平台的 ODS,DW 等 2 40 128 80 256分布式协调服务器 zookeeper 5 2 8 10 40数据交换服务器 数据采集和交换平台、ETL、Adapter 1 4 32 4 32对外交换前置机广东省级平台、市属医院、镇区医院、社区服务站、民营医院、人口与计划生育服务中心、政务交换中心72 2 8 144 576平台应用服务器平台基础应用、主索引管理、健康一卡通系统、健康档案浏览器4 4 32 16 128疾病控制信息系统 1 4 16 4 16疫苗冷链动态监测系统 1 4 16 4 16区域 120 急救系统 1 4 16 4 16突发公共卫生应急指挥系统 1 4 16 4 16卫生从业人员管理系统 1 4 16 4 16公共卫生应用服务器妇幼保健信息系统 1 4 16 4 16双向转诊系统 1 4 16 4 16检查检验结果互认系统 1 4 16 4 16区域检验系统 1 4 16 4 16远程影像会诊系统 1 4 16 4 16医疗协作在线培训考试系统 1 4 16 4 16卫生综合管理 综合管理与决策支持系统 1 2 16 2 16