1、 1 / 30EMC存储基础知识白皮书目 录第1章 网络存储主要技术 .31.1 概述 .31.2 DAS:直接附加存储 .31.3 SAN:存储区域网络 .41.3.1 什么是SAN? .41.3.2 SAN的误区 .51.3.3 SAN的组成 .51.3.4 FC SAN的问题 .51.3.5 IP SAN.61.4 NAS:网络附加存储 .81.5 SAN和NAS .9第2章 主要协议和相关技术 .92.1 SCSI .102.2 FC(光纤通道) .102.3 iSCSI.112.4 iSCSI与光纤通道的比较 .13第3章 文件系统相关知识 .143.1 什么是文件系统 .143.2
2、 主流文件系统和特点 .153.3 NFS和CIFS网络文件系统工作原理和特点 .193.4 存储系统与文件系统的关系 .20第4章 RAID技术 .214.1 RAID概述 .214.2 RAID级别 .214.2.1 RAID0.214.2.2 RAID1.222 / 304.2.3 RAID2.234.2.4 RAID3.234.2.5 RAID4.244.2.6 RAID5.244.2.7 RAID6.254.2.8 RAID10.264.2.9 RAID01.264.2.10 JBOD.274.3 不同RAID级别对比 .273 / 30第 1 章 网络存储主要技术1.1 概述存储系
3、统是整个IT系统的基石,是IT技术赖以存在和发挥效能的基础平台。早先的存储形式是存储设备(通常是磁盘)与应用服务器其他硬件直接安装于同一个机箱之内,并且该存储设备是给本台应用服务器独占使用的。随着服务器数量的增多,磁盘数量也在增加,且分散在不同的服务器上,查看每一个磁盘的运行状况都需要到不同的应用服务器上去查看。更换磁盘也需要拆开服务器,中断应用。于是,一种希望将磁盘从服务器中脱离出来,集中到一起管理的需求出现了。不过,一个问题:如何将服务器和盘阵连接起来?面临这样的问题,有厂商提出了SCSI协议,通过专用的线缆将服务器的总线和存储设备连接起来,通过专门的SCSI指令来实现数据的存储。后来发展
4、到 FC协议。这样,多个服务器可以通过SCSI线缆或光纤建立与存储系统的连接。这样的方式,我们称之为直接附加存储(DAS )。1.2 DAS:直接附加存储DAS(Direct Attached Storage直接附加存储)是指将存储设备通过SCSI线缆或光纤通道直接连接到服务器上。一个SCSI环路或称为SCSI通道可以挂载最多16台设备; FC可以在仲裁环的方式下支持126个设备; 4 / 30DAS方式实现了机内存储到存储子系统的跨越,但是缺点依然有很多: 扩展性差,服务器与存储设备直接连接的方式导致出现新的应用需求时,只能为新增的服务器单独配置存储设备,造成重复投资。 资源利用率低,DAS
5、方式的存储长期来看存储空间无法充分利用,存在浪费。不同的应用服务器面对的存储数据量是不一致的,同时业务发展的状况也决定这存储数据量的变化。因此,出现了部分应用对应的存储空间不够用,另一些却有大量的存储空间闲置。 可管理性差,DAS方式数据依然是分散的,不同的应用各有一套存储设备。管理分散,无法集中。异构化严重,DAS方式使得企业在不同阶段采购了不同型号不同厂商的存储设备,设备之间异构化现象严重,导致维护成本据高不下。1.3 SAN:存储区域网络1.3.1 什么是 SAN?SAN(Storage Aera Network )存储区域网络,是一种通过网络方式连接存储设备和应用服务器的存储构架,这个
6、网络专用于主机和存储设备之间的访问。当有数据的存取需求时,数据可以通过存储区域网络在服务器和后台存储设备之间高速传输。5 / 301.3.2 SAN 的误区SAN的发展历程较短,从90年代后期兴起,由于当时以太网的带宽有限,而FC协议在当时就可以支持1Gb的带宽,因此早期的 SAN存储系统多数由FC存储设备构成,导致很多用户误以为SAN就是光纤通道设备,其实SAN 代表的是一种专用于存储的网络架构,与协议和设备类型无关,随着千兆以太网的普及和万兆以太网的实现,人们对于SAN的理解将更为全面。1.3.3 SAN 的组成SAN由服务器,后端存储系统,SAN 连接设备组成;后端存储系统由SAN控制器
7、和磁盘系统构成,控制器是后端存储系统的关键,它提供存储接入,数据操作及备份,数据共享、数据快照等数据安全管理,及系统管理等一系列功能。后端存储系统为SAN解决方案提供了存储空间。使用磁盘阵列和RAID 策略为数据提供存储空间和安全保护措施。连接设备包括交换机,HBA卡和各种介质的连接线。 SAN的优点: 设备整合,多台服务器可以通过存储网络同时访问后端存储系统,不必为每台服务器单独购买存储设备,降低存储设备异构化程度,减轻维护工作量,降低维护费用; 数据集中,不同应用和服务器的数据实现了物理上的集中,空间调整和数据复制等工作可以在一台设备上完成,大大提高了存储资源利用率; 高扩展性,存储网络架
8、构使得服务器可以方便的接入现有SAN环境,较好的适应应用变化的需求;总体拥有成本低,存储设备的整合和数据集中管理,大大降低了重复投资率和长期管理维护成本;1.3.4 FC SAN 的问题 兼容性差,FC协议发展时间短,开发和产品化的大厂商较少,而且厂商之间各自遵循内部标准,导致不同厂商的FC产品之间兼容性和互操作差,即使同一厂商的不同版本不同型号的FC产品也存在类似的问题;6 / 30 成本高昂,FC SAN的成本包括先期设备成本和长期维护成本,由于FC 协议在成熟度和互联性上无法与以太网相比,导致FC协议只能局限于存储系统应用,无法实现大规模推广,这直接导致了FC产品价格的昂贵;同样与 FC
9、-SAN相关的所有产品都身价高昂,无论是备份软件的FC-SAN模块,甚至SCSI硬盘简单更换连接口成为FC硬盘,都要翻上几倍的价钱;另外兼容性差也导致了用户无法自己维护FC设备,必须购买昂贵的厂商服务,如果用户的环境中包括多种 FC存储设备,用户每年花在FC-SAN的系统保修服务的费用占当年采购成本的15%左右。如果再算上系统安装部署阶段的专业服务费用支出,以5年计算,整个服务费用支出与系统采购达到1:1! 扩展能力差,FC-SAN高昂的成本和协议封闭,使得产品的开发、升级、扩容代价高昂。从2000年以来,存储市场中最大的中端部分就一直5年不变地维持着前端两个存储控制器,后端两个(最多四个)光
10、纤环路的结构。不仅产品本身无法进行性能和处理能力扩展,产品型号向上的升级付出的代价几乎相当于购买一套新的设备; 异构化严重,各厂商按照自有标准开发各种功能,如快照、复制、镜像等,导致不同厂商存储设备之间功能无法互通,结果又出现的DAS方式的各种问题,重复投资、难以管理的局面SAN的出现,从根本上是要建立一个开放、高性能、高可靠、高可扩展性的存储资源平台,从而能够应对快速的业务变化和数据增长,然而以上问题使得用户使用网络存储的目标产生了严重的偏离,很多用户甚至开始质疑为什么要放弃DAS而使用昂贵复杂的FC-SAN。1.3.5 IP SANIP网络是一个开放,高性能,高可扩展,可靠性高的网络平台。
11、 IP网是国际互连网,企业内部网络的主要形式。经过多年发展,IP网络实现了最高的可管理性和互操作性。 TCP/IP协议弹性强,适应网络的各种变化,无需停止服务即可实网络变更。 1G的以太网已经普及, 2006年会扩展到10G 。FC在2008年才能到4G。 不同厂家的IP网设备兼容性好。网络设备采购成本低廉。 以太网知识普及,以太网多年的发展培养了无数的网络管理人员。7 / 30IP SAN的基本想法是通过高速以太网络连接服务器和后端存储系统。将SCSI 指令和数据块经过高速以太网传输,继承以太网的优点,实现建立一个开放、高性能、高可靠性,高可扩展的存储资源平台。IP SAN将数据块和SCSI
12、指令通过TCP/IP协议承载,通过千兆/万兆专用的以太网络连接应用服务器和存储设备,这样的解决方案称为IP SAN。IP SAN遵循IETF的iSCSI标准,通过以太网实现对存储空间的块级访问,由于早先以太网速度,数据安全性以及系统级高容错要求等问题,这一标准经历了三年的认证过程,在包括IBM 、HP 、SUN、COMPAQ、DELL、Intel、Microsoft、EMC、HDS、Brocade等众多家厂商的努力,和万兆/千兆以太网 10GBit Ethernet支撑下,IP SAN/iSCSI已解决了网络瓶颈,数据安全和容错等问题,进入了实用阶段。IP SAN继承了IP网络的优点: 实现弹
13、性扩展的存储网络,能自适应应用的改变。 已经验证的传输设备保证运行的可靠性 以太网从1G向10G及更高速过渡,只需通过简单的升级便可得到极大的性能提升,并保护投资 IP跨长距离扩展能力,轻松实现远程数据复制和灾难恢复 大量熟悉的网络技术和管理的人才减少培训和人力成本将以太网的经济性引入存储 降低用户总体拥有成本。8 / 301.4 NAS:网络附加存储NAS(Network Attached Storage网络附加存储),是一种文件共享服务。拥有自己的文件系统,通过NFS或CIFS 对外提供文件访问服务。 NAS包括存储器件(例如硬盘驱动器阵列、CD或DVD驱动器、磁带驱动器或可移动的存储介质
14、)和专用服务器。专用服务器上装有专门的操作系统,通常是简化的unix/linux操作系统,或者是一个特殊的win2000内核。它为文件系统管理和访问做了专门的优化。专用服务器利用NFS或CIFS,充当远程文件服务器,对外提供文件级的访问。NAS的优点: NAS可以即插即用。 NAS通过TCP/IP网络连接到应用服务器,因此可以基于已有的企业网络方便连接。 专用的操作系统支持不同的文件系统,提供不同操作系统的文件共享。 经过优化的文件系统提高了文件的访问效率,也支持相应的网络协议。即使应用服务器不再工作了,仍然可以读出数据。 NAS的缺点:1、NAS 设备与客户机通过企业网进行连接,因此数据备份
15、或存储过程中会占用网络的带宽。这必然会影响企业内部网络上的其他网络应用。共用网络带宽成为限制NAS性能的主要问题。2、NAS 的可扩展性受到设备大小的限制。增加另一台NAS设备非常容易,但是要想将两个NAS 设备的存储空间无缝合并并不容易,因为NAS 设备通常具有独特的网络标识符,存储空间的扩大上有限。3、NAS 访问需要经过文件系统格式转换,所以是以文件一级来访问。不适和Block级的应用,尤其是要求使用裸设备的数据库系统。9 / 301.5 SAN 和 NASSAN和NAS经常被视为两种竞争技术,实际上,二者能够很好地相互补充,以提供对不同类型数据的访问。SAN针对海量、面向数据块的数据传
16、输,而NAS则提供文件级的数据访问和共享服务。尽管这两种技术类似,但严格意义上讲NAS其实只是一种文件服务。NAS和SAN不仅各有应用场合,也相互结合,许多SAN部署于NAS 后台,为NAS设备提供高性能海量存储空间。NAS和SAN结合中出现了 NAS网关这个部件。NAS网关主要由专为提供文件服务而优化的操作系统和相关硬件组成,可以看作是一个专门的文件管理器。NAS网关连接到后端上的SAN 上,使的 SAN的大容量存储空间可以为 NAS所用。因此,NAS 网关后面的存储空间可以根据环境的需求扩展到非常大的容量。 “NAS网关 ”方案主要是在 NAS一端增加了可与SAN相连的“接口”,系统对外只
17、有一个用户接口。NAS网关系统虽然在一定程度上解决了NAS 与SAN系统的存储设备级的共享问题,但在文件级的共享问题上却与传统的NAS系统遇到了同样的可扩展性问题。当一个文件系统负载很大时,NAS网关很可能成为系统的瓶颈。第 2 章 主要协议和相关技术关键字:SCSI FC iSCSI10 / 302.1 SCSISCSI是小型计算机系统接口(Small Computer System Interface)的简称,于1979首次提出,是为小型机研制的一种接口技术,现在已完全普及到了小型机,高低端服务器以及普通PC 上。SCSI可以划分为SCSI-1、SCSI-2、SCSI-3,最新的为SCSI
18、-3,也是目前应用最广泛的SCSI版本。1、SCSI-1 :1979 年提出,支持同步和异步SCSI外围设备;支持 7台8位的外围设备,最大数据传输速度为5MB/s。2、SCSI-2 :1992 年提出,也称为Fast SCSI,数据传输率提高到20MB/s。3、SCSI-3 :1995 年提出,Ultra SCSI(Fast-20)。Ultra 2 SCSI(Fast-40)出现于1997年,最高传输速率可达80MB/s。1998年9月,Ultra 3 SCSI(Utra 160 SCSI)正式发布,最高数据传输率为160MB/s。Ultra 320 SCSI的最高数据传输率已经达到了320MB/s。2.2 FC(光纤通道)FC光纤通道:用于计算机设备之间数据传输,传输率达到2G(将来会达到4G)。光纤通道用于服务器共享存储设备的连接,存储控制器和驱动器之间的内部连接。协议基本架构: FC-4 Upper Layer Protocol:SCSI,HIPPI,SBCCS,802.2,ATM,VI,IP