EMC存储基础知识白皮书.doc

上传人:sk****8 文档编号:4211775 上传时间:2019-10-04 格式:DOC 页数:30 大小:297.50KB
下载 相关 举报
EMC存储基础知识白皮书.doc_第1页
第1页 / 共30页
EMC存储基础知识白皮书.doc_第2页
第2页 / 共30页
EMC存储基础知识白皮书.doc_第3页
第3页 / 共30页
EMC存储基础知识白皮书.doc_第4页
第4页 / 共30页
EMC存储基础知识白皮书.doc_第5页
第5页 / 共30页
点击查看更多>>
资源描述

1、 1 / 30 EMC存储基础知识白皮书 目 录 第1章 网络存储主要技术 3 1.1 概述 .3 1.2 DAS:直接附加存储 3 1.3 SAN:存储区域网络 4 1.3.1 什么是SAN? 4 1.3.2 SAN的误区 .5 1.3.3 SAN的组成 .5 1.3.4 FC SAN的问题 .5 1.3.5 IP SAN6 1.4 NAS:网络附加存储 8 1.5 SAN和NAS 9 第2章 主要协议和相关技术 9 2.1 SCSI .10 2.2 FC(光纤通道) .10 2.3 iSCSI11 2.4 iSCSI与光纤通道的比较 13 第3章 文件系统相关知识 14 3.1 什么是文件

2、系统 .14 3.2 主流文件系统和特点 .15 3.3 NFS和CIFS网络文件系统工作原理和特点 19 3.4 存储系统与文件系统的关系 .20 第4章 RAID技术 21 4.1 RAID概述 21 4.2 RAID级别 21 4.2.1 RAID0.21 4.2.2 RAID1.22 2 / 30 4.2.3 RAID2.23 4.2.4 RAID3.23 4.2.5 RAID4.24 4.2.6 RAID5.24 4.2.7 RAID6.25 4.2.8 RAID10.26 4.2.9 RAID01.26 4.2.10 JBOD.27 4.3 不同RAID级别对比 .27 3 / 3

3、0 第 1 章 网络存储主要技术 1.1 概述 存储系统是整个IT系统的基石,是IT技术赖以存在和发挥效能的基础平台。 早先的存储形式是存储设备(通常是磁盘)与应用服务器其他硬件直接安装于同一个 机箱之内,并且该存储设备是给本台应用服务器独占使用的。 随着服务器数量的增多,磁盘数量也在增加,且分散在不同的服务器上,查看每一个 磁盘的运行状况都需要到不同的应用服务器上去查看。更换磁盘也需要拆开服务器,中断 应用。于是,一种希望将磁盘从服务器中脱离出来,集中到一起管理的需求出现了。不过, 一个问题:如何将服务器和盘阵连接起来? 面临这样的问题,有厂商提出了SCSI协议,通过专用的线缆将服务器的总线

4、和存储设 备连接起来,通过专门的SCSI指令来实现数据的存储。后来发展到 FC协议。这样,多个服 务器可以通过SCSI线缆或光纤建立与存储系统的连接。这样的方式,我们称之为直接附加 存储(DAS )。 1.2 DAS:直接附加存储 DAS(Direct Attached Storage直接附加存储)是指将存储设备通过SCSI线缆或光纤 通道直接连接到服务器上。 一个SCSI环路或称为SCSI通道可以挂载最多16台设备; FC可以在仲裁环的方式下支持126个设备; 4 / 30 DAS方式实现了机内存储到存储子系统的跨越,但是缺点依然有很多: 扩展性差,服务器与存储设备直接连接的方式导致出现新的

5、应用需求时,只能为 新增的服务器单独配置存储设备,造成重复投资。 资源利用率低,DAS方式的存储长期来看存储空间无法充分利用,存在浪费。不 同的应用服务器面对的存储数据量是不一致的,同时业务发展的状况也决定这存 储数据量的变化。因此,出现了部分应用对应的存储空间不够用,另一些却有大 量的存储空间闲置。 可管理性差,DAS方式数据依然是分散的,不同的应用各有一套存储设备。管理 分散,无法集中。 异构化严重,DAS方式使得企业在不同阶段采购了不同型号不同厂商的存储设备,设 备之间异构化现象严重,导致维护成本据高不下。 1.3 SAN:存储区域网络 1.3.1 什么是 SAN? SAN(Storag

6、e Aera Network )存储区域网络,是一种通过网络方式连接存储设备和应 用服务器的存储构架,这个网络专用于主机和存储设备之间的访问。当有数据的存取需求 时,数据可以通过存储区域网络在服务器和后台存储设备之间高速传输。 5 / 30 1.3.2 SAN 的误区 SAN的发展历程较短,从90年代后期兴起,由于当时以太网的带宽有限,而FC协议在 当时就可以支持1Gb的带宽,因此早期的 SAN存储系统多数由FC存储设备构成,导致很多 用户误以为SAN就是光纤通道设备,其实SAN 代表的是一种专用于存储的网络架构,与协 议和设备类型无关,随着千兆以太网的普及和万兆以太网的实现,人们对于SAN的

7、理解将 更为全面。 1.3.3 SAN 的组成 SAN由服务器,后端存储系统,SAN 连接设备组成; 后端存储系统由SAN控制器和磁盘系统构成,控制器是后端存储系统的关键,它提供 存储接入,数据操作及备份,数据共享、数据快照等数据安全管理,及系统管理等一系列 功能。 后端存储系统为SAN解决方案提供了存储空间。使用磁盘阵列和RAID 策略为数据提供 存储空间和安全保护措施。 连接设备包括交换机,HBA卡和各种介质的连接线。 SAN的优点: 设备整合,多台服务器可以通过存储网络同时访问后端存储系统,不必为每台服 务器单独购买存储设备,降低存储设备异构化程度,减轻维护工作量,降低维护 费用; 数据

8、集中,不同应用和服务器的数据实现了物理上的集中,空间调整和数据复制 等工作可以在一台设备上完成,大大提高了存储资源利用率; 高扩展性,存储网络架构使得服务器可以方便的接入现有SAN环境,较好的适应 应用变化的需求; 总体拥有成本低,存储设备的整合和数据集中管理,大大降低了重复投资率和长期管 理维护成本; 1.3.4 FC SAN 的问题 兼容性差,FC协议发展时间短,开发和产品化的大厂商较少,而且厂商之间各自 遵循内部标准,导致不同厂商的FC产品之间兼容性和互操作差,即使同一厂商的 不同版本不同型号的FC产品也存在类似的问题; 6 / 30 成本高昂,FC SAN的成本包括先期设备成本和长期维

9、护成本,由于FC 协议在成 熟度和互联性上无法与以太网相比,导致FC协议只能局限于存储系统应用,无法 实现大规模推广,这直接导致了FC产品价格的昂贵;同样与 FC-SAN相关的所有 产品都身价高昂,无论是备份软件的FC-SAN模块,甚至SCSI硬盘简单更换连接 口成为FC硬盘,都要翻上几倍的价钱;另外兼容性差也导致了用户无法自己维护 FC设备,必须购买昂贵的厂商服务,如果用户的环境中包括多种 FC存储设备,用 户每年花在FC-SAN的系统保修服务的费用占当年采购成本的15%左右。如果再算 上系统安装部署阶段的专业服务费用支出,以5年计算,整个服务费用支出与系统 采购达到1:1! 扩展能力差,F

10、C-SAN高昂的成本和协议封闭,使得产品的开发、升级、扩容代 价高昂。从2000年以来,存储市场中最大的中端部分就一直5年不变地维持着前端 两个存储控制器,后端两个(最多四个)光纤环路的结构。不仅产品本身无法进 行性能和处理能力扩展,产品型号向上的升级付出的代价几乎相当于购买一套新 的设备; 异构化严重,各厂商按照自有标准开发各种功能,如快照、复制、镜像等,导致 不同厂商存储设备之间功能无法互通,结果又出现的DAS方式的各种问题,重复 投资、难以管理的局面 SAN的出现,从根本上是要建立一个开放、高性能、高可靠、高可扩展性的存储资源 平台,从而能够应对快速的业务变化和数据增长,然而以上问题使得

11、用户使用网络存储的 目标产生了严重的偏离,很多用户甚至开始质疑为什么要放弃DAS而使用昂贵复杂的FC- SAN。 1.3.5 IP SAN IP网络是一个开放,高性能,高可扩展,可靠性高的网络平台。 IP网是国际互连网,企业内部网络的主要形式。经过多年发展,IP网络实现了最 高的可管理性和互操作性。 TCP/IP协议弹性强,适应网络的各种变化,无需停止服务即可实网络变更。 1G的以太网已经普及, 2006年会扩展到10G 。FC在2008年才能到4G。 不同厂家的IP网设备兼容性好。网络设备采购成本低廉。 以太网知识普及,以太网多年的发展培养了无数的网络管理人员。 7 / 30 IP SAN的

12、基本想法是通过高速以太网络连接服务器和后端存储系统。将SCSI 指令和数 据块经过高速以太网传输,继承以太网的优点,实现建立一个开放、高性能、高可靠性, 高可扩展的存储资源平台。 IP SAN 将数据块和SCSI指令通过TCP/IP协议承载,通过千兆/万兆专用的以太网络连接应用服 务器和存储设备,这样的解决方案称为IP SAN。 IP SAN遵循IETF的iSCSI标准,通过以太网实现对存储空间的块级访问,由于早先以 太网速度,数据安全性以及系统级高容错要求等问题,这一标准经历了三年的认证过程, 在包括IBM 、HP 、SUN、COMPAQ、DELL、Intel、Microsoft、EMC、H

13、DS、Brocade等众 多家厂商的努力,和万兆/千兆以太网 10GBit Ethernet支撑下,IP SAN/iSCSI已解决了网络 瓶颈,数据安全和容错等问题,进入了实用阶段。 IP SAN继承了IP网络的优点: 实现弹性扩展的存储网络,能自适应应用的改变。 已经验证的传输设备保证运行的可靠性 以太网从1G向10G及更高速过渡,只需通过简单的升级便可得到极大的性能提升, 并保护投资 IP跨长距离扩展能力,轻松实现远程数据复制和灾难恢复 大量熟悉的网络技术和管理的人才减少培训和人力成本 将以太网的经济性引入存储 降低用户总体拥有成本。 8 / 30 1.4 NAS:网络附加存储 NAS(N

14、etwork Attached Storage网络附加存储),是一种文件共享服务。拥有自己 的文件系统,通过NFS或CIFS 对外提供文件访问服务。 NAS包括存储器件(例如硬盘驱动器阵列、CD或DVD驱动器、磁带驱动器或可移动 的存储介质)和专用服务器。专用服务器上装有专门的操作系统,通常是简化的unix/linux 操作系统,或者是一个特殊的win2000内核。它为文件系统管理和访问做了专门的优化。专 用服务器利用NFS或CIFS,充当远程文件服务器,对外提供文件级的访问。 NAS的优点: NAS可以即插即用。 NAS通过TCP/IP网络连接到应用服务器,因此可以基于已有的企业网络方便连接

15、。 专用的操作系统支持不同的文件系统,提供不同操作系统的文件共享。 经过优化的文件系统提高了文件的访问效率,也支持相应的网络协议。即使应用 服务器不再工作了,仍然可以读出数据。 NAS的缺点: 1、NAS 设备与客户机通过企业网进行连接,因此数据备份或存储过程中会占用网络的 带宽。这必然会影响企业内部网络上的其他网络应用。共用网络带宽成为限制NAS性能的 主要问题。 2、NAS 的可扩展性受到设备大小的限制。增加另一台NAS设备非常容易,但是要想将 两个NAS 设备的存储空间无缝合并并不容易,因为NAS 设备通常具有独特的网络标识符, 存储空间的扩大上有限。 3、NAS 访问需要经过文件系统格

16、式转换,所以是以文件一级来访问。不适和Block级 的应用,尤其是要求使用裸设备的数据库系统。 9 / 30 1.5 SAN 和 NAS SAN和NAS经常被视为两种竞争技术,实际上,二者能够很好地相互补充,以提供对 不同类型数据的访问。SAN针对海量、面向数据块的数据传输,而NAS则提供文件级的数 据访问和共享服务。 尽管这两种技术类似,但严格意义上讲NAS其实只是一种文件服务。 NAS和SAN不仅各有应用场合,也相互结合,许多SAN部署于NAS 后台,为NAS设备 提供高性能海量存储空间。 NAS和SAN结合中出现了 NAS网关这个部件。NAS网关主要由专为提供文件服务而优 化的操作系统和

17、相关硬件组成,可以看作是一个专门的文件管理器。NAS网关连接到后端 上的SAN 上,使的 SAN的大容量存储空间可以为 NAS所用。因此,NAS 网关后面的存储空 间可以根据环境的需求扩展到非常大的容量。 “NAS网关 ”方案主要是在 NAS一端增加了可与SAN相连的“接口”,系统对外只有 一个用户接口。 NAS网关系统虽然在一定程度上解决了NAS 与SAN系统的存储设备级的共享问题,但 在文件级的共享问题上却与传统的NAS系统遇到了同样的可扩展性问题。当一个文件系统 负载很大时,NAS网关很可能成为系统的瓶颈。 第 2 章 主要协议和相关技术 关键字:SCSI FC iSCSI 10 / 3

18、0 2.1 SCSI SCSI是小型计算机系统接口(Small Computer System Interface)的简称,于1979首次 提出,是为小型机研制的一种接口技术,现在已完全普及到了小型机,高低端服务器以及 普通PC 上。 SCSI可以划分为SCSI-1、SCSI-2、SCSI-3,最新的为SCSI-3,也是目前应用最广泛的 SCSI版本。 1、SCSI-1 :1979 年提出,支持同步和异步SCSI外围设备;支持 7台8位的外围设备, 最大数据传输速度为5MB/s。 2、SCSI-2 :1992 年提出,也称为Fast SCSI,数据传输率提高到20MB/s。 3、SCSI-3

19、:1995 年提出,Ultra SCSI(Fast-20)。Ultra 2 SCSI(Fast-40)出现于1997 年,最高传输速率可达80MB/s。1998年9月,Ultra 3 SCSI(Utra 160 SCSI)正式发布,最 高数据传输率为160MB/s。Ultra 320 SCSI的最高数据传输率已经达到了320MB/s。 2.2 FC(光纤通道) FC光纤通道:用于计算机设备之间数据传输,传输率达到2G(将来会达到4G)。光 纤通道用于服务器共享存储设备的连接,存储控制器和驱动器之间的内部连接。 协议基本架构: FC-4 Upper Layer Protocol:SCSI,HIP

20、PI,SBCCS,802.2,ATM,VI,IP 11 / 30 FC-3 common service FC-2 Framing Protocol /Flow Control FC-1 Encode/Decode FC-0 Media:Optical or copper,100MB/sec to 1.062GB/sec 协议层说明: FC-0:物理层,定制了不同介质,传输距离,信号机制标准,也定义了光纤和铜线接 口 以及电缆指标 FC-1:定义编码和解码的标准 FC-2:定义了帧、流控制、和服务质量等 FC-3:定义了常用服务,如数据加密和压缩 FC-4:协议映射层,定义了光纤通道和上层应用

21、之间的接口,上层应用比如:串行 SCSI 协 议,HBA 的驱动提供了 FC-4 的接口函数,FC-4 支持多协议,如:FCP-SCSI,FC- IP,FC-VI 协议简介: FCP-SCSI: FCP-SCSI:是将SCSI并行接口转化为串行接口方式的协议,应用于存储系统和服务器 之间的数据传输。新的ANSI T10 标准,支持SAN 上存储系统之间通过数据迁移应用来直 接移动数据。 FCP-SCSI 提供200MB/s(全双工独占带宽)的传输速率,每连接最远达10 公里,最大16000000 个节点。FCP-SCSI 使用帧传输取代块传输。帧传输以大数据流传输 方式传输短的小的事务数据。

22、2.3 iSCSI iSCSI(互联网小型计算机系统接口)是一种在 TCP/IP上进行数据块传输的标准。它是 由Cisco和IBM两家发起的,并且得到了各大存储厂商的大力支持。iSCSI可以实现在IP网络 上运行SCSI协议,使其能够在诸如高速千兆以太网上进行快速的数据存取备份操作。 iSCSI标准在2003年2月11日由 IETF(互联网工程任务组)认证通过。iSCSI 继承了两大 最传统技术:SCSI和TCP/IP协议。这为iSCSI的发展奠定了坚实的基础。 基于iSCSI的存储系统只需要不多的投资便可实现 SAN存储功能,甚至直接利用现有的 12 / 30 TCP/IP网络。相对于以往的

23、网络存储技术,它解决了开放性、容量、传输速度、兼容性、 安全性等问题,其优越的性能使其备受关注与青睐。 iSCSI的数据包结构: 工作流程: iSCSI系统由SCSI适配器发送一个SCSI命令。 命令封装到TCP/IP包中并送入到以太网络。 接收方从TCP/IP包中抽取SCSI命令并执行相关操作。 把返回的SCSI命令和数据封装到TCP/IP包中,将它们发回到发送方。 系统提取出数据或命令,并把它们传回SCSI子系统。 安全性描述: iSCSI协议本身提供了QoS 及安全特性。 可以限制initiator仅向target列表中的目标发登录请求,再由target确认并返回响应,之 后 才允许通信

24、; 通过IPSec将数据包加密之后传输,包括数据完整性、确定性及机密性检测等; iSCSI的优势 (1)广泛分布的以太网为iSCSI 的部署提供了基础。 (2)千兆/万兆以太网的普及为 iSCSI提供了更大的运行带宽。 (3)以太网知识的普及为基于iSCSI 技术的存储技术提供了大量的管理人才。 (4)由于基于TCP/IP网络,完全解决数据远程复制( Data Replication)及灾难恢复 (Disaster Recover)等传输距离上的难题。 (5)得益于以太网设备的价格优势和TCP/IP网络的开放性和便利的管理性,设备扩充和应 13 / 30 用调整的成本付出小。 2.4 iSCS

25、I 与光纤通道的比较 从传输层看,光纤通道的传输采用其FC协议,iSCSI采用TCP/IP协议。 FC协议与现有的以太网是完全异构的,两者不能相互接驳。因此光纤通道是具有封闭 性的,而且不仅与现有的企业内部网络(以太网)接入,也与其他不同厂商的光纤通道网 络接入(由于厂家对FC标准的理解的异样,FC设备的兼容性是一个巨大的难题)。因此, 对于以后存储网络的扩展由于兼容性的问题而成为了难题。而且,FC协议由于其协议特性, 网络建完后,加入新的存储子网时,必须要重新配置整个网络,这也是FC网络扩展的障碍。 iSCSI基于的TCP/IP协议,它本身就运行于以太网之上,因此可以和现有的企业内部以 太网

26、无缝结合。TCP/IP网络设备之间的兼容性已经无需讨论,迅猛发展的internent网上运 行着全球无数家网络设备厂商提供的网络设备,这是一个最好的佐证。 从网络管理的角度看,运行FC协议的光网络,其技术难度相当之大。其管理采用了专 有的软件,因此需要专门的管理人员,且其培训费用高昂。TCP/IP网络的知识通过这些年 的普及,已有大量的网络管理人才,并且,由于支持TCP/IP 的设备对协议的支持一致性好, 即使是不同厂家的设备,其网络管理方法也是基本一致的。 FC运行于光网络之上,其速度是非常快的,现在已经达到了2G的带宽,这也是它的主 要优势所在。下一代的FC标准正在制定当中,其速度可以达到

27、 4G, 今天的千兆以太网已经在普及当中,这也是基于TCP/IP的iSCSI 协议进入实用的保证。 得益于优秀的设计,以太网从诞生到现在,遍及了所有有网络的地方,到现在依然表现出 非凡的生命力,在全球无数网络厂商的共同努力下,以太网的速度稳步提升,千兆网络已 经实际应用,万兆网络呼之欲出,以太网的主要部件交换机路由器均已有万兆级别的产品。 随着产品的不断丰富,以及设备厂商间的剧烈竞争,其建设成本在不断下降,万兆网络的 普及已日益临近。当iSCSI以 10Gb的高速传输数据时,基于 iSCSI协议的存储技术将无可争 议的成为网络存储的王者。 14 / 30 第 3 章 文件系统相关知识 3.1

28、什么是文件系统 文件系统定义了把文件存储于磁盘时所必须的数据结构及磁盘数据的管理方式。我们知 道,磁盘是由很多个扇区(Sector)组成的,如果扇区之间不建立任何的关系,写入其中 的文件就无法访问,因为无法知道文件从哪个扇区开始,文件占多少个扇区,文件有什么 属性。为了访问磁盘中的数据,就必需在扇区之间建立联系,也就是需要一种逻辑上的数 据存储结构。建立这种逻辑结构就是文件系统要做的事情,在磁盘上建立文件系统的过程 通常称为“格式化”。 以Windows平台下最常见的FAT文件系统为例。FAT文件系统有两个重要的组成部分:FAT 表(File Allocation Table)和数据存储区。F

29、AT表是FAT文件系统的名称来源,它定义了 存储数据的簇(Cluster,由2的n次方个Sector组成,n值根据分区大小而定,需综合考虑 数据存取效率和存储空间的利用率)之间的链接关系,这种链接关系是一个单向链表,指 向0xFF表示结束。依据一个簇编号所用bit数的不同,可分为FAT12、FAT16和FAT32文件系 统。数据区存储的数据包含文件目录项(Directory Entries)和文件数据。文件目录项存 储的是一个文件或目录的属性信息,包括文件名称(把目录也看成是文件)、读写属性、 文件大小、创建时间、起始簇编号等,一个目录下的每个子目录和文件都对应一个表项记 录。文件目录项以固定

30、32字节的长度存储,以树型结构管理,其中根目录的位置是确定的。 也就是说,根据分区根目录可以找到下级子目录和文件的起始簇编号,根据下级子目录又 可以找到更下级目录或文件的起始簇编号。可见,FAT表和文件目录项是为了文件的访问和 管理而建立的。应用程序要访问一个文件时,根据文件路径(逻辑分区号目录,如 F:software)和文件名称(如setup.exe)可从文件目录项中获得存储文件数据的起始簇 号,之后从FAT表查询这个簇号对应的链表,就可以获得该文件对应的全部簇编号。从这些 簇中读出全部数据,就得到一个完整的文件。 一般来说,文件系统是和操作系统紧密结合在一起的,不同的操作系统使用不同的文

31、 件系统,但有时为了兼容,不同操作系统也使用相同的文件系统。 15 / 30 3.2 主流文件系统和特点 在Windows系列操作系统中,MS-DOS和Windows 3.x使用FAT16文件系统,默认情况下 Windows 98也使用FAT16,Windows 98和Windows Me可以同时支持FAT16、FAT32两种文件系 统,Windows NT则支持FAT16、NTFS两种文件系统,Windows 2000可以支持 FAT16、FAT32、NTFS三种文件系统.每一种文件系统提供的功能与特点各不相同。比如 FAT32文件系统。,采用32位的文件分配表,磁盘的管理能力大为增强。但由

32、于文件分配表 的增大,性能相对来说有所下降。此外,这个版本的文件系统不能向下兼容。 NTFS是随着 Windows NT操作系统而产生的,它的优点和FAT文件系统相比是有更好的 安全性和稳定性,在使用中不易产生文件碎片,NTFS分区对用户权限作出了非常严格的限 制,同时它还提供了容错结构日志,从而保护了系统的安全。但NTFS分区格式的兼容性不 好,Windows 98/ME操作系统均不能直接访问该分区。 对于超过4GB以上的硬盘,使用NTFS分区,可以减少磁盘碎片的数量,大大提高硬盘的 利用率;NTFS可以支持的文件大小可以达到64GB,远远大于FAT32下的4GB;支持长文件名, 支持的最大

33、分区为 2TB。 在Linux系统中,每个分区都是一个文件系统,都有自己的目录层次结构。Linux的 最重要特征之一就是支持多种文件系统,并可以和许多其它种操作系统共存。 随着Linux的不断发展,它所支持的文件格式系统也在迅速扩充。特别是Linux 2.4内核 正式推出后,出现了大量新的文件系统. Linux系统可以支持十多种文件系统类型包括: JFS、 ext、ext2、ext3、ISO9660、XFS、Minx、MSDOS、UMSDOS、VFAT、NTFS、HPFS、NFS、SMB 、SysV、PROC等。 各主流操作系统和平台的文件系统名称和特点如下表所示 操作系统 文件系统 特点 1

34、6 / 30 Windows 95、Windows 98、OSR2、Windows 98 SE、Windows Me、Windows 2000 和Windows XP Fat文件系统 FAT12/FAT16和 FAT32 可以允许多种操作系统访问,如MS-DOS、Windows 3.x、Windows 9x、Windows NT和OS/2等。这一文件系 统在使用时遵循8.3命名规则(即文件名最多为8个字符, 扩展名为3个字符)。 最大的限制在于兼容性方面,Fat32不能保持向下 兼容。 当分区小于512M时,Fat32不会发生作用。 单个文件不能大于4G。 Windows NT/2000 NT

35、FS文件系统 支持文件系统故障恢复,尤其是大存储媒体、长 文件名。分区大小可以达到2TB。通过使用标准的事物 处理日志和恢复技术来保证分区的一致性。 只能被Windows NT/2000所识别,不能被FAT文件 系统所存取 Windows longhorn Winfs 用以组织、搜索和共享多种多样的信息的存储平 台。WinFS被设计为在无结构文件和数据库数据之间建 立起更好的互操作性,从而提供快捷的文件浏览和搜 索功能 Linux Ext2/ ext3/ XFS 等文件系统 是一种日志式文件系统。日志式文件系统的优越 性在于:由于文件系统都有快取层参与运作,如不使 用时必须将文件系统卸下,以便

36、将快取层的资料写回 磁盘中。因此每当系统要关机时,必须将其所有的文 件系统全部卸下后才能进行关机 UNIX 系统 NFS 网络文件系统,允许多台计算机之间共享文件系 统,易于从所有这些计算机存放文件 Windows 系列 CIFS 网络文件系统,允许多台计算机之间共享文件系 统,易于从所有这些计算机存放文件 17 / 30 AIX JFS 具有可伸缩性和健壮性,与非日志文件系统相比, 它的优点是其快速重启能力:Jfs 能够在几秒或几分 钟内就把文件系统恢复到一致状态。为满足服务器 (从单处理器系统到高级多处理器和群集系统)的高 吞吐量和可靠性需求而设计的。使用数据库日志处理 技术,jsf 能在

37、几秒或几分钟之内把文件系统恢复到 一致状态。 SCO UnixWare, Vxfs UFS Solaris Vxfs UFS HP-UX Hfs Vxfs 日志式文件系统.建立文件的索引区,将操作记录 在事件日志中,当系统发生意外时,能让系统迅速、 完全地得到恢复。提供文件系统的照相功能,保证了 数据的在线备份,提供文件系统的在线扩展,并提高 了I/O吞吐率 SGI IRIX 操作 系统 CXFS XFS XfS文件系统是SGI开发的一个全64位,快速、稳固 的日志文件系统,SGI并将其移植到了Linux系统中.支 持超大数量的文件(9g1gb,甚至更大的18g1gb), 可在大型 2d 和

38、3d 数据方面提供显著的性能。提供 了在不妨碍性能的情况下增强可靠性和快速的事故恢 复。可升级性,以面对大多数的存储容量和i/o存储需 求,可处理大型文件和包含巨大数量文件的大型目录. cxfs有能力动态地为文件分配索引空间,使系统形成 高效支持大数量文件的能力。在它的支持下,用户可 使用1exabyte (1g1gb) 大的文件,远远大于现在 最大的文件系统。 CXFS:共享文件系统.主要用于SCI大型主机的高 性能计算 18 / 30 APPLE Mac OS Hfs 分层文件系统( Hierarchical File System).是 一种由苹果电脑开发,并使用在Mac OS上的文件系

39、统。 将资源和数据存在一个文件的不同分支中,并使用了 包括类型和创建者代码在内的多种文件属性。 允许文件名最多有31个字符的长度,支持 metadata和每个文件的数据和资源支分开存储文 件 19 / 30 3.3 NFS 和 CIFS 网络文件系统工作原理和特点 NFS (Network File System,网络文件系统)是当前主流异构平台共享文件系统之一.主 要应用在UNIX环境下。 最早是由SUN microsystem开发,现在能够支持在不同类型的系统 之间通过网络进行文件共享,广泛应用在FreeBSD、SCO、Solaris等等异构操作系统平台, 允许一个系统在网络上与它人共享目

40、录和文件。通过使用NFS,用户和程序可以象访问本地 文件一样访问远端系统上的文件,使得每个计算机的节点能够像使用本地资源一样方便地 使用网上资源。换言之,NFS 可用于不同类型计算机、操作系统、网络架构和传输协议运 行环境中的网络文件远程访问和共享。 NFS的工作原理是使用客户端/服务器架构,由一个客户端程序和服务器程序组成。服务 器程序向其它计算机提供对文件系统的访问,其过程就叫做“输出”。NFS 客户端程序对 共享文件系统进行访问时,把它们从 NFS 服务器中“输送”出来。文件通常以“块” 为 单位进行传输. 其尺寸是 8K (虽然它可能会将操作分成更小尺寸的分片).NFS 传输协议用 于

41、服务器和客户机之间文件访问和共享的通信,从而使客户机远程地访问保存在存储设备 上的数据。 CIFS(Common Internet File Syste,公共互联网文件系统)是当前主流异构平台共 享文件系统之一。主要应用在NT/Windows环境下,是由Microsoft公司开发。其工作原理是 让CIFS协议运行于TCP/IP通信协议之上,让Unix计算机可以在网络邻居上被Windows计算机 看到。 共享文件系统特点: 异构平台下的文件共享:不同平台下的多个客户端可以很容易的共享 NAS 中的同 一个文件。 充分利用现有的 LAN 网络结构,保护现有投资。 容易安装,使用和管理都很方便,实现

42、即插即用。 广泛的连接性:由于基于 IP/Ethernet 以及标准的 NFS 和 CIFS,可以适应复杂的 网络环境。 内部资源的整合:可以将内部的磁盘整合成一个统一的存储池,以卷的方式提供 给不同的用户,每一个卷可以格式化成不同的文件系统 允许应用进程打开一个远地文件,并能够在该文件的某一个特定的位置上开始读写数 20 / 30 据。NFS 可使用户只复制一个大文件中的一个很小的片段,而不需复制整个大文件, 在网络上传送的只是少量的修改数据。 需要注意的是,CIFS和NFS虽然同样也是文件系统(File System),但它并不能用于 在磁盘中存储和管理数据,它定义的是通过TCP/IP网络

43、传输文件时的文件组织格式和数据 传输方式。利用CIFS和NFS共享文件实际涉及到两次的文件系统转换。客户端从服务器端申 请一个文件时,服务器端首先从本地读出文件(本地文件系统格式),并以NFS/CIFS的格 式封装成IP报文并发送给客户端。客户端收到IP报文以后,把文件存储与本地磁盘中(本 地文件系统格式)。 3.4 存储系统与文件系统的关系 提到NAS,通常会想到传统的NAS设备,它具有自己的文件系统,具有较大的存储容量, 具有一定的文件管理和服务功能。NAS设备和客户端之间通过IP网络连接,基于NFS/CIFS协 议在不同平台之间共享文件,数据的传输以文件为组织单位。 虽然NAS设备常被认

44、为是一种存储架构,但NAS设备最核心的东西实际上在存储之外, 那就是文件管理服务。从功能上来看,传统NAS设备就是一个带有DAS存储的文件服务器。 从数据的IO路径来看,它的数据IO发生在NAS设备内部,这种架构与DAS毫无分别。而事实 上,很多NAS设备内部的文件服务模块与磁盘之间是通过SCSI总线连接的。至于通过 NFS/CIFS共享文件,完全属于高层协议通信,根本就不在数据IO路径上,所以数据的传输 不可能以块来组织。正是由于这种功能上的重叠,在SAN出现以后,NAS头设备(或NAS网关) 逐渐发展起来,NAS over SAN的方案越来越多,NAS回归了其文件服务的本质。 由此可知,N

45、AS与一般的应用主机在网络层次上的位置是相同的,为了在磁盘中存储数 据,就必须要建立文件系统。有的NAS设备采用专有文件系统,而有的NAS设备则直接借用 其操作系统支持的文件系统。由于不同的OS平台之间文件系统不兼容,所以NAS设备和客户 端之间就采用通用的NFS/CIFS来共享文件。 至于SAN,它提供给应用主机的就是一块未建立文件系统的“虚拟磁盘”。在上面建立 什么样的文件系统,完全由主机操作系统确定。 21 / 30 第 4 章 RAID 技术 4.1 RAID 概述 RAID为廉价磁盘冗余阵列(Redundant Array of Inexpensive Disks),RAID 技术将

46、一个 个单独的磁盘以不同的组合方式形成一个逻辑硬盘,从而提高了磁盘读取的性能和数据的 安全性。不同的组合方式用RAID级别来标识。 RAID技术是由美国加州大学伯克利分校D.A. Patterson教授在1988年提出的,作为高性 能、高可靠的存储技术,在今天已经得到了广泛的应用。 4.2 RAID 级别 RAID技术经过不断的发展,现在已拥有了从 RAID 0 到 5等6种明确标准级别的 RAID 级别。另外,其他还有6、7、10(RAID 1与RAID 0的组合)、01(RAID 0与RAID 1的组合)、30(RAID 3与RAID 0的组合)、50(RAID 0与RAID 5的组合)等

47、。 不同RAID 级别代表着不同的存储性能、数据安全性和存储成本,下面将介绍如下 RAID级别:0、1、2、3、4、5、6、01、10。 4.2.1 RAID0 RAID0也称为条带化(stripe),将数据分成一定的大小顺序的写道阵列的磁盘里, RAID0可以并行的执行读写操作,可以充分利用总线的带宽,理论上讲,一个由 N个磁盘 组成的RAID0系统,它的读写性能将是单个磁盘读取性能的 N倍。且磁盘空间的存储效率 最大(100)RAID0有一个明显的缺点:不提供数据冗余保护,一旦数据损坏,将无法恢 复。 22 / 30 D1D2D3D4D5D6D7D8D9D10D11 D12 D1 D5 D

48、9 D2 D6 D10 D3 D7 D11 D4 D8 D12 如图所示:系统向RAID0系统(四个磁盘组成)发出的I/O数据请求被转化为4项操作, 其中的每一项操作都对应于一块物理硬盘。通过建立RAID 0,原先顺序的数据请求被分散 到四块硬盘中同时执行。从理论上讲,四块硬盘的并行操作使同一时间内磁盘读写速度提 升了4倍。 但由于总线带宽等多种因素的影响,实际的提升速率会低于理论值,但是,大 量数据并行传输与串行传输比较,性能必然大幅提高。 RAID0应用于对读取性能要求较高但所存储的数据为非重要数据的情况下。 4.2.2 RAID1 RAID1称为镜像(mirror),它将数据完全一致的分

49、别写到工作磁盘和镜像磁盘,因此 它的磁盘空间利用率为50,在数据写入时时间会有影响,但是读的时候没有任何影响, RAID0提供了最佳的数据保护,一旦工作磁盘发生故障,系统自动从镜像磁盘读取数据, 不会影响用户工作。 23 / 30 D1D2D3D4 D1 D2 D3 D4 D1 D2 D3 D4 工作磁盘 镜像磁盘 RAID1应用于对数据保护极为重视的应用。 4.2.3 RAID2 RAID2称为纠错海明码磁盘阵列,阵列中序号为2N的磁盘(第1、2、4、6)作为 校验盘,其余的磁盘用于存放数据,磁盘数目越多,校验盘所占比率越少。RAID2 在大数 据存储额情况下性能很高,RAID2的实际应用很少。 4.2.4 RAID3 RAID3采用一个硬盘作为校验盘,其余磁盘作为数据盘,数据按位或字节的方式交叉 的存取到各个数据盘中。不同磁盘上同一带区的数据做异或校验,并把校验值写入到校验 盘中。RAID3系统在完整的情况下读取时没有任何性能上的影响,读性能与 RAID0一致, 却提供了数据容错能力,但是,在写时性能大为下降,因为每一次写操作,即使是改动某 个数据盘上的一个数据块,也必须根据所有同一带区的数据来重新计

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 自然科学

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。