1、分布式文件系统 moosefs高可用、可扩展的海量级分布式文件系统什么是分布式文件系统 数据 /文件分散存储到不同的物理设备 文件 /数据被分块 文件读写并行处理 较低的单位成本分布式文件系统的优点 高可用:存储服务器 down 掉一些,服务依然是可用的 读写性能提高:文件分块存储在不同的物理设备,对单个设备来说,其磁盘 I/O得以降低 容量在线可扩充:增加物理设备(服务器)就实现不停原服务而自动扩展了容量。相对于物理的 raid,没有所谓的木桶效应传统共享文件系统的缺陷 无高可用性:共享文件系统在一个物理设备,一旦出现故障,服务完全不可用 读写性能随访问量的增加而降低:访问频繁,磁盘 I/O
2、增大 不易实现在线扩容:一般情况下需要停机停服务传统共享文件系统的种类 NFS(network file system) Samba ftp 其他分布式文件系统的种类 Hadoop FastDFS MooseFS PNFS( Parallel NFS ) PVFS, PVFS2 Lustre 其他为什么选 Moosefs 实施起来简单。 MFS的安装、部署、配置相对于其他几种工具来说,要简单和容易得多。看看lustre 700多页的 pdf文档,让人头昏吧 不停服务扩容。 MFS框架做好后,随时增加 服务器 扩充容量;扩充和减少容量皆不会影响现有的服务 恢复服务容易。除了 MFS本身具备高可用特性外,手动恢复服务也是非常快捷的 我在实验过程中得到作者的帮助,这让我很是感激。 Moosefs体系结构图MooseFS分布式文件系统的组成 元数据服务器( Master) 数据存储服务器( chunkservers) 客户端( clients)元数据服务器( master) 分布式文件系统 MooseFS的主控端:控制个数据存储服务器 目前只有一个 master,存在单点故障 客户端的访问接口就是 master 支持各种 linux/unix