HDFS一个分布式的文件系统,相比普通的文件系统来说更加复杂,因此在学习HDFS的操作之前有必要先来学习一下HDFS的存储架构。如图1所示。HDFSArchitectureMetadata(Namehreplicas,/home/fooZdata.3.图1HDFS存储架构图从图1可以看出,HDFS采用主从架构(Master/Slave架构)。HDFS集群分别由一个NameNode和多个的DataNode组成。其中,NameNodeHDFS集群的主节负责管理文件系统的命名空间以及客户端对文件的访问;DataNode集群的从节,负责管理它所在节上的数据存储。HDFS分布式文件系统中的NameNode和DataNode两种角色各司其职,共同协调完成分布式的文件存储。那么,NameNode如何管理分布式文件系统的命名空间呢?其实,在NameNode内部以元数据的形式,维护着两个文件,分别FsImage镜像文件和EditLog日志文件。其中,FsImage镜像文件用于存储整个文件系统命名空间的信息,EditLog日志文件用于持久化记录文件系统元数据发生的变化。当