【存储】HDFS的数据操作（四） - Kaka

HDFS架构

文件是被切块存储在若干台datanode服务器上
hdfs提供了一个统一的目录树来定位hdfs中的文件，客户端访问文件时只要指定目录树的路径即可，不用关心文件的具体物理位置
每一个文件的每一个切块，在hdfs集群中都可以保存多个备份（默认３份），在hdfs-site.xml中，dfs.replication的value的数量就是备份的数量
namenode，它维护了一个hdfs的目录树及hdfs目录结构与文件真实存储位置的映射关系（元数据）
datanode服务进程专门负责接收和管理＂文件块＂－block,默认大小为128M(可配置dfs.blocksize)

hdfs dfs 与 hadoop fs 效果一样