HDFS(三)

DataNode
  下面的数据文件有两种类型,一种是数据块,一种是数据块的描述文件(元数据文件),后者文件后面带有.meta后缀;
  Version文件字段内容其实和NameNode里面涵义是一致的;
  安全模式,是NameNode在load索引文件(fsimage+edits文件)的时候的状态,改状态下只能读不能写;一般发生在HDFS重新启动的场景;可以手动离开或者进入到安全模式,就是通过dfsadmin工具

工具
  dfsadmin,主要用他的还是进入离开“安全模式”;
  fsck工具,来检查HDFS中文件的健康状态,并可以指定对于文件的操作;检查文件的副本数是否满足配置,文件块是否却是;fsck工具只是在NameNode中获取数据(并不和DataNode交互);
  datanode扫描器,fsck工具只是文件block数量层面的check,扫描器则是判断文件是否有损坏;扫描器只是扫描,报告现状;需要管理员手动去进行文件块的修复;
  均衡器,保证DataNode数据文件分配均匀;看到均衡器你应该知道为什么NN不持久化DN的数据,因为不靠谱;经过扫描器处理之后,将会导致数据文件的迁移,所以此时记录的DN的之前相关存储路径,反而是脏时间。

原文地址:https://www.cnblogs.com/xiashiwendao/p/8688664.html