hadoop解决集群启动时某个slave的datanode挂掉问题

问题描述:

搭建好的集群,启动时发现有一台datanode挂掉了,这时检查了一下配置,排除此类原因。最后,想起了如果集群是第一次启动,需要格式化NameNode(注意格式化之前,一定要先停止上次启动的所有namenode和datanode进程,然后再删除data和log数据),恰好挂掉的那台机器就是这个原因,立马删除了data下的数据,同时删除其他两台对应目录下的数据,重新操作,即可解决。

本集群的基本信息如下:

  hadoop101  hadoop103 hadoop104
HDFS

NameNode

DataNode

DataNode

DataNode

SecondaryNameNode

YARN NodeManager

ResourceManager

NodeManager

NodeManager

(PS:挂掉的是hadoop104,jps时没有datanode信息,删除data下的数据即可解决)

原文地址:https://www.cnblogs.com/guohaoblog/p/13258458.html