Hadoop集群nodes unhealthy(yarn 8088)排查及解决办法

1.提交任务到hadoop yarn集群,发现任务提交之后很长时间不能运行结束;yarn8088页面资源并没有使用,任务处于ACCEPTED状态,

 


经过检查,发现所有的nodes节点都处于unhealthy的状态,使用命令查看node 的状态

Yarn日志
yarn-root-nodemanager-node01.log

解决办法
* 1 把节点上的不用的东西删完,删到90%以下即可
* 2 在yarn-site.xml中添加以下配置信息,修改上限和下限
<property>
<name>yarn.nodemanager.disk-health-checker.min-healthy-disks</name>
<value>0.0</value>
</property>
<property>
<name>yarn.nodemanager.disk-health-checker.max-disk-utilization-per-disk-percentage</name>
<value>100.0</value>
</property>

 问题解决以后,yarn8088的页面如下:

 

原文地址:https://www.cnblogs.com/songyuejie/p/14889408.html