cdh因为无法恢复yarn任务导致yarn ResourceManager无法重启

1 因为内存溢出问题导致yarn ResourceManager无法启动,多次重启仍然失败

2 查询到原因是因为重启rm的时候,会尝试恢复之前所有的yarn任务,但是之前内存溢出的原因就是因为yarn任务的内存压力过大导致。所以不断重启也没用。

3 解决方案,进入zookeeper控制台,找到保存yarn任务的地方,删除yarn任务信息,待resourceManager启动成功后,重新提交之前的任务。

  sh /opt/cloudera/parcels/CDH-5.16.1-1.cdh5.16.1.p0.3/lib/zookeeper/bin/zkCli.sh

      ls /rmstore/ZKRMStateRoot/RMAppRoot

     

rmr /rmstore/ZKRMStateRoot/RMAppRoot/对应的任务id

4 之后重启成功,重新提交任务也可以运行了。

     

原文地址:https://www.cnblogs.com/QuestionsZhang/p/13885048.html