Aliyun EMR 集群重启

1.如果Core节点有Down掉,ActiveNodes少于Core节点数。

处理:

a.登陆到Master节点,到目录 /opt/apps/hadoop-2.7.2/sbin

b.执行 ./stop-all.sh ./start-all.sh,重启所有服务 c.观察日志,看服务是否正常启动,如果异常,根据日志逐步排查

2.如果Hive不可用,

排查如下: ps axu | grep HiveMeta ps axu | grep HiveServer 查看相关服务是否正常在RUN,且查看相关日志排查问题

重启步骤:

a.登陆到Master节点

b.kill -9 pid

c.hive meta重启:su -l hadoop -c "HADOOP_HEAPSIZE=512 HADOOP_OPTS='-Dproc_metastore' hive --service metastore >>/var/log/hive/metastore.log 2>&1 &"

d.hive server重启:su -l hadoop -c "HADOOP_HEAPSIZE=512 HADOOP_OPTS='-Dproc_hiveserver2' hive --service hiveserver2 >>/var/log/hive/hiveserver2.log 2>&1 &"

重启完成,查看日志和服务是否正常,如果不正常,继续排查处理

原文地址:https://www.cnblogs.com/yako/p/5996728.html