如何查找和分析MapReduce的log日志

在Hive客户端执行HQL查询报错,该查询走的是MapReduce,此时需要查看MapReduce的日志信息。

那么MR的日志在哪里呢?

首先启动historyserver,认情况下HistoryServer没有启动

进入到hadoop的bin目录下,执行以下命令,开启之后,jps一下确认有JobHistoryServer

[root@master sbin]# ./mr-jobhistory-daemon.sh start historyserver

然后需要确认 yarn-site.xml的一个配置信息,启用日志聚集功能,默认为false,不打开则查看详细日志会报错

<property>
        <name>yarn.log-aggregation-enable</name>
        <value>true</value>
</property>

登陆Yarn的WebUI监控界面:hostname:8088,在这个界面可以看到所有执行的applicaitons。

 点击Histroy的链接,进入该应用的历史信息,点击对应的数字,查看出错的日志信息。

 经过分析发现出错的原因是数组的索引超出范围,导出出错。

 

另外MapReduce的log日志存放位置是在HDFS上,每个应用都有对应的文件夹。

原文地址:https://www.cnblogs.com/lucas-zhao/p/11908137.html