Spark On YARN使用时上传jar包过多导致磁盘空间不够。。。

今天测试过程中发现YARN Node变成Unhealthy了,后来定位到硬盘空间不够。。。。。

通过查找大于100M的文件时发现有N多个spark-assembly-1.4.0-SNAPSHOT-hadoop2.5.0-cdh5.3.1.jar包,大小为170多M,

每提交一个application到yarn上执行,就会上传一个assembly包,application个数一多,磁盘就本占用了N多空间。。。。

解决方法参见【Spark On Yarn中spark.yarn.jar属性的使用

原文地址:https://www.cnblogs.com/luogankun/p/4363169.html