MR/hive/shark/sparkSQL

shark完全兼容hive,完全兼容MR,它把它们替代。类SQL查询,性能比hive高很多

sparkSQL比shark更快。shark严重依赖hive,hive慢,无法优化。

SparkSQL和shark最大不同,shark封装hive,受制于hive底层局限,性能无法优化,SparkSQL完全基于Spark,性能超过,Spark2.0最大改善,把SparkSQL作为优化中的,比1.5.2更加优化,同时SparkSQL完成支持SQL95标准。

原文地址:https://www.cnblogs.com/tieandxiao/p/8870218.html