一、四个核心问题
1、存储:HDFS、Kafka、HBase
2、查询:
NoSql:Cassandra
OLAP:Kylin、Impla、Hive、Pig、Spark SQL
3、计算:MapReduce、Spark、Flink、Spark Streaming、Storm、S4
4、挖掘:Mahout、TensorFlow、Caffe、MLib
二、技术生态
三、趋势
1、HDFS、HBase、Kafka
2、Spark、Spark GraphX、Spark Streaming
3、MLib