大数据学习路线

基础:

1.SQL功底

2.linux基础命令

3.JavaSE

第一阶段:Hadoop 2.x (HDFS、MapReduce、YARN)

第二阶段:大数据仓库Hive

第三阶段:大数据协作框架(sqoop、Flume、Oozie、Hue)

第四阶段:分布式数据库Hbase

第五阶段:流计算Storm

第六阶段:内存计算框架Spark

第七阶段:企业大数据平台 ( Cloudera Manager )

大数据应用分析:

1. 统计

2. 推荐

3. 机器学习

4. 人工智能,预测(算法)

SQL-on-Hadoop

1. Hive

2. Prestore

3. Impala

4. Phoneix (基于HBase)

5. Spark-SQL

原文地址:https://www.cnblogs.com/share100/p/6865072.html