第一章 大数据概述
PS:大数据4V的说法。
Volume、Variety、Value、Velocity
第二章 大数据技术与挑战
PS:
1.大数据数据处理模型
a.流处理 :spark 和 kafka
b.批处理 : mapreduce
第三章 MapReduce
PS:
1.MapReduce的数据来源一般是HDFS
第一章 大数据概述
PS:大数据4V的说法。
Volume、Variety、Value、Velocity
第二章 大数据技术与挑战
PS:
1.大数据数据处理模型
a.流处理 :spark 和 kafka
b.批处理 : mapreduce
第三章 MapReduce
PS:
1.MapReduce的数据来源一般是HDFS