hadoop

Cloudera :Hadoop开发员认证(CCDH) 
1、了解MapReduce和HDFS是如何组合相互匹配,提供可扩展的强大系统。
2、学习编写针对Hadoop's API的程序,掌握编写更有趣的数据处理任务所需的基本技能。
3、掌握如何在数据中心服务器上或Amazon's EC2上部署Hadoop,利用Hadoop扩充现有系统
4、掌握如何把不同类型数据导入Hadoop作进一步分析,以及利用Sqoop导入现有数据库
5、掌握如何使用Hive,涉及数据导入、表格创建及作出查询。
6、掌握最佳方案以减轻MapReduce程序调试难度,及规模调试的本地测试工具和技术。
7、深入了解Hadoop API,包括自定义数据类型和文件格式,HDFS的直接访问,中间数据划分,以及其他工具,如DistributedCache。
8、深入了解图算法,以及PageRank。了解有效执行联接的策略,比较不同数据模型的不同技术。
9、掌握如何进行MapReduce程序优化,提高性能

介绍 Hadoop和大型数据
MapReduce和HDFS
Hadoop生态系统
使用Hadoop
The Hadoop MapReduce API
MapReduce的算法导论
MapReduce程序编写
利用Hadoop扩充现有系统
数据处理管道最佳方案
利用Sqoop导入现有数据库
使用Pig
Hive导论 - Hadoop的数据仓库
使用Hive
调试MapReduce程序
高级Hadoop API
高级算法
MapReduce程序优化

网站地址 http://www.sittc.com/course.php?typeid=17&cid=27

原文地址:https://www.cnblogs.com/myibm/p/6340849.html