炼数成金hadoop视频干货06-10


 视频地址:http://pan.baidu.com/s/1dDEgKwD


第六课统讲了hadoop几个子项目和HBase,第七课还是讲的HBase


第八课讲了PIG


第九课讲了Hive和Zookeeper


第十课讲了sqoop

这一课还是比较受用,之前就一直疑问HDFS怎么和关系型数据库联系起来

原来有这样的组件


这几节讲的很笼统,也不实践,都是快进看的。


Linux whereis命令

http://www.jb51.net/os/RedHat/1103.html


MR的输出目录必须是不存在的


nosql不是 no sql

是 not only sql


1.HBase适于用比较成熟的额分析主题,即建表后查询语句和表不再更改的

2.HBase最近的数据在内存中,一定时间后才会写在HDFS中,所以查询有可能完全不用IO,速度很快

3.HBase的分布式是按行键范围分布的


linux set命令


视频看完了,应该算是入门了吧


欲为大树,何与草争;心若不动,风又奈何。
原文地址:https://www.cnblogs.com/admln/p/dataguru06-10.html