hadoop 笔记（hbase）

hbase 基础：

hbase是基于列的数据，其数据模式如下：

1、安装

　　1.1）hbase安装分为单机、伪分布式、分布式，单机下安装不依赖于hadoop；因为不需要分布式文件系统支持；
　　1.2）安装并启动服务：
　　　　tar xfz hbase-0.94.12.tar.gz;
　　　　start-hbase.sh
　　　　stop-hbase.sh
　　　　备注：需要先安装jdk
　　1.3) 配置hbase-site.xml
　　　　<configuration>
　　　　　　<property>
　　　　　　　　<name>hbase.rootdir</name>
　　　　　　　　<value>file:///tmp/hbase</value> //如果是集群配置这里就是hadoop的文件系统
　　　　　　</property>
　　　　</configuration>
　　1.3）启动shell控制台
　　　　hbase shell

　　备注：需要配置环境变量，否则执行该命令需要在bin目录下

2. CRUD
　　2.1) 创建
　　　　create 'ti','f1','f2'

　　行为 ti，有f1,f2两个列簇

　　2.2）查看创建的行
　　　　list
　　　　显示t1被创建

　　2.3) 插入(每次操作一个cell)
　　　　put 'ti', 'fredric', 'f1:name','sinny'
　　　　put 'ti', 'fredric', 'f1:age','12
　　　　put 'ti', 'sinny', 'f2:site','hangzhou'

　　2.4) 查看
　　　　scan 'ti'

　　　　结果如下：
　　　　ROW COLUMN+CELL
　　　　fredric column=f1:age, timestamp=1437120810615, value=12
　　　　fredric column=f1:name, timestamp=1437120785387, value=sinny
　　　　sinny column=f2:site, timestamp=1437120892777, value=hangzhou

　　2.5)获取
　　　　get 'ti','fredric'
　　　　get 'ti', 'fredric', {COLUMN => 'f1', TIMESTAMP => 1437120810615}

　　2.6) 删除
　　　　disable 'ti'
　　　　drop 'ti'