Hbase学习

1.特点

Hadoop擅长存储任意的、半结构化数据,甚至非结构化数据。

列式存储:以列为单位聚合数据,然后列值顺序存入磁盘。

col1 id1 id2 id3
col2 name1 null name3

列式存储的需要:对于特定的查询,不是所有的值都是必须的;减少IO是主要因素;列的数据类型相似,有利于压缩,提高了压缩比,返回结果时能降低带宽的消耗。

从RDBMS角度看,HBase不是一个列式存储的数据库,但是他利用了磁盘的列式存储格式。

Hbase适用于键值对数据存取,或有序数据存取。

原文地址:https://www.cnblogs.com/zhxdxf/p/8066166.html