HBase

HBase概述

1.HBase是一个构建在HDFS上的分布式列存储系统

2.HBase是Apache Hadoop生态系统中的重要一员，主要用于海量结构化数据存储

3.从逻辑上讲，HBase讲数据按照表、行和列进行存储

HBase是Hadoop生态系统的一个组成部分

Hbase与HDFS对比

两者都具有良好的容错性和扩展性，都可以扩展到成百上千个节点;

HDFS适合批处理场景

　　不支持数据随机查找

　　不适合增量数据处理

　　不支持数据更新

Hbase表的特点

　　大：一个表可以有数十亿行，上百万列;

　　无模式：每行对都有一个可排序的主键和任意多的列，列可以根据需要动态的增加，同一张表中不同的行可以有截然不同的列;

　　面向列：面向列（族）的存储和权限控制，列（族）独立检索

　　稀疏：对于空（null）的列，并不占用存储空间，表可以设计的非常稀疏;

　　数据多版本：每个单元中的数据可以有多个版本，默认情况下版本号自动分配，是单元插入时的时间戳;

　　数据类型单一：Hbase中的数据都是字符串，没有类型

行存储与列存储

　　数据是按行存储的

　　没有索引的查询实用大量I/O

　　建立索引和物化视图需要花费大量时间和资源

　　面向查询的需求，数据库必须被大量膨胀才能满足性能要求

　　数据是按列存储-每一列单独存放

　　数据即是索引

　　指访问查询涉及的列-大量降低系统I/O

　　每一列由一个线索来处理-查询的并发处理

　　数据类型一致，数据特征相似-高效压缩

Hbase数据模型

　　HBase是基于Google Big Table模型开发的，典型的key/value系统;

Hbase逻辑视图

Rowkey与Column Family

Hbase基本概念

　　Row Key

　　　　Byte array

　　　　表中每条记录的 “主键"

　　　　方便快速查找

　　Column Family

　　　　拥有一个名称(string)

　　　　包含一个或者多个相关列

　　Column

　　　　属于某一个column family

　　　　包含在某一列中 Column Family

　　Version Number

　　　　每个rowkey唯一

　　　　默认值->系统时间戳

　　　　类型为Long

　　Value（Cell）

　　　　Byte array

Hbase数据模型

　　HBase schema可以有多个Table

　　每个表可由多个Column Family组成

　　HBase可以有Dynamic Column

　　　　列名称是编码在cell中的

　　　　不同的cell可以拥有不同的列

　　version number 可由用户提供

　　　　无需以递增的顺序插入

　　　　每一行的rowkey必须是唯一的

　　Table可能非常稀疏

　　　　很多cell可以是空的

　　Row Key是主键

Hbase支持的操作

　　所有操作均是基于rowkey的;

　　支持CRUD（Create、Read、Update和Delete）和Scan;

　　单行操作

　　　　Put

　　　　Get

　　　　Scan

　　多行操作

　　　　Scan

　　　　MultiPut

　　没有内置join操作，可使用MapReduce解决

Hbase物理模型

　　每个column family存储在HDFS上的一个单独文件中;

　　Key和Version number在每个column family中均有一份;

　　HBase 为每个值维护了多级索引，即：key,column family,column name,timestamp

　　空值不会被保存。

物理存储

　　Table中的所有行都按照row key的字典序排列

　　Table在行的方向上分割为多个Region;

　　Region按大小分割的，每个表开始只有一个region，随着数据增多，region不断增大，当增大到一个阀值的时候，region就会等分成两个新的region，之后会有越来越多的region;

　　Table在行的方向上分割为多个Region;

　　Region是HBase中分布式存储和负载均衡的最小单元。

　　不同Region分布到不同RegionServer上;Table在行的方向上分割为多个Region;

　　Region虽然是分布式存储的最小单元，但并不是存储的最小单元。

　　Region由一个或者多个Store组成，每个store保存一个columns family;

　　每个Store又由一个memStore和0至多个StoreFile组成;

　　memStore存储在内存中，StoreFile存储在HDFS上;

　　Client

　　　　包含访问HBase的接口，并维护cache来加快对HBase的访问

　　Zookeeper

　　　　保证任何时候，集群中只有一个master

　　　　存贮所有Region的寻址入口

　　　　实时监控Region server的上线和下线信息。并实时通知给Master

　　　　存储HBase的schema和table元数据

　　Master

　　　　为Region server分配region

　　　　负责Region server的负载均衡

　　　　发现失效的Region server并重新分配其上的region

　　　　管理用户对table的增删改查操作

Zookeeper作用

　　HBase依赖Zookeeper

　　默认情况下，HBase管理ZooKeeper实例

　　Master与RegionServers启动时会向Zookeeper注册

　　Zookeeper的引入使得Master不再是单点故障

HBase容错性

　　Master容错：Zookeeper重新选择一个新的Master

　　　　无Master过程中，数据读取仍照常进行

　　　　无Master过程中，region切分、负载均衡等无法进行

　　RegionServer容错：定时向Zookeeper汇报心跳，如果一段时间内为出现心跳

　　　　Master将该RegionServer上的Region重新分配到其他RegionServer上

　　　　失效服务器上"预写"日志由住服务器进行分割并派送给新的RegionServer

　　Zookeeper容错：Zookeeper是一个可靠地服务

　　　　一般配置3或5个Zookeeper实例

Region定位

　　第一次读取：

　　　　步骤1：读取ZooKeeper中ROOT表的位置

　　　　步骤2：读取ROOT表中.META表的位置

　　　　步骤3：读取.META表中用户表的位置

　　　　步骤4：读取数据

如果已经读取过一次，则root和.META都会缓存到本地则直接去用户表的位置读取数据

ROOT表与.META表

　　ROOT表

　　　　ROOT表包含.META表所在的region列表，该表只会有一个Region;

　　　　Zookeeper中记录了ROOT表的location

　　.META表

　　.META表包含所有的用户空间region列表，以及REgionServer的服务器地址

何时使用HBase

　　需数据进行随机读操作或者随机写操作

　　大数据上高并发操作，比如每秒对PB级数据进行上千次操作

　　读写访问均是非常简单的操作

Hbase在淘宝的应用

　　交易历史记录查询系统

　　　　百亿行数据表，千亿级二级索引表

　　　　每天千万行更新

　　　　查询场景简单，检索条件少

　　　　关系型数据库所带来的问题

　　　　基于userId+time+id的rowkey设计

　　　　成本考虑