HBase数据模型(2)

HBase数据模型(2)

HBase数据模型(1)
HBase数据模型(2)

1.0 HBase的版本version，是一个用长整型表示的。由Rowkey、Column（列族和列）、Version组合在一起称为HBase中的一个单元格。

2.0 排序，Get和Scan操作返回的是经过排序的数据。返回的数据首先按行字典排序，其次是列族，然后是列修饰符（cloumn qualifier），最后是时间戳反向排序，最新的在最前面。

3.0 连接查询，实现jion操作有两种方法：要么写入HBase的时候已经做好连接；要么查询表并在应用层实现连接。

4.0 计数器，IncrementColumnValue（简称ICV）是HBase的计数器，可以完成一些计算页面浏览量（PV）等的操作。

5.0 原子操作，仅供对行级别的原子性，也就是对同一个Key下的数据进行的两个操作，在实际执行的时候是会串行的执行，保证了每一行KeyValue对不会被破坏。

6.0 行锁，RegionServer提供了一个行锁特性，保证了只有一个客户端能获取一行数据相应的锁，同时对该行进行修改。

7.0 自动分区

HBase中的表数据会被分拆很多个Region，Region可以动态扩展并且HBase保证Region的负载均衡。
Region实际上是行键排序后的按则分割的连续的存储空间。
Region的自动分区动作是split和compaction
刚刚创建的的表只有一个Region，随着数据的写入，达到Region上限配置时，Region会按照中间键自动地拆分成两个大致相等的Region，每个Region由一个RegionServer管理，一个RegionServer处理器管理者许多个Region。
每个Region包含起始Rowkey的记录，不包含结束Rowkey的记录。
每个RegionServer可以管理大约100 ~ 1000个Region，每个Region的大小可以是1 ~ 20GB。
当一个Region进行拆分时，首先要将该Region下线（offline），拆分完后新的Region在上线（online），下线的Region暂时不可用，不过由于速度极快，通常不会对数据的读写造成影响。

8.0 CAP原理

一致性（Consistency）：所以节点在用一时间具有相同的数据。

可用性（Availability）：保证每个请求不管成功或者失败都有响应。

分区容忍性（Partition tolerance）：系统中任意信息的丢失或失败不会影响系统的继续运作。
HBase数据模型(1)
HBase数据模型(2)

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/lanzhi/p/6467699.html