hbase建索引的两种方式

转载自http://blog.csdn.net/ryantotti/article/details/13295325

在二级索引的实现技术上一般有几个方案:

1.      表索引

使用单独的hbase表存储索引数据,业务表的索引列值做为索引表的rowkey,业务表的rowkey做为索引表的qualifiervalue

问题:对数据更新性能影响较大;无法保证一致性;Client查询需要2RPC(先索引表再数据表)。

2.      列索引

与业务表使用相同表,使用单独列族存储索引,用户数据列值做为索引列族的Qualifier,用户数据Qualifier做为索引列族的列值。适用于单行有上百万Qualifier的数据模型,如网盘应用中网盘ID做为rowkey,网盘的目录元数据都存储在一个hbase row内。(facebook消息模型也是此方案)

可保证事务性。

问题:仅适用于特定的应用场景。

原文地址:https://www.cnblogs.com/1130136248wlxk/p/4991074.html