透过面试题，洞察Hbase 核心知识点

LSM 算法

HFile

索引，二级索引

hbase的问题

1.hbase怎么预分区？

2.hbase怎么给web前台提供接口来访问？

3.htable API有没有线程安全问题，在程序中是单例还是多例？

4.我们的hbase大概在公司业务中（主要是网上商城）大概都几个表，几个表簇，大概都存什么样的数据？

5.hbase的并发问题？

第二部分：HBase核心知识点(对于Hbase实现核心LSM，会在下篇文章介绍）

11. LSM含义是？A

A 日志结构合并树（Log-Structured Merge Tree）

B 二叉树

C 平衡二叉树

D 长平衡二叉树

12. 下面对LSM结构描述正确的是？ A、C

A 顺序存储

B 直接写硬盘

C 需要将数据Flush到磁盘

D 是一种搜索平衡树

13. LSM更能保证哪种操作的性能？B

A 读

B 写

C 随机读

D 合并

14. LSM的读操作和写操作是独立的？A

A 是。

B 否。

C LSM并不区分读和写

D LSM中读写是同一种操作

15. LSM结构的数据首先存储在（）。 B

A 硬盘上

B 内存中

C 磁盘阵列中

D 闪存中

16 HFile数据格式中的Data字段用于（）。A

A 存储实际的KeyValue数据

B 存储数据的起点

C 指定字段的长度

D 存储数据块的起点

17 HFile数据格式中的MetaIndex字段用于（）。D

A Meta块的长度

B Meta块的结束点

C Meta块数据内容

D Meta块的起始点

18 HFile数据格式中的Magic字段用于（）。A

A 存储随机数，防止数据损坏

B 存储数据的起点

C 存储数据块的起点

D 指定字段的长度

19 HFile数据格式中的KeyValue数据格式，下列选项描述正确的是（）。A、D

A 是byte[]数组

B 没有固定的结构

C 数据的大小是定长的

D 有固定的结构

20 HFile数据格式中的KeyValue数据格式中Value部分是（）。C

A 拥有复杂结构的字符串

B 字符串

C 二进制数据

D 压缩数据

第三部分：HBase高级应用介绍

34. HBase构建二级索引的实现方式有哪些？ A、B

A MapReduce

B Coprocessor

(HBase在0.92之后引入了协处理器(coprocessors)，实现一些激动人心的新特性：能够轻易建立二次索引、复杂过滤器(谓词下推)以及访问控制等)

C Bloom Filter

D Filter

35. 关于HBase二级索引的描述，哪些是正确的？A、B

A 核心是倒排表

B 二级索引概念是对应Rowkey这个“一级”索引

C 二级索引使用平衡二叉树

D 二级索引使用LSM结构

36. 下列关于Bloom Filter的描述正确的是？A、C

A 是一个很长的二进制向量和一系列随机映射函数

B 没有误算率

C 有一定的误算率

D 可以在Bloom Filter中删除元素

-------------------------------------华丽分割线-------------------------------------------