透过面试题,洞察Hbase 核心知识点

LSM  算法

HFile

索引 ,二级索引


hbase的问题


1.hbase怎么预分区? 


2.hbase怎么给web前台提供接口来访问?


3.htable API有没有线程安全问题,在程序中是单例还是多例?


4.我们的hbase大概在公司业务中(主要是网上商城)大概都几个表,几个表簇,大概都存什么样的数据?


5.hbase的并发问题?


第二部分:HBase核心知识点(对于Hbase实现核心LSM,会在下篇文章介绍)

11. LSM含义是?A
日志结构合并树(Log-Structured Merge Tree)
二叉树
平衡二叉树
长平衡二叉树

12. 下面对LSM结构描述正确的是? AC
顺序存储
直接写硬盘
需要将数据Flush到磁盘
是一种搜索平衡树

13. LSM更能保证哪种操作的性能?B
随机读
合并

14. LSM的读操作和写操作是独立的?A
是。
否。
C LSM并不区分读和写
D LSM中读写是同一种操作

15. LSM结构的数据首先存储在()。 B
硬盘上
内存中
磁盘阵列中
闪存中

16 HFile数据格式中的Data字段用于()。A
存储实际的KeyValue数据
存储数据的起点
指定字段的长度
存储数据块的起点

17 HFile数据格式中的MetaIndex字段用于()。D
A Meta块的长度
B Meta块的结束点
C Meta块数据内容
D Meta块的起始点

18 HFile数据格式中的Magic字段用于()。A
存储随机数,防止数据损坏
存储数据的起点
存储数据块的起点
指定字段的长度

19 HFile数据格式中的KeyValue数据格式,下列选项描述正确的是()。AD
byte[]数组
没有固定的结构
数据的大小是定长的
有固定的结构

20 HFile数据格式中的KeyValue数据格式中Value部分是()。C
拥有复杂结构的字符串
字符串
二进制数据
压缩数据


第三部分:HBase高级应用介绍

34. HBase构建二级索引的实现方式有哪些? A、B
A MapReduce
B Coprocessor
(HBase在0.92之后引入了协处理器(coprocessors),实现一些激动人心的新特性:能够轻易建立二次索引、复杂过滤器(谓词下推)以及访问控制等)
C Bloom Filter
D Filter

35. 关于HBase二级索引的描述,哪些是正确的?A、B
核心是倒排表
二级索引概念是对应Rowkey这个“一级”索引
二级索引使用平衡二叉树
二级索引使用LSM结构

36. 下列关于Bloom Filter的描述正确的是?A、C
是一个很长的二进制向量和一系列随机映射函数
没有误算率
有一定的误算率
可以在Bloom Filter中删除元素

-------------------------------------华丽分割线-------------------------------------------




原文地址:https://www.cnblogs.com/TendToBigData/p/10501427.html