【HBase学习】Apache HBase项目简介

原创声明：转载请注明作者和原始链接 http://www.cnblogs.com/zhangningbo/p/4068957.html

英文原版：http://hbase.apache.org/

Apache HBase^TM ，即Hadoop 数据库，是一个分布式的、可缩放的大数据存储方案。

何时使用Apache HBase？

当需要随机、实时读写大数据时，就可以使用Apache HBase了。该项目旨在组织甚大规模的位于商业硬件集群之上的表——数十亿行 × 数百万列。Apache HBase是一个开源的、分布式的、版本化的、非关系型数据库，基于Google BigTable论文（A Distributed Storage System for Structured Data）来建模。就像BigTable借用GFS（Google File System）提供的分布式数据存储能力一样，Apache HBase也在Hadoop和HDFS之上提供了类似BigTable一样的能力。

特性

线性的和模块化的可扩展性
严格一致的读写
自动的和可配置的表分片
在RegionServer之间支持自动故障恢复
用Apache HBase表支持Hadoop MapReduce 任务的方便的基础类
客户端易用的Java API
块缓存和Bloom过滤器机制，支持实时查询
通过服务器端过滤器查询可以预测下推
Thrift 网关和REST-full Web服务，支持XML、protobuf和二进制数据编码选项
可扩展的jruby-based （JIRB）shell
支持通过Hadoop 测量子系统把测量导出至文件或者Ganglia；或者通过JMX

在哪里可以获得更多的信息？

查看架构概述，Apache HBase 参考手册FAQ，及其它文档。

参考阅读

1）HBase官方网站

2）HBase参考指南（官方文档英文版）

3）HBase参考指南（官方文档中文版，本人译）

4）HBase参考指南（官方文档中文版，周海汉，颜开）