Zookeeper概论（对zookeeper的概论、原理、架构等的理解）

Zookeeper概论（对zookeeper的概论、原理、架构等的理解）

一、概论

　　Zookeeper是一个分布式的、开放源码的分布式应用程序协调服务，是Google的Chubby一个开源的实现，是hadoop和hbase

的重要组件。它是一个为分布式应用提供一致性服务的软件。提供的功能包括：配置维护、名字服务、分布式服务、组服务等。

　　Zookeeper的目标就是封装好复杂易出错的关键服务，将简单易用的接口和性能高效、功能稳定的系统提供给用户。

　　Zookeeper包含一个简单的原语集，提供Java和C的接口。

　　Zookeeper代码版本中，提供了分布式独享锁、选举、队列的接口，代码在Zookeeper-3.4.3src ecipes。其中分布锁和队列

有Java和C两个版本，选举只有Java版本。

二、原理

　　Zookeeper是以Fast Paxos算法为基础的，paxos算法存活在活锁的问题，即当有多个proposer交错提交时，有可能互相排

斥导致没有一个proposer能提交成功，而Fast Paxos 做了一些优化，通过选举产生一个leader，只有leader才能提交proposer，

具体算法可见Fast Paxos。因此，要想弄懂Zookeeper首先要对Fast Paxos有所了解。

　　Zookeeper的基本运转流程：

　　1、选举Leader。

　　2、同步数据。

　　3、选举Leader过程中算法有很多，但要达到的选举标准是一致的。

　　4、Leader要具有最高的zxid。

　　5、集群中大多数的机器得到响应并follow选出的Leader。

三、架构：

四、功能

　　Zookeeper分布式服务框架是Apache Hadoop的一个子项目，它主要是用来解决分布式应用中经常遇到的一些数据管理问

题，如：统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。

五、数据结构

　　Zookeeper这种数据结构有如下特点：

　　1、每个子项目如NameService都被称作为znode，这个znode是它所在的路径唯一标识，如Server1这个znode的标识

为/NameService/Server1。

　　2、znode可以有子节点目录，并且每个znode可以存储数据，注意EPHEMERAL类型的目录节点不能有子节点目录。

　　3、znode是有版本的，每个znode中存储的数据可以有多个版本，也就是一个访问路径中可以存储多份数据。

　　4、znode可以是临时节点，一旦这个znode的客户端和服务器失去联系，这个znode也将自动删除，Zookeeper的客户端和

服务器通信采用长连接方式，每个客户端和服务器通过心跳来保持连接，这个连接状态称为session，如果znode是临时节点，这个

session失效，znode也就删除了。

　　5、znode的目录名可以自动编号，如App1已经存在，再创建的话，将会自动命名为App2。

　　6、znode可以被监控，包括这个目录节点中存储的数据的修改，子节点目录的变化等，一旦变化可以通知设置监控的客户端，

这个是Zookeeper的核心特性，Zookeeper的很多功能都是基于这个特性实现的。