zookeeper知识点

一、什么是Zookeeper？

　　Zookeeper是一个开源的分布式应用程序。简称ZK，ZK是一个典型的分布式数据一致性解决方案，分布式应用程序可以基于它实现数据的发布/订阅、负载均衡、名称服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等功能。他运行在JAVA环境之中，并具有JAVA和C的绑定。

二、应用场景：

提供的服务包括：统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下线、软负载均衡等。

三、Zookeeper有什么特性？

1、全局数据一致性：集群中每个服务器保存一份相同的数据副本，client无论连接到那个服务器，展示的数据都是一致的，这是最重要的特征。

2、可靠性：如果消息被其中一台服务器解释，那么将被所有服务器接受。

3、顺序性：包括全局有序和偏序两种。全局有序是指，如果在一台服务器上消息A在消息B前发布，则在所有server上消息A都将在消息B前被发布（也就是先来后到）；偏序是指，如果一个消息B在消息A后被同一个发送者发布，A必将排在B前面。（也是先来后到）

4、原子性：一次性更新数据要么成功（半数以上节点成功），要么失败，不存在中间状态。

5、实时性：在一定的时间范围内，client能读取到最新信息、或者服务器失效的信息。

四、ZooKeeper集群概念

集群角色

Leader： Zookeeper集群工作的核心。事务请求（写操作）的唯一调度和处理者，保证集群事务处理的顺序性；集群内部各个服务器的调度者。对于create，setData，delete等有写操作的请求，则需要统一转发给leader处理，leader需要决定编号，执行操作，这个过程称为一个事务。

Follower：处理客户端非事务（读操作）请求，转发事务请求给Leader；参与集群Leader选举投票。此外，针对访问量比较大的zookeeper集群，还可新增观察者角色。

Observer: 观察者角色，观察zookeeper集群的最新状态变化并将这些状态同步过来，其对于非事务请求可以进行独立处理，对于事务请求，则会转发给Leader服务器进行处理。不会参与任何形式的投票只提供非事务服务，通常用于在不影响集群事务的处理能力的前提下提升集群的非事务处理能力。

注意：当Leader故障之后ZooKeeper集群会通过Follower选举新的Leader，如果老的Leader故障修复之后，会再次接管集群中的Leader脚本，新的Leader则退回Follower角色。一般集群当中无需设置Observer节点，Follower节点即可。

图解集群

五、ZooKeeper的设计目标

　　ZooKeeper允许分布式进程通过共享的分层命名空间相互协调，该命名空间的组织方式与标准文件系统类似。名称空间由数据寄存器(在ZooKeeper中，被称为Znodes)组成，这些寄存器类似于文件和目录，与设计用于存储的典型文件系统不同，ZooKeeper数据保存在内存中，这意味着ZooKeeper可以实现高吞吐量和低延迟数。ZooKeeper实现非常重视高性能、高可用性、严格有序的访问，ZooKeeper的性能方面意味着它可以在大型分布式系统中使用，可靠性方面使其不会称为单点故障，严格的排序意味着可以在客户端实现复杂的同步原语。

集群角色工作原理介绍：

　　上图中有5个ZooKeeper节点，其中一个节点为Leader，除leader节点外，其它都是追随者Follower，Client与ZK集群建立TCP长连接，只有追随者Follower节点来与Client建立连接(我们的Client与Follower建立的连接会始终存在，只有Client不再参与集群或者客户端出现故障之后才会断开连接，是一个持久会话，通过此会话，Client会不短向自己所连接的Follower更新自己的状态信息)，并处理Client的请求，如果Client为读请求，则会转发到Follower或者本机进行处理，如果为写请求则转发给Leader处理。如果Client与连接的一台ZK集群中的服务器发生数据变更，则ZK集群中的这台服务器会把变更内容同步到ZK集群中的所有ZK服务器。

数据模型

　　ZooKeeper的数据模型，在结构上和标准文件系统的非常相似，拥有一个层次的命名空间，都是采用树形层次结构，ZooKeeper树中的每个节点被称为—Znode。和文件系统的目录树一样，ZooKeeper树中的每个节点可以拥有子节点。但也有不同之处：

Znode兼具文件和目录两种特点。既像文件一样维护着数据、元信息、ACL(访问控制列表)、时间戳等数据结构，又像目录一样可以作为路径标识的一部分，并可以具有子Znode。用户对Znode具有增、删、改、查等操作（权限允许的情况下）。

　　 2. Znode具有原子性操作，读操作将获取与节点相关的所有数据，写操作也将替换掉节点的所有数据。另外，每一个节点都拥有自己的ACL(访问控制列表)，这个列表规定了用户的权限，即限定了特定用户对目标节点可以执行的操作。

　　 3. Znode存储数据大小有限制。ZooKeeper虽然可以关联一些数据，但并没有被设计为常规的数据库或者大数据存储，相反的是，它用来管理调度数据，比如分布式应用中的配置文件信息、状态信息、汇集位置等等。这些数据的共同特性就是它们都是很小的数据，通常以KB为大小单位。ZooKeeper的服务器和客户端都被设计为严格检查并限制每个Znode的数据大小至多1M，当时常规使用中应该远小于此值。

　　 4. Znode通过路径引用，如同Unix中的文件路径。路径必须是绝对的，因此他们必须由斜杠字符来开头。除此以外，他们必须是唯一的，也就是说每一个路径只有一个表示，因此这些路径不能改变。在ZooKeeper中，路径由Unicode字符串组成，并且有一些限制。字符串"/zookeeper"用以保存管理信息，比如关键配额信息。