kafka中对于zookeeper的理解和leader选举过程

1. 首先zookeeper是什么

　　zookeeper是一个开放源代码的分布式应用程序协调服务，可以把它看成是整个集群的管理者，监视者。

2. zookeeper能做什么

　　它可以实现诸如分布式应用配置管理、统一命名服务、状态同步服务、集群管理等功能。

3. zookeeper服务与kafka集群的联系

　　这里首先说一下broker的概念：Kafka 集群包含一个或多个服务器，这种服务器被称为 broker，每个broker服务器都要连接到zk服务。

一个典型的kafka集群中包含若干个producer（生产者），若干broker（一般broker越多，集群吞吐率越高），若干consumer group（消费组），以及一个zookeeper服务。
kafka通过zookeeper管理集群配置，选举leader，以及在消费组发生变化时进行rebalance。
producer使用push模式将消息发布到broker，consumer使用pull模式从broker订阅并消费消息。

4. Leader选举流程。

　　选举流程主要出现在以下两种情况发生时：

　　（1）服务器初始化启动时；

　　（2）服务器在运行期间leader出现故障。

　　由于涉及到算法和流程较复杂，这里就以个人理解浅显的描述以下选举过程，如有不当的地方欢迎指正。

　　当服务器在初始化时启动：

　　假设集群中共有3台机器，分别使用server1、server2、server3等来表示，按编号以此启动起来。
　　第一步：每个server发起一个投票，推荐自己作为leader服务器，投票内容为（Serverid，Zxid），分别表示服务器ID、数据ID（服务器中存放定的最大数据ID）。由于server1先启动，它的投票为（1，0），然后进入Looking状态；
　　第二步：server2启动，发起投票为（2,0），并与已启动的server1交换结果，由于server2的编号2大于1，因此胜出，并告知server1。
　　第三步：server1将自己的投票改为（2,0），并重新投票。而server继续维持之前投票（2,0）。这个时候统计第二轮投票，server2以两票胜出，同时判断当前投票人数为2，已经超过3台服务器的50%，因此结果生效，server2当选为Leader，状态变为LEADING；server1状态变为FOLLOWING。
　　第四部：此时server3启动，发现Leader已经存在，则直接将自己的状态调整为FOLLOWING。

　　注意：如果集群中有5台机器，那么由于投票人数不足50%，则需要保持Looking状态，继续等待新的投票者加入，直到超过50%为止。

　　当服务器在运行期间leader出现故障：　　

　　第一步：假设server2作为leader挂了之后，剩下所有机器都会将自己的状态改为LOOKING，然后开始Leader选举过程。
　　第二步：server1发出投票为（1，233），server3发出投票为（3,222）。
　　第三步：两台机器互相接收来自别的服务器的投票，判断投票的有效性（是否来自LOOKING状态的服务器），然后进行将别人的投票与自己的投票进行PK，PK规则如下：1.优先检查Zxid，Zxid较大的优先作为leader；2.如果Zxid相同，那么Serverid较大的胜出。对于当前情况来看，server1胜出。
　　第四步：发起第二轮投票，server3将自己投票改为（1,233），server1保持不变（1,233），此时判断投票人数超过半数，server1胜出，当选为新leader。server1状态改为LEADING，server3状态改为FOLLOWING。

参考文章：《zookeeper的leader选举过程》

https://blog.csdn.net/virtil33/article/details/94343215

最懒的人就是整天忙得没时间学习、反思、成长的人。