ZooKeeper入门（二） Zookeeper选举

1 背景

1.1 什么是leader选举

在zookeeper集群中，每个节点都会投票，如果某个节点获得超过半数以上的节点的投票，则该节点就是leader节点了

1.2 zookeeper集群选举leader节点的目的又是什么

zookeeper集群，有好几个节点。每个节点都可以接收请求，处理请求。那么，如果这个时候分别有两个客户端向两个节点发起请求，请求的内容是修改同一个数据，就会出现问题，所以，需要leader节点进行管理分发

1.3 如何进行选举

zookeeper提供了三种选举机制

LeaderElection
AuthFastLeaderElection
FastLeaderElection

默认的算法是FastLeaderElection，所以本文主要分析它的选举机制

2 FastLeaderElection选举算法

2.1 简述

首先所有Server提议自己要成为leader，同时，通过异步的通信方式来收集其它节点的选票，同时在分析选票时又根据投票者的当前状态来作不同的处理，直到有一个server获取票数获取过半，选举结束。

2.2 几个原则

注：我表示当前节点

默认推荐自己
每当我接收到其它的被推举者，我都要回馈一个信息，表明我还是不是推举我自己。如果被推举者没我大，我就一直推举我自己当leader
一旦我不再推举我自己了（这时我发现别人推举的人比我编号大），我就把我的票箱清空，重新发起一轮投票（这时我的票箱一定有两票了）
一旦我发现收到的推举信息中投票轮要高于我的投票轮，我也要清空我的票箱。并且还是投当初我觉得我要推荐的那个人（除非当前的人比我最初的推荐编号大，我就顺带更新我的推荐）
不断的重复上面的过程，不断的告诉别人“我的投票是第几轮”、“我推举的人是谁”。直到我的票箱中“我推举的人”收到了大于 N /2的推举投票
这时我就可以决定我是flower还是leader了。并且不论随后收到谁的投票，都向它直接反馈“我的结果”

2.3 选举的流程图

状态变化：

2.5 结果

理想结果：

更现实的结果：

2.6 实现原理

2.6.1 名词定义

Serverid：在配置server时，给定的服务器的标示id。
Zxid:服务器在运行时产生的数据id，zxid越大，表示数据越新。
Epoch：选举的轮数。随着选举的轮数++
Server状态：LOOKING,FOLLOWING,LEADING

2.6.2 如何处理

每个Server都一个接收线程池和一个发送线程池, 在没有发起选举时，这两个线程池处于阻塞状态，直到有消息到来时才解除阻塞并处理消息，同时每个Serve r都有一个选举线程

主动发起选举端(选举线程)的处理

首先自己的 logicalclock加1，然后生成notification消息，并将消息放入发送队列中，系统中配置有几个Server就生成几条消息，保证每个Server都能收到此消息，如果当前Server 的状态是LOOKING就一直循环检查接收队列是否有消息，如果有消息，根据消息中对方的状态进行相应的处理

主动发送消息端(发送线程池)的处理

将要发送的消息由Notification消息转换成ToSend消息，然后发送对方，并等待对方的回复

被动接收消息端(接收线程池)的处理

将收到的消息转换成Notification消息放入接收队列中，如果对方Server的epoch小于logicalclock则向其发送一个消息(让其更新epoch)；如果对方Server处于Looking状态，自己则处于Following或Leading状态，则也发送一个消息(当前Leader已产生，让其尽快收敛)