Etcd分布式存储系统

介绍

　　etcd是一款高性能的开源的分布式key-value分布式存储系统，可以用于配置共享和服务的注册与发现等功能。类似于zookeeper和consul。

　　etcd 诞生于 CoreOS 公司，它最初是用于解决集群管理系统中 OS 升级的分布式并发控制以及配置文件的存储与分发等问题。正如etcd官网所说，etcd 被设计为提供高可用、强一致，可靠的的 key-value 分布式数据存储服务。

　　etcd的官网：https://etcd.io/

　　etcd的github地址：https://github.com/etcd-io/etcd

使用etcd的项目

　　1.CoreOS。

　 2.Kubernetes。

　　3.CloudFoundry。

etcd应用场景

　　1.服务注册与发现（Service Discovery）。

　　　　服务注册发现一般用于微服务中，就是解决在同一个分布式集群中的进程或者一个服务，如何自动确定系统中有哪些服务，如何取找到目标服务或者进程并建立连接。涉及到一个服务有哪些实例，这些服务的地址等信息等是个问题，服务注册与发现就是用于解决该问题。新添加的服务通过注册后可以让服务请求方可以发现。

　　　　服务发现的几个关键问题：

　　　　　　1）服务注册中心不仅仅是记录当前有多少个服务提供者，同时服务注册中心还监控每个服务提供者的状态，他们之前有心跳机制，如果其中有一台服务提供者连不上就会让其下线，保证服务请求者连接的服务都是可用的。

　 2.配置中心。

　　　　将一些配置信息放在etcd上进行集中管理。这类场景的使用方式一般是应用在启动的时候主动从etcd获取一次配置信息，同时在etcd节点上注册一个Watcher并等待，以后每次配置有更新的时候，etcd都会实时通知订阅者，以达到获取最新配置信息的目的。

　　2.分布式锁。

　　　　因为 etcd使用 Raft算法保持了数据的强一致性，某次操作存储到集群中的值就必然是全局一致的，所以 etcd很容易实现分布式锁。

　　　　锁服务包含两种使用方式，一是保持独占，二是控制时序。

　　　　　1）保持独占

　　　　　　保持独占即所有试图获取锁的用户最终只有一个可以得到。

　　　　　　　　　　　etcd 为此提供了一套实现分布式锁原子操作 CAS ( ComparaAndSwap)的 API。通过设置 prevExist 值，可以保证在多个节点上同时创建某个目录时，只有一个节点能够成功，而成功的那个即可获得分布式锁。

.　　　　　　　　2）控制时序

　　　　　　试图获取锁的所有用户都会进入等待队列，获得锁的顺序是全局唯一的，同时还能决定队列的执行顺序。

　　　　　　etcd 为此也提供了一套 API (自动创建有序键)，它会将一个目录的键值指定为 POST 动作，这样， etcd 就会在目录下生成一个当前最大的值作为键，并存储这个新的值(客户端编号) 。

　　3.负载均衡。

　　4.分布式通知与协调。

　　5.消息发布和订阅。。

　　6.分布式队列。　　

etcd的特点

　　1.完全复制：集群中的每个节点都可以使用完整的存档。

　　 2.高可用性：Etcd可用于避免硬件的淡点故障或网络分区问题。当集群中主节点挂了，会选举新的leader主节点。

　　 3.一致性：根据CAP理论，基于Raft算法的Etcd满足CAP中的CP，每次读取都会返回跨多主机的最新写入。

　　 4.简单：相对于其他同类产品适用简单，包括一个定义良好的，面向用户的API（gRPC）。

　　 5.安全：支持客户端SSL安全认证，实现了可选的客户端证书身份验证的自动化TLS。

　　 6.快速：每秒10000次写入的基准速度。

　　 7.可靠：使用Raft分布式算法实现了强一致性，高可用性的服务存储目录。

etcd的架构及内部机制

总体架构

　　　　etcd的架构主要分四个部分

　　　　　　1.HTTP Server：用于处理用户发送的API请求以及其他etcd节点的同步与心跳信息的请求。

　　　　　　2.Store：用于处理etcd支持的各类功能的事务，包括数据索引，节点状态的变更，监控与反馈，事件处理与执行等，是etcd对用户提供的大多数API功能的具体实现。

　　　　　　3.Raft：Raft分布式强一致性算法的具体实现，是etcd的核心。

　　　　　　4.WAL：Write Ahead Log（预写式日志），是etcd的数据存储方式，这种技术在mysql中也有用到。除了在内存中存有所有数据的状态及节点的索引以外，etcd就通过WAL进行持久化存储。WAL中所有数据提交前都会实现记录日志。Snapshot是为了防止数据过多而进行的状态快照，Entry表示存储的具体日志内容。

内部机制

　　一个 etcd 集群，通常会由 3 个或者 5 个节点组成，多个节点之间通过 Raft 一致性算法的完成分布式一致性协同，算法会选举出一个主节点作为 leader，由 leader 负责数据的同步与数据的分发。当 leader 出现故障后系统会自动地选取另一个节点成为 leader，并重新完成数据的同步。客户端在多个节点中，仅需要选择其中的任意一个就可以完成数据的读写，内部的状态及数据协同由 etcd 自身完成。

　　在 etcd 整个架构中，有一个非常关键的概念叫做 quorum，quorum 的定义是（n+1）/2，也就是说超过集群中半数节点组成的一个团体，在 3 个节点的集群中，etcd 可以容许 1 个节点故障，也就是只要有任何 2 个节点可用，etcd 就可以继续提供服务。同理，在 5 个节点的集群中，只要有任何 3 个节点可用，etcd 就可以继续提供服务，这也是 etcd 集群高可用的关键。

　　在允许部分节点故障之后继续提供服务，就需要解决一个非常复杂的问题：分布式一致性。在 etcd 中，该分布式一致性算法由 Raft 一致性算法完成，这个算法本身是比较复杂的有机会再详细展开，这里仅做一个简单的介绍以方便大家对其有一个基本的认知。Raft 一致性算法能够工作的一个关键点是：任意两个 quorum 的成员之间一定会有一个交集（公共成员），也就是说只要有任意一个 quorum 存活，其中一定存在某一个节点（公共成员），它包含着集群中所有的被确认提交的数据。正是基于这一原理，Raft 一致性算法设计了一套数据同步机制，在 Leader 任期切换后能够重新同步上一个 quorum 被提交的所有数据，从而保证整个集群状态向前推进的过程中保持数据的一致。

etcd安装

　　etcd下载地址：https://github.com/etcd-io/etcd/releases 在这里选择一个版本。

　我的环境是Mac系统使用brew安装即可。

安装完毕后查看etcd版本

etcd使用

　　1. 启动etcd服务：执行etcd命令即可启动服务。

songguojundeMBP:~ songguojun$ etcd
[WARNING] Deprecated '--logger=capnslog' flag is set; use '--logger=zap' flag instead
2020-05-09 19:10:42.606712 I | etcdmain: etcd Version: 3.4.4
2020-05-09 19:10:42.606862 I | etcdmain: Git SHA: Not provided (use ./build instead of go build)
2020-05-09 19:10:42.606872 I | etcdmain: Go Version: go1.13.8
2020-05-09 19:10:42.606877 I | etcdmain: Go OS/Arch: darwin/amd64
2020-05-09 19:10:42.606882 I | etcdmain: setting maximum number of CPUs to 4, total number of available CPUs is 4
2020-05-09 19:10:42.606891 N | etcdmain: failed to detect default host (default host not supported on darwin_amd64)
2020-05-09 19:10:42.606897 W | etcdmain: no data-dir provided, using default data-dir ./default.etcd
2020-05-09 19:10:42.607019 N | etcdmain: the server is already initialized as member before, starting as etcd member...
[WARNING] Deprecated '--logger=capnslog' flag is set; use '--logger=zap' flag instead

　　　可以通过命令查看启动状态

songguojundeMBP:~ songguojun$ lsof -i:2380
COMMAND  PID       USER   FD   TYPE             DEVICE SIZE/OFF NODE NAME
firefox  471 songguojun   84u  IPv4 0xa91ef03152373cdb      0t0  TCP localhost:62070->localhost:2380 (ESTABLISHED)   
etcd    1428 songguojun    7u  IPv4 0xa91ef0314fb65973      0t0  TCP localhost:2380 (LISTEN)

　　也可以使用brew管理命令启动：brew services run etcd

　　使用brew services list查看状态。

songguojundeMBP:~ songguojun$ brew services list
Name       Status  User       Plist
consul     stopped            
etcd       started songguojun /usr/local/opt/etcd/homebrew.mxcl.etcd.plist   已经启动了
mysql@5.7  stopped            
nginx      stopped            
openresty  stopped            
rabbitmq   stopped            
supervisor stopped

　　etcd默认在2379端口监听客户端通信，默认在2380端口监听节点之间的通信。

etcd集群

　　etcd作为一个高可用分布式键值存储系统，本身就是为集群而设计的。Raft算法在决策的时候需要多数节点的投票，所以etcd部署集群的节点一般推荐奇数个。

参考资料

　　https://www.kubernetes.org.cn/6226.html