【Linux】虚拟服务器之LVS

写在前面

觉得甚是幸运，能够有机会参与到ITOO配置环境的工作中去。现在正在熟悉，在搭建环境的时候，有LVS安装配置教程，对这一块有些懵逼，这几天查了一些资料，写在这里，和大家分享一下

是什么

LVS是 Linux Virtual Server 的简称，也就是Linux虚拟服务器。这是一个由章文嵩博士发起的一个开源项目，它的官方网址是http://www.linuxvirtualserver.org
现在 LVS 已经是 Linux 内核标准的一部分。使用 LVS 可以达到的技术目标是：通过 LVS 达到的负载均衡技术和 Linux 操作系统实现一个高性能高可用的 Linux 服务器集群，它具有良好的可靠性、可扩展性和可操作性。从而以低廉的成本实现最优的性能。LVS 是一个实现负载均衡集群的开源软件项目。LVS架构从逻辑上可分为调度层、Server集群层和共享存储。
LVS 集群分为三层结构:
负载调度器(load balancer)：它是整个LVS 集群对外的前端机器，负责将client请求发送到一组服务器上执行，而client端认为是返回来一个同一个IP【通常把这个IP 称为虚拟IP/VIP】
服务器池(server pool)：一组真正执行client 请求的服务器，一般是我们的web服务器；除了web，还有FTP，MAIL，DNS
共享存储(shared stored)：它为 server pool 提供了一个共享的存储区，很容易让服务器池拥有相同的内容，提供相同的服务（这一点不是很理解）

相关术语

1.DS:Director Server。指的是前端负载均衡器节点
2.RS：Real Server。后端真实的工作服务器
3.VIP：向外部直接面向用户请求，作为用户请求的目标的ip地址
4.DIP：Director Server IP，主要用于和内部主机通讯的IP地址
5.RIP：Real Server IP，后端服务器的IP地址
6.CIP：Client IP，访问客户端的IP地址

三种模式

1.直接路由模式DR (Direct Routing)模式

DR模式网络结构：
这里写图片描述
原理：负载均衡器和RS都使用同一个IP对外服务｡但只有DR对ARP请求进行响应，所有RS对本身这个IP的ARP请求保持静默。也就是说，网关会把对这个服务IP的请求全部定向给DR，而DR收到数据包后根据调度算法，找出对应的RS，把目的MAC地址改为RS的MAC（因为IP一致）并将请求分发给这台RS。这时RS收到这个数据包,处理完成之后，由于IP一致，可以直接将数据返给客户，则等于直接从客户端收到这个数据包无异，处理后直接返回给客户端。由于负载均衡器要对二层包头进行改换,所以负载均衡器和RS之间必须在一个广播域，也可以简单的理解为在同一台交换机上。

优点：负载均衡器只是分发请求，应答包通过单独的路由方法返回给客户端。

缺点：要求负载均衡器的网卡必须与物理网卡在一个物理段上。

2.NAT模式（NAT）

NAT模式的网络架构：
这里写图片描述
原理：就是把客户端发来的数据包的IP头的目的地址，在负载均衡器上换成其中一台RS的IP地址，并发至此RS来处理，RS处理完成后把数据交给经过负载均衡器，负载均衡器再把数据包的原IP地址改为自己的IP，将目的地址改为客户端IP地址即可。期间，无论是进来的流量,还是出去的流量，都必须经过负载均衡器。

优点：集群中的物理服务器可以使用任何支持TCP/IP操作系统。

缺点：扩展性差。当服务器节点（普通PC服务器）增长过多时，负载均衡器将成为整个系统的瓶颈，因为所有的请求包和应答包的流向都经过负载均衡器。当服务器节点过多时，大量的数据包都交汇在负载均衡器处，导致负载均衡器变慢以至于整个链路变慢。

3.IP隧道模式（TUN）

TUN模式网络架构：
这里写图片描述
原理：隧道模式就是，把客户端发来的数据包，封装一个新的IP头标记(仅目的IP)发给RS，RS收到后，先把数据包的头解开，还原数据包，处理后直接返回给客户端，不需要再经过负载均衡器。注意，由于RS需要对负载均衡器发过来的数据包进行还原，所以说必须支持IPTUNNEL协议。因此，在RS的内核中，必须编译支持IPTUNNEL这个选项。

优点：负载均衡器只负责将请求包分发给后端节点服务器，而RS将应答包直接发给用户，减少了负载均衡器的大量数据流动，负载均衡器不再是系统的瓶颈，就能处理很巨大的请求量，这种方式，一台负载均衡器能够为很多RS进行分发。而且跑在公网上就能进行不同地域的分发。

缺点：隧道模式的RS节点需要合法IP，这种方式需要所有的服务器支持“IP Tunneling”(IP Encapsulation)协议，服务器可能只局限在部分Linux系统上。

相关调度算法

1.LVS负载均衡的调度算法一（静态）

轮循调度（RR, Round Robin）
调度器通过“轮循”调度算法将外部请求按顺序轮流分配到集群中的真实机器上，它均等的对待每一台服务器，而不管服务器实际的连接数和系统负载。

加权轮循（WRR, Weighted Round Robin）
调度器通过“加权轮循”调度算法根据真实服务器的不同处理能力来调度访问请求。这样可以保证处理能力强的服务器能处理更多的访问流量。调度器可以自动问询真实服务器的负载情况，并动态的调整其权值。

目标地址散列（DH, Destination Hashing）
“目标地址散列”调度算法根据请求的目标IP地址，作为散列键（Hash Key）从静态分配的散列列表找出对应的服务器，若该服务器是可用的且未超载，将请求发送到该服务器，否则返回空。

源地址散列（SH, Source Hashing）
“源地址散列”调度算法根据请求的源IP地址，作为散列键（Hash Key）从静态分配的散列表找到对应的服务器，若该服务器是可用的且未超载，将请求发送到该服务器，否则返回空。

2.LVS负载均衡的调度算法二（动态）

最少链接（LC, Least Connections）
调度器通过“最少链接”调度算法动态的将网络请求调度到已建立的链接数最少的服务器上。如果集群系统的真实服务器具有相近的系统性能，采用“最少连接”调度算法可以较好的均衡负载。
OL(Over Load)=active * 256 + deactive

加权最少链接（WLC, Weighted Least Connections）
在集群系统中的服务器性能差异较大的情况下，调度器采用“加权最少连接”调度算法优化负载均衡性能，具有较高权值的服务器将承受较大比例的活动连接负载。调度器可以自动问询真实服务器的负载情况，并动态的调整其权值。
OL(Over Load)=(active * 256 + deactive) / weighted

最短的期望延迟（SED, Shortest Expected Delay Scheduling）

最少队列调度（NQ, Never Queue Scheduling）
无需排队。如果有台Real Server的连接数等于0就直接分配过去，不需要再进行SED运算。

基于局部性的最少链接（LBLC, Locality-Based Least Connections）
“基于局部性的最少连接”调度算法是针对目标IP地址的负载均衡，目前主要用于Cache集群系统。该算法根据请求的目标IP地址找出该目标IP最近使用的服务器，若该服务器是可用的且没有超载，将请求发送到该服务器；若服务器不存在，或者该服务器超载且有服务器处于一半的工作负载，则用“最少连接”的原则选出一个可用的服务器，将请求发送到该服务器。

带复制的基于局部性最少链接（LBLCR, Locality-Based Least Connections with Repilcation）
“带复制的基于局部性最少连接”调度算法也是针对目标IP地址的负载均衡，目前主要用于Cache集群系统。它与LBLC算法的不同之处是它要维护从一个目标IP地址到一组服务器的映射，而LBLC算法维护从一个目标IP地址到一台服务器的映射。该算法根据请求的目标IP地址找出该目标IP地址对应的服务器组，按“最少连接”原则从服务器组中选出一台服务器，若服务器没有超载，将请求发到该服务器；若服务器超载，则按“最少连接”原则从这个集群中选出一台服务器，将该服务器加入到服务器组中，将请求发送到该服务器。同时，当该服务器组有一段时间没有被修改，将最忙的服务器从服务器组中删除，以降低复制的程度。

上面频繁的提到了负载均衡，那么什么是负载均衡呢？负载均衡建立在现有网络结构之上，它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。
负载均衡，英文名称为Load Balance，其意思就是分摊到多个操作单元上进行执行，例如Web服务器、FTP服务器、企业关键应用服务器和其它关键任务服务器等，从而共同完成工作任务。具体请移步：负载均衡—百度百科

写在最后

以上就是我查的一些关于LVS的一些资料，看不懂吧？看不懂就对了，因为我也看不懂，哈哈哈哈
越学越觉得自己的知识不够，越觉得自己了解的少，越想深入学下去，所以啊，时间珍贵，别浪费~
关于如何配置Keepalived+LVS-DR+Nginx高可用故障切换模式，可参考这篇文章：Keepalived+LVS-DR+Nginx高可用故障切换模式
感谢您的阅读~