LVS 的工作模式和算法

LVS集群的工作模式

lvs-nat：修改请求报文的目标IP,多目标IP的DNAT
lvs-dr：操纵封装新的MAC地址
lvs-tun：在原请求IP报文之外新加一个IP首部
lvs-fullnat：修改请求报文的源和目标IP

1）vs-nat：本质是多目标IP的DNAT，通过将请求报文中的目标地址和目标端口修改为某挑出的RS的RIP和PORT实现转发

特点

（1）RIP和DIP应在同一个IP网络，且应使用私网地址；RS的网关要指向DIP

（2）请求报文和响应报文都必须经由Director转发，Director易于成为系统瓶颈

（3）支持端口映射，可修改请求报文的目标PORT

（4）VS必须是Linux系统，RS可以是任意OS系统

2）LVS-DR：Direct Routing，直接路由，LVS默认模式,应用最广泛,通过为请求报文重新封装一个MAC首部进行转发，源MAC是DIP所在的接口的MAC，目标MAC是某挑选出的RS的RIP所在接口的MAC地址；源IP/PORT，以及目标IP/PORT均保持不变

特点：

（1）Director和各RS都配置有VIP

（2）确保前端路由器将目标IP为VIP的请求报文发往Director

在前端网关做静态绑定VIP和Director的MAC地址
在RS上使用arptables工具

arptables -A IN -d $VIP -j DROP
arptables -A OUT -s $VIP -j mangle --mangle-ip-s $RIP

（3）在RS上修改内核参数以限制arp通告及应答级别

  /proc/sys/net/ipv4/conf/all/arp_ignore
  /proc/sys/net/ipv4/conf/all/arp_announce

（4）RS的RIP可以使用私网地址，也可以是公网地址；RIP与DIP在同一IP网络；RIP的网关不能指向DIP，以确保响应报文不会经由Director

（5）RS和Director要在同一个物理网络

（6）请求报文要经由Director，但响应报文不经由Director，而由RS直接发往Client

（7）不支持端口映射（端口不能修败）

（8）RS可使用大多数OS系统

3）TUN模式转发方式：不修改请求报文的IP首部（源IP为CIP，目标IP为VIP），而在原IP报文之外再封装一个IP首部（源IP是DIP，目标IP是RIP），将报文发往挑选出的目标RS；RS直接响应给客户端（源IP是VIP，目标IP是CIP）

特点

（1）DIP, VIP, RIP都应该是公网地址

（2）RS的网关一般不能指向DIP

（3）请求报文要经由Director，但响应不经由Director

（4）不支持端口映射

（5）RS的OS须支持隧道功能

4）fullnat模式通过同时修改请求报文的源IP地址和目标IP地址进行转发

CIP --> DIP
VIP --> RIP

特点：

（1）VIP是公网地址，RIP和DIP是私网地址，且通常不在同一IP网络；因此，RIP的网关一般不会指向DIP

（2）RS收到的请求报文源地址是DIP，因此，只需响应给DIP；但Director还要将其发往Client

（3）请求和响应报文都经由Director

（4）相对NAT模式，可以更好的实现LVS-RealServer间跨VLAN通讯

（5）支持端口映射

！！！！！注意：此类型kernel默认不支持！！！！！

LVS调试算法

ipvs scheduler：根据其调度时是否考虑各RS当前的负载状态

两种：静态方法和动态方法

1）静态算法：

（1）RR roundrobin，轮询

（2）WRR：Weighted RR，加权轮询

（3）SH： Source Hashing，实现session sticky，源IP地址hash；将来自于同一个IP地址的请求始终发往第一次挑中的RS，从而实现会话绑定

（4）DH： Destination Hashing；目标地址哈希，第一次轮询调度至RS，后续将发往同一个目标地址的请求始终转发至第一次挑中的RS，典型使用场景是正向代理缓存场景中的负载均衡，如：宽带运营商

2）动态算法：更公平的算法

主要根据每RS当前的负载状态及调度算法进行调度Overhead=value 较小的RS将被调度

（1）LC：least connections 适用于长连接应用公平占用内存大不考虑性能

Overhead=activeconns*256+inactiveconns

（2）WLC：Weighted LC，默认调度方法

Overhead=(activeconns*256+inactiveconns)/weight

（3）SED：Shortest Expection Delay,初始连接高权重优先

Overhead=(activeconns+1)*256/weight

（4）NQ：Never Queue，第一轮均匀分配，后续SED

（5）LBLC：Locality-Based LC，动态的DH算法，使用场景：根据负载状态实现正向代理

（6）LBLCR ：LBLC with Replication，带复制功能的LBLC，解决LBLC负载不均衡问题，从负载重的复制到负载轻的RS

还有两种算法是在内核4.15之后新增的（centos7没有 centos8有）

（7）FO（Weighted Fail Over）调度算法,在此FO算法中，遍历虚拟服务所关联的真实服务器链表，找到还未过载（未设置IP_VS_DEST_F_OVERLOAD标志）的且权重最高的真实服务器，进行调度

（8）OVF（Overflow-connection）调度算法

，基于真实服务器的活动连接数量和权重值实现。将新连接调度到权重值最高的真实服务器，直到其活动连接数量超过权重值位置，之后调度到下一个权重值最高的真实服务器,在此OVF算法中，遍历虚拟服务相关联的真实服务器链表，找到权重值最高的可用真实服务器。一个可用的真实服务器需要同时满足以下条件：

未过载（未设置IP_VS_DEST_F_OVERLOAD标志）
真实服务器当前的活动连接数量小于其权重值
其权重值不为零