LVS 的工作模式和算法

LVS集群的工作模式

  • lvs-nat:修改请求报文的目标IP,多目标IP的DNAT

  • lvs-dr:操纵封装新的MAC地址

  • lvs-tun:在原请求IP报文之外新加一个IP首部

  • lvs-fullnat:修改请求报文的源和目标IP

1)vs-nat:本质是多目标IP的DNAT,通过将请求报文中的目标地址和目标端口修改为某挑出的RS的RIP和PORT实现转发

特点

(1)RIP和DIP应在同一个IP网络,且应使用私网地址;RS的网关要指向DIP

2)请求报文和响应报文都必须经由Director转发,Director易于成为系统瓶颈

(3)支持端口映射,可修改请求报文的目标PORT

(4)VS必须是Linux系统,RS可以是任意OS系统

2)LVS-DR:Direct Routing,直接路由,LVS默认模式,应用最广泛,通过为请求报文重新封装一个MAC首部进行转发,源MAC是DIP所在的接口的MAC,目标MAC是某挑选出的RS的RIP所在接口的MAC地址;源IP/PORT,以及目标IP/PORT均保持不变

特点:

(1)Director和各RS都配置有VIP

(2)确保前端路由器将目标IP为VIP的请求报文发往Director

  • 在前端网关做静态绑定VIP和Director的MAC地址

  • 在RS上使用arptables工具

arptables -A IN -d $VIP -j DROP
arptables -A OUT -s $VIP -j mangle --mangle-ip-s $RIP

(3)在RS上修改内核参数以限制arp通告及应答级别

  /proc/sys/net/ipv4/conf/all/arp_ignore
  /proc/sys/net/ipv4/conf/all/arp_announce

(4)RS的RIP可以使用私网地址,也可以是公网地址;RIP与DIP在同一IP网络;RIP的网关不能指向DIP,以确保响应报文不会经由Director

(5)RS和Director要在同一个物理网络

(6)请求报文要经由Director,但响应报文不经由Director,而由RS直接发往Client

(7)不支持端口映射(端口不能修败)

(8)RS可使用大多数OS系统

3)TUN模式   转发方式:不修改请求报文的IP首部(源IP为CIP,目标IP为VIP),而在原IP报文之外再封装一个IP首部(源IP是DIP,目标IP是RIP),将报文发往挑选出的目标RS;RS直接响应给客户端(源IP是VIP,目标IP是CIP)

特点

(1)DIP, VIP, RIP都应该是公网地址

(2)RS的网关一般不能指向DIP

(3)请求报文要经由Director,但响应不经由Director

(4)不支持端口映射

(5)RS的OS须支持隧道功能

4)fullnat模式  通过同时修改请求报文的源IP地址和目标IP地址进行转发

  • CIP --> DIP

  • VIP --> RIP

特点:

(1)VIP是公网地址,RIP和DIP是私网地址,且通常不在同一IP网络;因此,RIP的网关一般不会指向DIP

(2)RS收到的请求报文源地址是DIP,因此,只需响应给DIP;但Director还要将其发往Client

(3)请求和响应报文都经由Director

(4)相对NAT模式,可以更好的实现LVS-RealServer间跨VLAN通讯

(5)支持端口映射

!!!!!注意:此类型kernel默认不支持!!!!!

LVS调试算法

ipvs scheduler:根据其调度时是否考虑各RS当前的负载状态
两种:静态方法和动态方法

1)静态算法:

(1)RR  roundrobin,轮询

(2)WRR:Weighted RR,加权轮询

(3)SH: Source Hashing,实现session sticky,源IP地址hash;将来自于同一个IP地址的请求始终发往第一次挑中的RS,从而实现会话绑定

(4)DH: Destination Hashing;目标地址哈希,第一次轮询调度至RS,后续将发往同一个目标地址的请求始终转发至第一次挑中的RS,典型使用场景是正向代理缓存场景中的负载均衡,如:宽带运营商

2)动态算法:更公平的算法

主要根据每RS当前的负载状态及调度算法进行调度Overhead=value 较小的RS将被调度

(1)LC:least connections 适用于长连接应用 公平 占用内存大 不考虑性能

Overhead=activeconns*256+inactiveconns

(2)WLC:Weighted LC,默认调度方法

Overhead=(activeconns*256+inactiveconns)/weight

(3)SED:Shortest Expection Delay,初始连接高 权重优先

Overhead=(activeconns+1)*256/weight

(4)NQ:Never Queue,第一轮均匀分配,后续SED

(5)LBLC:Locality-Based LC,动态的DH算法,使用场景:根据负载状态实现正向代理

(6)LBLCR :LBLC with Replication,带复制功能的LBLC,解决LBLC负载不均衡问题,从负载重的复制 到负载轻的RS

 还有两种算法是在内核4.15之后新增的   (centos7没有    centos8有)

(7)FO(Weighted Fail Over)调度算法,在此FO算法中,遍历虚拟服务所关联的真实服务器链表,找到还未过载(未设置IP_VS_DEST_F_OVERLOAD标志)的且权重最高的真实服务器,进行调度

(8)OVF(Overflow-connection)调度算法

,基于真实服务器的活动连接数量和权重值实现。将新连接调度到权重值最高的真实服务器,直到其活动连接数量超过权重值位置,之后调度到下一个权重值最高的真实服务器,在此OVF算法中,遍历虚拟服务相关联的真实服务器链表,找到权重值最高的可用真实服务器。一个可用的真实服务器需要同时满足以下条件:

  • 未过载(未设置IP_VS_DEST_F_OVERLOAD标志)

  • 真实服务器当前的活动连接数量小于其权重值

  • 其权重值不为零

原文地址:https://www.cnblogs.com/zhangty333/p/13933835.html