keepAlived 安装及配置

1、安装

yum install keepalived –y

rpm -qa keepalived

2、启动keepalived服务并检查

/etc/init.d/keepalived start

ps -ef|grep keep|grep -v grep #提示：启动后有三个keepalive 进程表示安装正确

ip add|grep 192.168 #提示：默认情况会启动三个VIP地址

/etc/init.d/keepalived stop #关闭keepalive服务

3、配置文件说明

ls -l /etc/keepalived/keepalived.conf 和其他使用yum安装的软件一样，keepalived软件的配置文件默认路径及配置文件名为
这里高可用的功能的配置文件包含了两个重要区块，下面分别说明：

4、全局定义部分

全局定义（Global Definitions）部分这部分主要用来设置keepalived的故障通知机制和Router ID标识。示例配置如下：

head -13 /etc/keepalived/keepalived.conf|cat –n

1行注释，！开头和#开头一样，都是注释

3~8 行：定义服务故障报警的Email地址。作用是当服务发生切换或RS节点等有故障时，发报警邮件。这几行是可选配置，notification_email指定在keepalived发生事件时，需要发送的Email地址，可以有多个，每行一个

9行指定发送Email的发送人，即发件人的地址，也是可选的配置。

10行 smtp_server 指定发送邮件的smtp服务器，如果本机开启了sedmail或postfix，就可以使用上面默认配置实现邮件发送，也是可选配置

11行 smtp_connect_timeout 是连接smtp超时时间，也是可选配置

注：第4~11行所有和邮件报警相关的参数都可以不配置，在实际工作中会将监控的任务交给更加擅长监控报警的Nagios或Zabbix软件。

12行 keepalived服务器的路由标识（router_id）.在一个局域网内，这个标识应该是唯一的。大括号｛｝用来分隔区块，要成对出现。如查漏了半个大括号，keepalived不会报错，但是也不会得到想要的效果。另外由于区块间存在多层嵌套关系，所以很容易遗漏区块结尾外的大括号。

5、VRRP实例定义区块（VRRP instance(s)）部分

这部分主要用来定义具体服务的实例配置，包括keepalive主备状态，接口、优先级、认证方式和IP信息等。配置如下：

15行 表示定义一个vrrp_instance实例，名字是VI_1,每个vrrp_instance 实例可以认为是keepalived服务的一个实例或者作为一个业务服务，在keepalived服务配置中，这样的vrrp_instance实例可以多个。注意，存在于主节点中的vrrp_instance 实例在备节点中也要存在，这样才能实现故障切换接管。

16行 state MASTER 表示当前实例VI_1的角色状态，当前角色是MASTER，这个状态只能有MASTER 和 BACKUP 两种状态，并且需要大写这些字符。其中MASTER为正式工作的状态，BACKUP为备用工作状态。当MASTER所在的服务器故障或失效时，BACKUP 所在的服务器会接管故障的MASTER 继续提供服务。

17行 interface 为网络通信接口。为对外提供服务的网络接口，如eht0、eht1、。当前主流的服务器都有2~4 个网络接口，在选择服务接口时，要搞清楚了。

18行 virtual_router_id 为虚拟路由ID标识，这个标识最好是一个数字，并且要在一个keepalived.conf 配置中是唯一的，但是MASTER 和BACKUP 配置中相同实例的virtual_router_id 又必须一致，否则出现脑裂问题。

19行 priority 为优先级，其后面的数值也是一个数字，数字越大，表示实例优先级越高。在同一个vrrp_instance实例里，MASTER 的优先级配置要高于 BACKUP的。或主机的priority 值为150 ,那么备机的 prioriry必须要少于150，一般建议间隔50以上为佳。

20行 advert_int 为同步通知间隔。主机与备机之间通信检查的时间间隔，单位为秒默认为1

21~24行 authentication 为权限认证配置，包含认证类型（auth_type）和认证密码(auth_pass)。认证类型有PASS、AH、两种，官方推荐为PASS 。验证密码为明文方式，最好长度不要超过8个字符，建议用4位的数字，同一vrrp实例的主机和备机使用相同的密码才能正常通信。

25~29行 virtual_ipaddress 为虚拟IP地址。可以配置多个Ip地址，每个地址占一行，配置时最好明确指定子网掩码以及虚拟IP 绑定的网络接口。否则子网掩码默认是32为，绑定的接口和前面的insterface参数配置的一致。注意，这里的虚拟IP是在工作中需要和域名绑定的iP,即和配置的高可用服务监听的IP要保持一

以下内容转载自：https://www.cnblogs.com/along1226/p/5027838.html

6、配置文件详解

第一部分：全局定义块
　　1、email通知。作用：有故障，发邮件报警。
　　2、Lvs负载均衡器标识（lvs_id）。在一个网络内，它应该是唯一的。
　　3、花括号“{}”。用来分隔定义块，因此必须成对出现。如果写漏了，keepalived运行时，不会得到预期的结果。由于定义块内存在嵌套关系，因此很容易遗漏结尾处的花括号，这点要特别注意。

global_defs {
	notification_email {  #指定keepalived在发生切换时需要发送email到的对象，一行一个
       		sysadmin@fire.loc
	}
	notification_email_from Alexandre.Cassen@firewall.loc #指定发件人
	smtp_server localhost #指定smtp服务器地址
	smtp_connect_timeout 30 #指定smtp连接超时时间
	router_id LVS_DEVEL #运行keepalived机器的一个标识
}
vrrp_script chk_http_port {
    script "/data/script/nginx.sh"                  #监控服务脚步
    interval 2                    #检测时间间隔(执行脚步间隔)
    weight 2
}

第二部分：vrrp_sync_group作用：确定失败切换（FailOver）包含的路由实例个数。即在有2个负载均衡器的场景，一旦某个负载均衡器失效，需要自动切换到另外一个负载均衡器的实例是哪些？实例组group{}至少包含一个vrrp实例

vrrp_sync_group VG_1{ #监控多个网段的实例
	group {
		VI_1 #实例名
		VI_2
　　　		......
	}
	notify_master /path/xx.sh #指定当切换到master时，执行的脚本
	netify_backup /path/xx.sh #指定当切换到backup时，执行的脚本
	notify_fault "path/xx.sh VG_1" #故障时执行的脚本
	notify /path/xx.sh
	smtp_alert #使用global_defs中提供的邮件地址和smtp服务器发送邮件通知
}

第三部分：vrrp_instance，实例名出自实例组group所包含的那些名字。

vrrp_instance VI_1 {
	state BACKUP #指定那个为master，那个为backup，如果设置了nopreempt这个值不起作用，主备考priority决定
   	interface eth0 #设置实例绑定的网卡
    	dont_track_primary #忽略vrrp的interface错误（默认不设置）
    	track_interface{ #设置额外的监控，里面那个网卡出现问题都会切换
		eth0
		eth1
	}
   	mcast_src_ip #发送多播包的地址，如果不设置默认使用绑定网卡的primary ip
  	garp_master_delay #在切换到master状态后，延迟进行gratuitous ARP请求
  	virtual_router_id 50 #VPID标记
   	priority 99 #优先级，高优先级竞选为master
   	advert_int 1 #检查间隔，默认1秒
  	nopreempt #设置为不抢占 注：这个配置只能设置在backup主机上，而且这个主机优先级要比另外一台高
   	preempt_delay #抢占延时，默认5分钟
   	debug #debug级别
　　　　 track_interface {              #监控的网卡。如果只监控服务，这里可以不填
            eth1
        } 
       
  	authentication { #设置认证
		auth_type PASS #认证方式
        	auth_pass 111111 #认证密码
   	}
    	virtual_ipaddress { #设置vip
        	192.168.202.200
   	}

        track_script {                      #以脚本为监控chk_http_port是前面填写的
            chk_http_port#p#分页标题#e#
        }

        #检测脚本一定要写在vrrp_instance的前面也就是上面，而且花括号一定要有空格，追踪trace_script要定在vip的后面，多少人栽在了这上面好多小时
}

第四部分：虚拟服务器virtual_server定义块，虚拟服务器定义是keepalived框架最重要的项目了，是keepalived.conf必不可少的部分。该部分是用来管理LVS的，是实现keepalive和LVS相结合的模块。ipvsadm命令可以实现的管理在这里都可以通过参数配置实现，注意：real_server是被包含在viyual_server模块中的，是子模块。

virtual_server 192.168.202.200 23 {        #VIP地址，要和vrrp_instance模块中的virtual_ipaddress地址一致
	delay_loop 6 #健康检查时间间隔 
	lb_algo rr #lvs调度算法rr|wrr|lc|wlc|lblc|sh|dh 
	lb_kind DR #负载均衡转发规则NAT|DR|RUN 
	persistence_timeout 5 #会话保持时间 
 　	protocol TCP #使用的协议 
	persistence_granularity <NETMASK> #lvs会话保持粒度 
	virtualhost <string> #检查的web服务器的虚拟主机（host：头） 
	sorry_server<IPADDR> <port> #备用机，所有realserver失效后启用


	real_server 192.168.200.5 23 {             #RS的真实IP地址
		weight 1 #默认为1,0为失效
		inhibit_on_failure #在服务器健康检查失效时，将其设为0，而不是直接从ipvs中删除 
		notify_up <string> | <quoted-string> #在检测到server up后执行脚本
		notify_down <string> | <quoted-string> #在检测到server down后执行脚本   
	}
	TCP_CHECK {                    #常用
		connect_timeout 3 #连接超时时间
		nb_get_retry 3 #重连次数
		delay_before_retry 3 #重连间隔时间
		connect_port 23  #健康检查的端口的端口
		bindto <ip>
	}

	HTTP_GET | SSL_GET{          #不常用
		url{ #检查url，可以指定多个
			path /
			digest <string> #检查后的摘要信息
			status_code 200 #检查的返回状态码
        	}
		connect_port <port>
		bindto <IPADD>
		connect_timeout 5
		nb_get_retry 3
		delay_before_retry 2
	}

	SMTP_CHECK{                 #不常用
		host{
			connect_ip <IP ADDRESS>
			connect_port <port> #默认检查25端口
			bindto <IP ADDRESS>
		}
		connect_timeout 5
		retry 3
		delay_before_retry 2
		helo_name <string> | <quoted-string> #smtp helo请求命令参数，可选
	}

	MISC_CHECK{                 #不常用
		misc_path <string> | <quoted-string> #外部脚本路径
		misc_timeout #脚本执行超时时间
		misc_dynamic #如设置该项，则退出状态码会用来动态调整服务器的权重，返回0 正常，不修改；返回1，检查失败，权重改为0；返回2-255，正常，权重设置为：返回状态码-2
	}
}

线上配置文件

[root@LB2 ~]# cat /etc/keepalived/keepalived.conf 
! Configuration File for keepalived
global_defs {
	notification_email {
		49000448@qq.com
	}
	notification_email_from Alexandre.Cassen@firewall.loc
	smtp_server 10.0.0.1
	smtp_connect_timeout 30
	router_id LVS_2
}

vrrp_instance VI_1 {
	state BACKUP
	interface eth0
	virtual_router_id 55
	priority 100
	advert_int 1
	authentication {
		auth_type PASS
		auth_pass 1111
	}
	virtual_ipaddress {
		192.168.220.110/24
	}
}

virtual_server 192.168.220.110 80 {
	delay_loop 6
	lb_algo wrr
	lb_kind DR
	nat_mask 255.255.255.0
	persistence_timeout 300
	protocol TCP
}

real_server 192.168.220.129 80 {
	weight 1
	TCP_CHECK {
		connect_timeout 8
			nb_get_retry 3
			delay_before_retry 3
			connect_port 80
		}
	}
}

real_server 192.168.220.138 80 {
	weight 1
	TCP_CHECK {
		connect_timeout 8
		nb_get_retry 3
		delay_before_retry 3
		connect_port 80
	}
}

View Code

7、修改keepalive日志文件

默认keepalive的日志文件是 /var/log/messages
修改为：

[root@LB2 ~]# vim /etc/sysconfig/keepalived
......
#KEEPALIVED_OPTIONS="-D"          //注释掉行
KEEPALIVED_OPTIONS="-D -d -S 0"  //添加行
......

[root@LB2 ~]# vim /etc/rsyslog.conf
......
local0.*       /var/log/keepalived.log           //添加行
在约第42行信息末尾加入：;local0.none
变为：*.info;mail.none;authpriv.none;cron.none;local0.none                /var/log/messages
以上配置是表示来自local0设备的所有日志信息不再记录于/var/log/messages 里

[root@LB2 ~]# /etc/init.d/rsyslog restart            //重启日志服务
[root@LB2 ~]# /etc/init.d/keepalived restart         //重启keepalive服务