keepAlived 安装及配置

1、安装

  1. yum install keepalived –y
  2. rpm -qa keepalived

2、启动keepalived服务并检查

    1. /etc/init.d/keepalived start
    2. ps -ef|grep keep|grep -v grep   #提示:启动后有三个keepalive 进程表示安装正确
    3. ip add|grep 192.168  #提示:默认情况会启动三个VIP地址

clipboard

  • /etc/init.d/keepalived stop #关闭keepalive服务

3、配置文件说明

  1. ls -l /etc/keepalived/keepalived.conf     和其他使用yum安装的软件一样,keepalived软件的配置文件默认路径及配置文件名为
  2. 这里高可用的功能的配置文件包含了两个重要区块,下面分别说明:

4、全局定义部分

全局定义(Global Definitions)部分  这部分主要用来设置keepalived的故障通知机制和Router ID标识。示例配置如下:

head -13 /etc/keepalived/keepalived.conf|cat –n

image

    1. 1行 注释,!开头和#开头一样,都是注释
    2. 3~8 行:定义服务故障报警的Email地址。作用是当服务发生切换或RS节点等有故障时,发报警邮件。这几行是可选配置,notification_email指定在keepalived发生事件时,需要发送的Email地址,可以有多个,每行一个
    3. 9行 指定发送Email的发送人,即发件人的地址,也是可选 的配置。
    4. 10行 smtp_server 指定发送邮件的smtp服务器,如果本机开启了sedmail或postfix,就可以使用上面默认配置实现邮件发送,也是可选 配置
    5. 11行  smtp_connect_timeout 是连接smtp超时时间,也是可选配置

注:第4~11行所有和邮件报警相关的参数都可以不配置,在实际工作中会将监控的任务交给更加擅长监控报警的Nagios或Zabbix软件。

  • 12行 keepalived服务器的路由标识(router_id).在一个局域网内,这个标识应该是唯一 的。大括号 {} 用来分隔区块,要成对出现 。如查漏了半个大括号,keepalived不会报错,但是也不会得到想要的效果。另外由于区块间存在多层嵌套关系,所以很容易遗漏区块结尾外的大括号。

5、VRRP实例定义区块(VRRP instance(s))部分

这部分主要用来定义具体服务的实例配置,包括keepalive主备状态,接口、优先级、认证方式和IP信息等。配置如下:

clipboardimage

  1. 15行  表示定义一个vrrp_instance实例,名字是VI_1,每个vrrp_instance 实例可以认为是keepalived服务的一个实例或者作为一个业务服务,在keepalived服务配置中,这样的vrrp_instance实例可以多个。注意,存在于主节点中的vrrp_instance 实例在备节点中也要存在,这样才能实现故障切换接管。
  2. 16行  state MASTER 表示当前实例VI_1的角色状态,当前角色是MASTER,这个状态只能有MASTER 和 BACKUP 两种状态,并且需要大写这些字符。其中MASTER为正式工作的状态,BACKUP为备用工作状态。当MASTER所在的服务器故障或失效时,BACKUP 所在的服务器会接管故障的MASTER 继续提供服务。
  3. 17行  interface 为网络通信接口。为对外提供服务的网络接口,如eht0、eht1、。当前主流的服务器都有2~4 个网络接口,在选择服务接口时,要搞清楚了。
  4. 18行  virtual_router_id 为虚拟路由ID标识,这个标识最好是一个数字,并且要在一个keepalived.conf 配置中是唯一 的,但是MASTER 和BACKUP 配置中相同实例的virtual_router_id 又必须一致,否则出现脑裂问题。
  5. 19行  priority 为优先级,其后面的数值也是一个数字,数字越大,表示实例优先级越高。在同一个vrrp_instance实例里,MASTER 的优先级配置要高于 BACKUP的。或主机的priority 值为150 ,那么备机的 prioriry必须要少于150,一般建议间隔50以上为佳。
  6. 20行  advert_int 为同步通知间隔。主机与备机之间通信检查的时间间隔,单位为秒默认为1
  7. 21~24行  authentication 为权限认证配置,包含认证类型(auth_type)和认证密码(auth_pass)。认证类型有PASS、AH、两种,官方推荐为PASS 。验证密码为明文方式,最好长度不要超过8个字符,建议用4位的数字,同一vrrp实例的主机和备机使用相同的密码才能正常通信。
  8. 25~29行  virtual_ipaddress 为虚拟IP地址。可以配置多个Ip地址,每个地址占一行,配置时最好明确指定子网掩码以及虚拟IP 绑定的网络接口。否则子网掩码默认是32为,绑定的接口和前面的insterface参数配置的一致。注意,这里的虚拟IP是在工作中需要和域名绑定的iP,即和配置的高可用服务监听的IP要保持一

以下内容转载自:https://www.cnblogs.com/along1226/p/5027838.html

6、配置文件详解

第一部分:全局定义块
  1、email通知。作用:有故障,发邮件报警。 
  2、Lvs负载均衡器标识(lvs_id)。在一个网络内,它应该是唯一的。 
  3、花括号“{}”。用来分隔定义块,因此必须成对出现。如果写漏了,keepalived运行时,不会得到预期的结果。由于定义块内存在嵌套关系,因此很容易遗漏结尾处的花括号,这点要特别注意。

global_defs {
	notification_email {  #指定keepalived在发生切换时需要发送email到的对象,一行一个
       		sysadmin@fire.loc
	}
	notification_email_from Alexandre.Cassen@firewall.loc #指定发件人
	smtp_server localhost #指定smtp服务器地址
	smtp_connect_timeout 30 #指定smtp连接超时时间
	router_id LVS_DEVEL #运行keepalived机器的一个标识
}
vrrp_script chk_http_port {
    script "/data/script/nginx.sh"                  #监控服务脚步
    interval 2                    #检测时间间隔(执行脚步间隔)
    weight 2
}


第二部分:vrrp_sync_group作用:确定失败切换(FailOver)包含的路由实例个数。即在有2个负载均衡器的场景,一旦某个负载均衡器失效,需要自动切换到另外一个负载均衡器的实例是哪些? 实例组group{}至少包含一个vrrp实例

vrrp_sync_group VG_1{ #监控多个网段的实例
	group {
		VI_1 #实例名
		VI_2
   		......
	}
	notify_master /path/xx.sh #指定当切换到master时,执行的脚本
	netify_backup /path/xx.sh #指定当切换到backup时,执行的脚本
	notify_fault "path/xx.sh VG_1" #故障时执行的脚本
	notify /path/xx.sh
	smtp_alert #使用global_defs中提供的邮件地址和smtp服务器发送邮件通知
}


第三部分:vrrp_instance,实例名出自实例组group所包含的那些名字。 

vrrp_instance VI_1 {
	state BACKUP #指定那个为master,那个为backup,如果设置了nopreempt这个值不起作用,主备考priority决定
   	interface eth0 #设置实例绑定的网卡
    	dont_track_primary #忽略vrrp的interface错误(默认不设置)
    	track_interface{ #设置额外的监控,里面那个网卡出现问题都会切换
		eth0
		eth1
	}
   	mcast_src_ip #发送多播包的地址,如果不设置默认使用绑定网卡的primary ip
  	garp_master_delay #在切换到master状态后,延迟进行gratuitous ARP请求
  	virtual_router_id 50 #VPID标记
   	priority 99 #优先级,高优先级竞选为master
   	advert_int 1 #检查间隔,默认1秒
  	nopreempt #设置为不抢占 注:这个配置只能设置在backup主机上,而且这个主机优先级要比另外一台高
   	preempt_delay #抢占延时,默认5分钟
   	debug #debug级别
     track_interface {              #监控的网卡。如果只监控服务,这里可以不填
      eth1
    } 
   
authentication { #设置认证 auth_type PASS #认证方式 auth_pass 111111 #认证密码 } virtual_ipaddress { #设置vip 192.168.202.200 }
        track_script {                      #以脚本为监控chk_http_port是前面填写的
        chk_http_port#p#分页标题#e#
    }
        #检测脚本一定要写在vrrp_instance的前面也就是上面,而且花括号一定要有空格,追踪trace_script要定在vip的后面,多少人栽在了这上面好多小时
}

第四部分: 虚拟服务器virtual_server定义块 ,虚拟服务器定义是keepalived框架最重要的项目了,是keepalived.conf必不可少的部分。 该部分是用来管理LVS的,是实现keepalive和LVS相结合的模块。ipvsadm命令可以实现的管理在这里都可以通过参数配置实现,注意:real_server是被包含在viyual_server模块中的,是子模块。

virtual_server 192.168.202.200 23 {        #VIP地址,要和vrrp_instance模块中的virtual_ipaddress地址一致
	delay_loop 6 #健康检查时间间隔 
	lb_algo rr #lvs调度算法rr|wrr|lc|wlc|lblc|sh|dh 
	lb_kind DR #负载均衡转发规则NAT|DR|RUN 
	persistence_timeout 5 #会话保持时间 
  	protocol TCP #使用的协议 
	persistence_granularity <NETMASK> #lvs会话保持粒度 
	virtualhost <string> #检查的web服务器的虚拟主机(host:头) 
	sorry_server<IPADDR> <port> #备用机,所有realserver失效后启用


	real_server 192.168.200.5 23 {             #RS的真实IP地址
		weight 1 #默认为1,0为失效
		inhibit_on_failure #在服务器健康检查失效时,将其设为0,而不是直接从ipvs中删除 
		notify_up <string> | <quoted-string> #在检测到server up后执行脚本
		notify_down <string> | <quoted-string> #在检测到server down后执行脚本   
	}
	TCP_CHECK {                    #常用
		connect_timeout 3 #连接超时时间
		nb_get_retry 3 #重连次数
		delay_before_retry 3 #重连间隔时间
		connect_port 23  #健康检查的端口的端口
		bindto <ip>
	}

	HTTP_GET | SSL_GET{          #不常用
		url{ #检查url,可以指定多个
			path /
			digest <string> #检查后的摘要信息
			status_code 200 #检查的返回状态码
        	}
		connect_port <port>
		bindto <IPADD>
		connect_timeout 5
		nb_get_retry 3
		delay_before_retry 2
	}

	SMTP_CHECK{                 #不常用
		host{
			connect_ip <IP ADDRESS>
			connect_port <port> #默认检查25端口
			bindto <IP ADDRESS>
		}
		connect_timeout 5
		retry 3
		delay_before_retry 2
		helo_name <string> | <quoted-string> #smtp helo请求命令参数,可选
	}

	MISC_CHECK{                 #不常用
		misc_path <string> | <quoted-string> #外部脚本路径
		misc_timeout #脚本执行超时时间
		misc_dynamic #如设置该项,则退出状态码会用来动态调整服务器的权重,返回0 正常,不修改;返回1,检查失败,权重改为0;返回2-255,正常,权重设置为:返回状态码-2
	}
} 

线上配置文件

[root@LB2 ~]# cat /etc/keepalived/keepalived.conf 
! Configuration File for keepalived
global_defs {
	notification_email {
		49000448@qq.com
	}
	notification_email_from Alexandre.Cassen@firewall.loc
	smtp_server 10.0.0.1
	smtp_connect_timeout 30
	router_id LVS_2
}

vrrp_instance VI_1 {
	state BACKUP
	interface eth0
	virtual_router_id 55
	priority 100
	advert_int 1
	authentication {
		auth_type PASS
		auth_pass 1111
	}
	virtual_ipaddress {
		192.168.220.110/24
	}
}

virtual_server 192.168.220.110 80 {
	delay_loop 6
	lb_algo wrr
	lb_kind DR
	nat_mask 255.255.255.0
	persistence_timeout 300
	protocol TCP
}

real_server 192.168.220.129 80 {
	weight 1
	TCP_CHECK {
		connect_timeout 8
			nb_get_retry 3
			delay_before_retry 3
			connect_port 80
		}
	}
}

real_server 192.168.220.138 80 {
	weight 1
	TCP_CHECK {
		connect_timeout 8
		nb_get_retry 3
		delay_before_retry 3
		connect_port 80
	}
}
View Code

7、修改keepalive日志文件

  1. 默认keepalive的日志文件是 /var/log/messages
  2. 修改为:
[root@LB2 ~]# vim /etc/sysconfig/keepalived
......
#KEEPALIVED_OPTIONS="-D"          //注释掉行
KEEPALIVED_OPTIONS="-D -d -S 0"  //添加行
......

[root@LB2 ~]# vim /etc/rsyslog.conf
......
local0.*       /var/log/keepalived.log           //添加行
在约第42行信息末尾加入:;local0.none
变为:*.info;mail.none;authpriv.none;cron.none;local0.none                /var/log/messages
以上配置是表示来自local0设备的所有日志信息不再记录于/var/log/messages 里
[root@LB2 ~]# /etc/init.d/rsyslog restart            //重启日志服务
[root@LB2 ~]# /etc/init.d/keepalived restart         //重启keepalive服务

原文地址:https://www.cnblogs.com/happydreamzjl/p/10840235.html