mysql keepalived

两台服务器, 已经做好了主主复制, 现再用keepalived保证高可用性.

闲话少说, 先在两台服务器都安装keepalived:

yum install keepalived -y

安装成功.

keepalived默认会使用这个配置文件: /etc/keepalived/keepalived.conf

安装好之后会有一个默认的, 我们可以备份一下, 其实不备份也没事

keepalived.conf 使用以下配置:

[root@master1 ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak
[root@master1 ~]# vim /etc/keepalived/keepalived.conf       #清空默认内容,直接采用下面配置:
! Configuration File for keepalived
       
global_defs {  
  router_id mysql1
}
       
vrrp_script chk_mysql_port {     #检测mysql服务是否在运行。有很多方式,比如进程,用脚本检测等等
    script "/opt/chk_mysql.sh"   #这里通过脚本监测
    interval 2                   #脚本执行间隔,每2s检测一次
    weight -5                    #脚本结果导致的优先级变更,检测失败(脚本返回非0)则优先级 -5
    fall 2                      #检测连续2次失败才算确定是真失败。会用weight减少优先级(1-255之间)
    rise 1                      #检测1次成功就算成功。但不修改优先级
}
       
vrrp_instance VI_1 {
    state BACKUP    
    interface enp0s3         #指定虚拟ip的网卡接口
    virtual_router_id 100    #路由器标识,MASTER和BACKUP必须是一致的
    priority 101             #定义优先级,数字越大,优先级越高,在同一个vrrp_instance下,MASTER的优先级必须大于BACKUP的优先级。这样MASTER故障恢复后,就可以将VIP资源再次抢回来 
    advert_int 1         
    authentication {   
        auth_type PASS 
        auth_pass 1111     
    }
    virtual_ipaddress {    
        192.168.1.222        #设置虚拟IP
    }
      
    track_script {               
       chk_mysql_port             
    }
}
global_defs 是全局配置, 主要用来在这台机器上的mysql挂了之后发邮件通知, 不过这里先不用邮件通知的机制. 主要要配置的是router_id, 其实就是一个标识服务器的id, 两台服务器的这个值要不同
vrrp_script 是配置检查mysql是否正常的脚本, 脚本下面会给出
vrrp_instance 是实例, 需要注意的点:
state配成BACKUP表示可以结合nopreemt设置非抢占式, 就是A上的mysql挂了, 则vip会漂到B上去, 等A上的mysql再好了, vip也还是在B上, 要等到B上的mysql挂了, 才会把vip漂到A上去. 认为这种方式比较合理, 没啥好抢的嘛, 都是为用户服务嘛, 抢啥.
interface要配成当前机器的真实ip使用的那个网卡, 比如有时候是eth0, 但是我看了我服务器上的是enp0s3:
virtual_router_id
路由器标识,MASTER和BACKUP必须是一致的.
nopreempt设置成非抢占模式, 这个还是不要用的好, 下面解释.

下面给出第二台机器的keepalived配置:
[root@localhost opt]# cat /etc/keepalived/keepalived.conf 
! Configuration File for keepalived

global_defs {
    router_id mysql2
}

vrrp_script chk_mysql_port {
    script "/opt/chk_mysql.sh"
    interval 2
    weight -5
    fall 2
    rise 1
}

vrrp_instance VI_1 {
    state BACKUP
    interface enp0s3
    virtual_router_id 100
    priority 97
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        192.168.1.222
    }
    track_script {               
        chk_mysql_port             
    }
}

可以看到, 两台机器只有router_id和priority不同. 而且两台都设置成了BACKUP, 没有nopreempt.

/opt/chk_mysql.sh脚本:
#!/bin/bash
MYSQL=/usr/bin/mysql
MYSQL_HOST=localhost
MYSQL_USER=c1551
MYSQL_PASSWORD=1qaz@WSX3edc
CHECK_TIME=3
  
#mysql  is working MYSQL_OK is 1 , mysql down MYSQL_OK is 0
  
MYSQL_OK=1
  
function check_mysql_helth (){
    $MYSQL -h $MYSQL_HOST -u $MYSQL_USER -p${MYSQL_PASSWORD} -e "show status;" >/dev/null 2>&1
    if [ $? = 0 ] ;then
    MYSQL_OK=1
    else
    MYSQL_OK=0
    fi
    echo $MYSQL_OK
    return $MYSQL_OK
}
while [ $CHECK_TIME -ne 0 ]
do
    let "CHECK_TIME -= 1"
    check_mysql_helth
if [ $MYSQL_OK = 1 ] ; then
    CHECK_TIME=0
    exit 0
fi
if [ $MYSQL_OK -eq 0 ] &&  [ $CHECK_TIME -eq 0 ]
then
    echo 'killing keepalived...'
    pkill keepalived
    exit 1
else
    echo 'not killing keepalived...'
fi
sleep 1
done
对于抢占和非抢占, 有人是这么说的:
keepalive是基于vrrp协议在linux主机上以守护进程方式,根据配置文件实现健康检查。
VRRP是一种选择协议,它可以把一个虚拟路由器的责任动态分配到局域网上的VRRP路由器中的一台。
控制虚拟路由器IP地址的VRRP路由器称为主路由器,它负责转发数据包到这些虚拟IP地址。
一旦主路由器不可用,这种选择过程就提供了动态的故障转移机制,这就允许虚拟路由器的IP地址可以作为终端主机的默认第一跳路由器。 
keepalive通过组播,单播等方式(自定义),实现keepalive主备推选。工作模式分为抢占和非抢占(通过参数nopreempt来控制)。
1)抢占模式:
主服务正常工作时,虚拟IP会在主上,备不提供服务,当主服务优先级低于备的时候,备会自动抢占虚拟IP,这时,主不提供服务,备提供服务。
也就是说,工作在抢占模式下,不分主备,只管优先级。 
如上配置,不管keepalived.conf里的state配置成master还是backup,只看谁的priority优先级高(一般而言,state为MASTER的优先级要高于BACKUP)。
priority优先级高的那一个在故障恢复后,会自动将VIP资源再次抢占回来!! 
2)非抢占模式:
这种方式通过参数nopreempt(一般设置在advert_int的那一行下面)来控制。不管priority优先级,只要MASTER机器发生故障,VIP资源就会被切换到BACKUP上。
并且当MASTER机器恢复后,也不会去将VIP资源抢占回来,直至BACKUP机器发生故障时,才能自动切换回来。 
千万注意:
nopreempt这个参数只能用于state为backup的情况,所以在配置的时候要把master和backup的state都设置成backup,这样才会实现keepalived的非抢占模式! 

也就是说:
a)当state状态一个为master,一个为backup的时候,加不加nopreempt这个参数都是一样的效果。即都是根据priority优先级来决定谁抢占vip资源的,是抢占模式!
b)当state状态都设置成backup,如果不配置nopreempt参数,那么也是看priority优先级决定谁抢占vip资源,即也是抢占模式。
c)当state状态都设置成backup,如果配置nopreempt参数,那么就不会去考虑priority优先级了,是非抢占模式!即只有vip当前所在机器发生故障,另一台机器才能接管vip。即使优先级高的那一台机器恢复  后也不会主动抢回vip,只能等到对方发生故障,才会将vip切回来。


然而我发现, 如果我两个都设置成BACKUP而且启用nopreempt, 而且使用上面的健康检查脚本, 那么, 如果一台机器上的mysql挂了, 虽然健康检查没过, 这台机器上keepalived的priority降低了, 但是, vip还是在这台机器上. 因为上面也说了, 并不会主动抢加vip, 只有这台机器上的keepalived挂了或者直接这台机器挂了, vip才会漂到另外一台机器上!!! WTF!!! 就是说这台机器上的mysql虽然挂了, 但这台机器上的keepalived还是在一边等mysql起来, 同时还是占用了vip的!! 这显然不是我想要的. 所以, 还是不配置nopreempt好了, 让priority降低的机器自动释放vip.

以上.

 
 
 
原文地址:https://www.cnblogs.com/lihan829/p/11427162.html