mysql keepalived

两台服务器, 已经做好了主主复制, 现再用keepalived保证高可用性.

闲话少说, 先在两台服务器都安装keepalived:

yum install keepalived -y

安装成功.

keepalived默认会使用这个配置文件: /etc/keepalived/keepalived.conf

安装好之后会有一个默认的, 我们可以备份一下, 其实不备份也没事

keepalived.conf 使用以下配置:

[root@master1 ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak
[root@master1 ~]# vim /etc/keepalived/keepalived.conf       ＃清空默认内容，直接采用下面配置：
! Configuration File for keepalived
       
global_defs {　　
　　router_id mysql1
}
       
vrrp_script chk_mysql_port {     #检测mysql服务是否在运行。有很多方式，比如进程，用脚本检测等等
    script "/opt/chk_mysql.sh"   #这里通过脚本监测
    interval 2                   #脚本执行间隔，每2s检测一次
    weight -5                    #脚本结果导致的优先级变更，检测失败（脚本返回非0）则优先级 -5
    fall 2                    　　#检测连续2次失败才算确定是真失败。会用weight减少优先级（1-255之间）
    rise 1                    　　#检测1次成功就算成功。但不修改优先级
}
       
vrrp_instance VI_1 {
    state BACKUP    
    interface enp0s3         #指定虚拟ip的网卡接口
    virtual_router_id 100    #路由器标识，MASTER和BACKUP必须是一致的
    priority 101             #定义优先级，数字越大，优先级越高，在同一个vrrp_instance下，MASTER的优先级必须大于BACKUP的优先级。这样MASTER故障恢复后，就可以将VIP资源再次抢回来 
    advert_int 1         
    authentication {   
        auth_type PASS 
        auth_pass 1111     
    }
    virtual_ipaddress {    
        192.168.1.222        #设置虚拟IP
    }
      
    track_script {               
       chk_mysql_port             
    }
}

global_defs 是全局配置, 主要用来在这台机器上的mysql挂了之后发邮件通知, 不过这里先不用邮件通知的机制. 主要要配置的是router_id, 其实就是一个标识服务器的id, 两台服务器的这个值要不同

vrrp_script 是配置检查mysql是否正常的脚本, 脚本下面会给出

vrrp_instance 是实例, 需要注意的点:
state配成BACKUP表示可以结合nopreemt设置非抢占式, 就是A上的mysql挂了, 则vip会漂到B上去, 等A上的mysql再好了, vip也还是在B上, 要等到B上的mysql挂了, 才会把vip漂到A上去. 认为这种方式比较合理, 没啥好抢的嘛, 都是为用户服务嘛, 抢啥.
interface要配成当前机器的真实ip使用的那个网卡, 比如有时候是eth0, 但是我看了我服务器上的是enp0s3:
virtual_router_id路由器标识，MASTER和BACKUP必须是一致的.
nopreempt设置成非抢占模式, 这个还是不要用的好, 下面解释.

下面给出第二台机器的keepalived配置:

[root@localhost opt]# cat /etc/keepalived/keepalived.conf 
! Configuration File for keepalived

global_defs {
    router_id mysql2
}

vrrp_script chk_mysql_port {
    script "/opt/chk_mysql.sh"
    interval 2
    weight -5
    fall 2
    rise 1
}

vrrp_instance VI_1 {
    state BACKUP
    interface enp0s3
    virtual_router_id 100
    priority 97
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        192.168.1.222
    }
    track_script {               
        chk_mysql_port             
    }
}

可以看到, 两台机器只有router_id和priority不同. 而且两台都设置成了BACKUP, 没有nopreempt.

/opt/chk_mysql.sh脚本:

#!/bin/bash
MYSQL=/usr/bin/mysql
MYSQL_HOST=localhost
MYSQL_USER=c1551
MYSQL_PASSWORD=1qaz@WSX3edc
CHECK_TIME=3
  
#mysql  is working MYSQL_OK is 1 , mysql down MYSQL_OK is 0
  
MYSQL_OK=1
  
function check_mysql_helth (){
    $MYSQL -h $MYSQL_HOST -u $MYSQL_USER -p${MYSQL_PASSWORD} -e "show status;" >/dev/null 2>&1
    if [ $? = 0 ] ;then
    MYSQL_OK=1
    else
    MYSQL_OK=0
    fi
    echo $MYSQL_OK
    return $MYSQL_OK
}
while [ $CHECK_TIME -ne 0 ]
do
    let "CHECK_TIME -= 1"
    check_mysql_helth
if [ $MYSQL_OK = 1 ] ; then
    CHECK_TIME=0
    exit 0
fi
if [ $MYSQL_OK -eq 0 ] &&  [ $CHECK_TIME -eq 0 ]
then
    echo 'killing keepalived...'
    pkill keepalived
    exit 1
else
    echo 'not killing keepalived...'
fi
sleep 1
done

对于抢占和非抢占, 有人是这么说的:

keepalive是基于vrrp协议在linux主机上以守护进程方式，根据配置文件实现健康检查。
VRRP是一种选择协议，它可以把一个虚拟路由器的责任动态分配到局域网上的VRRP路由器中的一台。
控制虚拟路由器IP地址的VRRP路由器称为主路由器，它负责转发数据包到这些虚拟IP地址。
一旦主路由器不可用，这种选择过程就提供了动态的故障转移机制，这就允许虚拟路由器的IP地址可以作为终端主机的默认第一跳路由器。 
keepalive通过组播，单播等方式（自定义），实现keepalive主备推选。工作模式分为抢占和非抢占（通过参数nopreempt来控制）。
1）抢占模式：
主服务正常工作时，虚拟IP会在主上，备不提供服务，当主服务优先级低于备的时候，备会自动抢占虚拟IP，这时，主不提供服务，备提供服务。
也就是说，工作在抢占模式下，不分主备，只管优先级。 
如上配置，不管keepalived.conf里的state配置成master还是backup，只看谁的priority优先级高（一般而言，state为MASTER的优先级要高于BACKUP）。
priority优先级高的那一个在故障恢复后，会自动将VIP资源再次抢占回来！！ 
2）非抢占模式：
这种方式通过参数nopreempt（一般设置在advert_int的那一行下面）来控制。不管priority优先级，只要MASTER机器发生故障，VIP资源就会被切换到BACKUP上。
并且当MASTER机器恢复后，也不会去将VIP资源抢占回来，直至BACKUP机器发生故障时，才能自动切换回来。 
千万注意：
nopreempt这个参数只能用于state为backup的情况，所以在配置的时候要把master和backup的state都设置成backup，这样才会实现keepalived的非抢占模式！ 

也就是说：
a）当state状态一个为master，一个为backup的时候，加不加nopreempt这个参数都是一样的效果。即都是根据priority优先级来决定谁抢占vip资源的，是抢占模式！
b）当state状态都设置成backup，如果不配置nopreempt参数，那么也是看priority优先级决定谁抢占vip资源，即也是抢占模式。
c）当state状态都设置成backup，如果配置nopreempt参数，那么就不会去考虑priority优先级了，是非抢占模式！即只有vip当前所在机器发生故障，另一台机器才能接管vip。即使优先级高的那一台机器恢复  后也不会主动抢回vip，只能等到对方发生故障，才会将vip切回来。



然而我发现, 如果我两个都设置成BACKUP而且启用nopreempt, 而且使用上面的健康检查脚本, 那么, 如果一台机器上的mysql挂了, 虽然健康检查没过, 这台机器上keepalived的priority降低了, 但是, vip还是在这台机器上. 因为上面也说了, 并不会主动抢加vip, 只有这台机器上的keepalived挂了或者直接这台机器挂了, vip才会漂到另外一台机器上!!! WTF!!! 就是说这台机器上的mysql虽然挂了, 但这台机器上的keepalived还是在一边等mysql起来, 同时还是占用了vip的!! 这显然不是我想要的. 所以, 还是不配置nopreempt好了, 让priority降低的机器自动释放vip.

以上.