ntp/heartbeat/postfix/dns故障处理记录

环境描述。两台FTP192.168.165.171/192.168.165.172通过heartbeat抢占192.168.165.173VIP对处提供服务。FTP上有monitor监控脚本监视网卡状态和vsftpd服务状态,一但出现异常会通过192.168.165.170上的DNS/postfix(同时也是NTP服务器)住指邮箱发送邮件。

1,三台服务器NTP获取时间均失败。查看NTP的配置文件。

[14:10:10 root@inf ~]# cat /etc/ntp.conf
restrict default kod nomodify notrap nopeer noquery
restrict -6 default kod nomodify notrap nopeer noquery
restrict 127.0.0.1
restrict 172.0.0.0 mask 255.0.0.0 nomodify notrap
restrict 192.168.0.0 mask 255.255.0.0 nomodify notrap
server 1.cn.pool.ntp.org prefer
server 0.rhel.pool.ntp.org
server 1.rhel.pool.ntp.org
server 2.rhel.pool.ntp.org
server 127.127.1.0
fudge 127.127.1.0 stratum 10
driftfile /var/lib/ntp/drift
keys /etc/ntp/keys
logconfig =all

14:11:08 root@ftp1 ~]# cat /etc/ntp.conf
restrict default nomodify notrap noquery
restrict 127.0.0.1
server 192.168.165.170 iburst prefer
server 127.127.1.0 # local clock
fudge 127.127.1.0 stratum 10
driftfile /var/lib/ntp/drift
broadcastdelay 0.008
keys /etc/ntp/keys
logconfig =all

手动kill掉NTP进程之后用ntpupdate更新时间可以获取。具体原因还不清楚。

2,主FTP重启后heartbeat抢占失败,经查看ha,cf:

[14:13:27 root@ftp1 ha.d]# cat ha.cf
logfile /var/log/ha-log
logfacility local0
keepalive 2
deadtime 30
warntime 10
initdead 120
udpport 694
baud 19200
ucast eth0 192.168.165.172
auto_failback on
node ftp1.99bill.com
node ftp2.99bill.com
ping 192.168.165.1
compression bz2
compression_threshold 2

查看haresources,发现浮动配置文件的主机名居然写成了备用FTP的主机名。更改为FTP1后正常。

[14:13:38 root@ftp1 ha.d]# cat haresources
ftp2.99bill.com IPaddr::192.168.165.173/24/eth0:0          #ftp2改为ftp1
ftp2.99bill.com vsftpd                #ftp2改为ftp1
You have new mail in /var/spool/mail/root

3,邮件通知问题。脚本中的邮件通知命令如下:

echo -e "Time:\t$Time\nApplication:\t($app)\n\nVIP Address($vip) from Master Server to Backup Server.Please Check...." | mail -s "Application($app)HA Status has Changed." -r heartbeat@account.99bill.com $user

$user的值为xx@99am.net   

经排查,nslookup -query=mx 99am.net发现FTP上查询不到到此域的mx记录,所以发送失败。

在165.170上可以。并且170上的DNS为公司内网DNS,而171和172的DNS/etc/resolv.conf设置为170。

当171和172设置为内网DNS的时候邮件收发也正常。可以正常解析99am.net的MX。

后检查170上的DNS文件发现问题。

[14:42:21 root@inf named.99.zones]# pwd
/var/named/chroot/var/named/named.99.zones

[14:42:14 root@inf named.99.zones]# cat 99am.net.zone
$TTL 3600
@ IN SOA @ root (
11
3h
15m
1w
1D )

          MX 10 mail                           #  缺少此项。添加之后正常。
@ 1D IN NS ns1.99am.net.
ns1 IN A 192.168.165.170
mail IN A 192.168.165.170

原文地址:https://www.cnblogs.com/feigerlan/p/8037652.html