监控zabbix-server本身

zabbix-server宕机后没有宕机报警,但是启动后,却有zabbix被重启的信息;

Zabbix server has just been restarted已恢复!
告警地址:127.0.0.1
监控项目:System uptime
监控取值:3 days, 22:25:06
告警等级:Information
当前状态:OK
告警时间:2018.10.15 14:28:34
恢复时间:2018.10.15 14:38:33
持续时间:10m
事件ID:43300

公司使用微信报警,所以决定使用微信脚本探测进程报警,添加计划任务

*/2 * * * * /usr/lib/zabbix/alertscripts/baojin/zabbix-server.sh

root@honey1:/usr/lib/zabbix/alertscripts/baojin# cat zabbix-server.sh
#!/bin/bash
#function:check zabbix-server
content="监控项目:zabbix-server"
tan1(){
run=1
while [ $run -eq 1 ];do
netstat -lntup|grep 10051 >/dev/null
if [ $? -ne 0 ];then
message="发生时间:`date +"%Y/%m/%d/%H:%M:%S"`/监控信息:zabbix-server宕机/监控主机:118.190.140.199"
python /usr/lib/zabbix/alertscripts/weixin3.py zabbix $content $message
sleep 30
tan2
else
exit
fi
done
}
tan2(){
netstat -lntup|grep 10051 >/dev/null
if [ $? -eq 0 ];then
message2="恢复时间:`date +"%Y/%m/%d/%H:%M:%S"`/监控信息:zabbix-server恢复/监控主机:118.190.140.199"
python /usr/lib/zabbix/alertscripts/weixin3.py zabbix $content $message2
else
continue
fi

}
tan1

功能:

1.zabbix-server正常,脚本不执行;

2.zabbix-server宕机,脚本执行报警;

监控项目:zabbix-server
发生时间:2018/10/15/17:38:11/监控信息:zabbix-server宕机/监控主机:123.123.123.123

3.每30s连续报警;

4.zabbix-server恢复后,脚本执行恢复操作;

监控项目:zabbix-server
恢复时间:2018/10/15/17:42:01/监控信息:zabbix-server恢复/监控主机:123.123.123.123

  

原文地址:https://www.cnblogs.com/Honeycomb/p/9792603.html