024.Zabbix告警等级机制

一 等级告警

告警升级可以对告警结果按自定义的时间段进行进行消息发送,并执行命令,形成一个梯度的告警处理。

二 按时间自定义告警梯度

2.1 添加时间发生的时间戳和发送时间

110
2.2 设置三个等级梯度
第一梯度,1、2步,发送给admin用户,时间间隔为60s,发送两次,直到故障恢复。
第二梯度,3、5步,发送给老板Boss,时间间隔为60s,发送3次,直到故障恢复。
第三梯度,6、7步,发送给admin和老板,时间间隔为120s,发送两次,直到故障恢复。
注意:可定义更复杂的梯度提醒,如下图——
111
  1. 用户MySQL Administration每隔半小时发送一次告警;
  2. 用户Database manager在事件发生后的两小时发送告警信息;
  3. 在2小时30分钟,执行远程重启MySQL命令;
  4. 在3小时候,机执行远程命令后并未解决问题,发送告警小西给用户Guests;
  5. 在4小时候,通过IPMI对机器执行远程重启命令。

三 告警故障排查思路

  • 告警脚本权限、告警账户是否配置正确;
  • 用户对方发送告警信息的机器是否具有可读写权限;
  • 告警信息的接收方是否解决接受告警信息,是否被屏蔽;
  • 告警配置是否正确,是否达到触发器设置的阀值,Action中的条件是否正确,是否在维护状态。
原文地址:https://www.cnblogs.com/itzgr/p/9962989.html