常用的收敛算法

  1. 毛刺收敛:

    在织云监控中,我们的告警策略为了防止毛刺的影响,会将告警策略定义为10分钟发生3次类似的模式。

  2. 同类收敛:

    一个模块有300个监控实力,产生了300条的告警,只要有一条告给运维,对于运维同类收敛掉了。

  3. 时间收敛:

    生产环境中有很多定时的任务,如定时跑批会引起I/O的陡增等异常,这种可以针对性的收敛掉。

  4. 昼夜收敛:

    有一些告警,在分布式服务的高可用架构下,晚上不需要告警出来,可以等白天才告警,更人性化的管理。

  5. 变更收敛:

    如果告警的时间点有运维的活动,就要收敛掉它。怎么做到的?取决于要把运维的活动都收口在标准化运维的平台,运维平台对生产环节都要讲变更日志写入在变更记录中心那里,然后统一告警系统能够关联变更记录来决策是收敛还是发出告警。

原文地址:https://www.cnblogs.com/slqt/p/10381819.html