系统监控读书笔记

1 系统监控架构图

 1.1 系统层监控主要关注硬件设备、网络、虚拟化资源、存储及备份设备、安全设备的监控

基本的网络可用性监控包括互联网出入口流量及可用性、机房间专线流量及可用性,以及网络设备各端口流量及可用性等。

对虚拟化集群的监控重点仍然是围绕几大块内容,包括CPU方面的核数、总频率、使用率等;虚拟存储资源方面的存储总容量、使用量、使用率、IOPS性能、I/O延迟等;内存方面的总容量、使用量、使用率等;网络方面的网络流量、网卡接收/发送速率、丢包率、广播、组播;运行方面的运行状态、异常日志、虚拟机总数量、运行中的虚拟机数量、运行时间等。

除了基础设施层要考虑的控制器、磁盘、阵列卡等硬件部件健康状态以外,重点要关注设备运行时的硬盘读写性能、读写超时、硬盘掉线、硬盘介质错误等。

对于安全方面的IDS/IPS、WAF、日志审计、数据库审计、威胁检测等设备或系统的监控更是不能轻视

1.2 应用层监控需要从用户发起访问请求开始,包括在DNS解析、CDN响应速度及性能、负载均衡能力、应用软件/中间件/数据库的可用性及性能监控,以及访问安全等层面进行监控。

应用层最基础的监控就是进程、端口是否存活,以及文件句柄数等指标监控。对于应用软件的监控,应用服务状态是否正常、进程是否假死、日志输出是否有异常、网络连通性等

对于分布式任务调度服务、分布式缓存、消息队列、分布式数据库、分布式存储等中间件,需要针对性地重点投入资源进行相关监控指标的开发,围绕中间件集群的健康状态、运行情况及性能展开监控;在分布式与微服务之后,链路调用关系也更趋复杂,所以对于服务与服务之间的调用关系梳理和各节点间的应用性能也值得关注。

参考资料

1 中小银行运维架构

学习过程中,难免出错。如果您在阅读过程中遇到不太明白,或者有疑问。欢迎指正...联系邮箱crazyCodeLove@163.com

如果觉得有用,想赞助一下请移步赞助页面:赞助一下

原文地址:https://www.cnblogs.com/zhaopengcheng/p/14957178.html