OpenStack 虚拟机监控方案确定

Contents [hide]

监控方案调研过程

选择监控方案:

1. 虚拟机里内置监控模块

测试collectd+rrdtool,获取到比较好的监控效果,但是collectd生成的rrd文件是以主机名作为监控存储目录的,如果在openstack中有2个以上的机器相同名字,存储到ceph中将是一个问题。并且需要在主机中开启该agent服务。可变因素过多(如用户禁用该服务)。

2. 通过libvirt获取虚拟机数据监控。

a.测试openstack的自待组件ceilometer

使用过程中获取到实例的cpu,磁盘读写,网络读写数据。但是没有内存,磁盘空间数据。缺点一。在dashboard中实现后发先,请求超时严重,缺点二。

b. sina的kanyun

使用过程中获取到数据不正确。cpu使用率,内存使用率均不正确。

c. 我们自己根据libvirt的api开发cpu使用率,内存使用率,磁盘空间,磁盘读写,网络出入。

工作量过大,还有风险是:对cpu使用率的计算公式,共存的使用率计算公式(查看当前python的libvirt的api并没有已使用内存接口,可能为libvirt版本问题)等都需要熟悉,对计算数值的验证准确度都需要验证.

d. 天成云的监控方案

该方案为collectd+libvirt+rrdtool+cgp,该方案之前能监控虚拟机的CPU使用率,网络出入,磁盘读写,负载。有良好的图表呈现。

原文地址:https://www.cnblogs.com/CLTANG/p/4332633.html