Zabbix快速入门

模板的管理与使用

一 模板

  模板是zabbix的核心,因为模板继承了所有要监控的内容,以及所要展示的图形等等,zabbix的安装部署完成之后,自带了很多模板(网络设备模板,操作系统模板,常用应用软件模板),这些模板足够满足日常百分之八十左右的应用需求.

  模板的组成: 应用集, 监控项, 触发器, 图形, 聚合图形,自动发现, Web检测, 

  模板的重要组成: 监控项, 触发器, 自动发现, 图形

1.1.1 模板的分类

  1) 监控系统状态的模板

# 对 Linux 系统的监控模板
Template OS Linux
# 对 Windows 系统的监控模板
Template OS Windows
# 对 Mac OS X 系统的监控模板
Template OS Mac OS X
# 对 VM VMware 系统的监控模板
Template VM VMware

  2) 监控网络和网络设备的模板

#开启SNMPv1监控的模板
Template Module Generic SNMPv1 
  
#开启SNMPv2监控的模板
Template Module Generic SNMPv2  

Template Module Interfaces Simple SNMPv2
emplate Net Cisco IOS SNMPv2
Template Net Juniper SNMPv2
Template Net Huawei VRP SNMPv2</p>

  3) 监控应用软件和服务的模板

 #对HTTPD服务的监控模板
Template App HTTP Service
  
#对MySQL服务的监控模板
Template DB MySQL     

#对SSH服务的监控模板
Template App SSH Service  

#对主机Ping的监控模板
Template Module ICMP Ping  

#对Java服务的监控模板
Template App Generic Java JMX  

#对Zabbix Agent状态的监控模板
Template App Zabbix Agent
  
#对Zabbix Server状态的监控模板
Template App Zabbix Server  

二 创建应用集

  1) 操作步骤

  配置 --->> 模板 ---> (新建模板/打开现有模板) --->> 应用集 --->> 创建应用集 --->> 输入要创建的应用集名称

  创建应用集可以理解为一个群组,部门,列如要对CPU属性监控,那么就可以创建一个CPU的应用集,在这个应用集下面可以创建多个监控CPU的监控项.

  应用集的主要作用: 便于对监控项管理,对监控项进行分类

三 创建监控项

  1) 操作步骤

    配置 --->> 模板 ---> (新建模板/打开现有模板) --->> 监控项 --->> 创建监控项 --->> .....

2) 参数说明

  1. 名称

     名称是创建的监控项的名称,自定义即可,

  2. 类型

    类型是设置此监控项通过什么方式进行监控,zabbix可选的监控类型有很多,常用的有 zabbix 客户端,zabbix客户端(主动模式),简单检查, SNMP客户端, zabbix采集器等,zabbix 客户端监控,也称为zabbix客户端(被动式)监控,这个需要根据需求进行选择.

  2. 键值

    键值可以自己定义,也可以使用zabbix 自带的键值,简单来说,键值就是获取数据的方式.

    可以使用: [zabbix_get -s 192.168.10.53 -k "agent.ping"] 工具进行测试

  3. 信息类型

    信息类型看具体返回的值,此信息类型为 浮点数,所以选择浮点数.

  4. 单位

    范围就是数据的返回单位,百分比还是什么

  5. 更新间隔时间

    数据获取更新的事件

  6. 自定义时间间隔

    灵活的在指定的时间段进行更新数据

  7. 历史数据保留时长

    历史数据的保留时间,自动删除

  8. 趋势储存时间

    趋势图的保留时间

  9. 应用集

    在那个应用集,

 四 创建触发器

   触发器是用于故障告警的一个设置,将一个监控项,添加触发器后,此监控项如果出现问题,就会激活触发器,然后触发器将自动连接告警动作,最后触发告警.

  触发器函数(diff,avg,last,nodata)

  1) diff

# 参数:不需要参数
# 支持值类型:float,int,str,text,log
# 作用:返回值为1表示最近的值与之前的值不同,即值发生变化,0表示无变化。

  2) last

参数:#num
支持值类型:float,int,str,text,log
作用:获取最近的值,“#num”表示最近第N个值,请注意当前的#num和其他一些函数的#num的意思是不同的,
例如:last(0)或last()等价于last(#1),表示获取最新的值,last(#3)表示最近第3个值(并不是最近的三个值),
注意,last函数使用不同的参数将会得到不同的值,#2表示倒数第二新的数据。例入从老到最新值为1,2,3,4,5,6,7,8,9,10,last(#2)得到的值为9,last(#9)得到的值为2。
另外,last函数必须包含参数。

  3) avg

参数:秒或#num
支持类型:float,int
作用:返回一段时间的平均值
例如,avg(5)表示最后5秒的平均值,avg(#5)表示最近5次得到值的平均值,avg(3600,86400)表示一天前的一个小时的平均值。
如果仅有一个参数,表示指定时间的平均值,从现在开始算起,如果有第二个参数,表示漂移,从第二个参数前开始算时间,#n表示最近n次的值。

  4) change

参数:无需参数
支持类型:float,int,str,text,log
作用:返回最近获得值与之前获得值的差值,返回字符串0表示相等,1表示不同。
例如,change(0)>n表示最近得到的值与上一个值的差值大于n,其中,0表示忽略参数。

  5) nodata

参数:秒
支持值类型:any
作业:探测是否能接收到数据,当返回值为1表示指定的间隔(间隔不应小于30秒)没有接收到数据,0表示其正常接收数据

  6) count

参数:秒或#num
支持类型:float,int,str,text,log
作用:返回指定时间间隔内数值的统计。
例如:count(600):表示最近10分钟得到值的个数
count(600,12):表示最近10分钟得到值的个数等于12其中,第一个参数是指定时间段,第二个参数是样本数据。

  7.) sum

参数:秒或#num
支持值类型:float,int
作用:返回指定时间间隔中收集到的值的总和,时间间隔作为第一个参数支持秒或收集值的数目(以#开始)。
例如:sum(600):表示在600秒之内接收到所有值的和。sum(#5):表示最后5个值的和。

  

原文地址:https://www.cnblogs.com/yanshicheng/p/10436954.html