一、常用监控软件简介
常用监控软件有:cacti, nagios, zabbix, ganglia,centreon,prometheus
1.1 Cacti
Cacti 是一套基于 PHP,MySQL,SNMP 及 RRDTool 开发的网络流量监测图形分析工具。 简单的说 Cacti 就是一个 PHP 程序。它通过使用 SNMP 协议获取远端网络设备和相关信息,并通过 RRDTOOL 工 具绘图,通过 PHP 程序展现出来。我们使用它可以展现出监控对象一段时间内的状态或者 性能趋势图。
1.2 Nagios
Nagios 是一款开源的免费网络监视工具,能有效监控 Windows、Linux 和 Unix 的主机状 态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第 一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。
1.3 Zabbix
zabbix 是一个基于 WEB 界面的提供分布式系统监视以及网络监视功能的企业级的开源 解决方案。zabbix 能监视各种网络参数,保证服务器系统的安全运营;并提供柔软的通知机 制以让系统管理员快速定位/解决存在的各种问题。
zabbix 由 2 部分构成,zabbix server 与可选组件 zabbix agent。zabbix server 可以通过 SNMP, zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能, 它可以运行在 Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X 等平台上。
1.4 Ganglia
Ganglia 是一款为 HPC(高性能计算)集群而设计的可扩展的分布式监控系统,它可以监视 和显示集群中的节点的各种状态信息,它由运行在各个节点上的 gmond 守护进程来采集 CPU 、内存、硬盘利用率、I/O 负载、网络流量情况等方面的数据,然后汇总到 gmetad 守 护进程下,使用 rrdtool 存储数据,最后将历史数据以曲线方式通过 PHP 页面呈现。 Ganglia 监控系统有三部分组成,分别是 gmond、gmetad、webfrontend。
1.5 Centreon
Centreon 是一款功能强大的分布式 IT 监控系统,它通过第三方组件可以实现对网络、 操作系统和应用程序的监控:首先,它是开源的,我们可以免费使用它;其次,它的底层采用 nagios 作为监控软件,同时 nagios 通过 ndoutil 模块将监控到的数据定时写入数据库中, 而 Centreon 实时从数据库读取该数据并通过 Web 界面展现监控数据;,最后,我们可以通过 Centreon 管理和配置 nagios,或者说 Centreon 就是 nagios 的一个管理配置工具,通过Centreon 提供的 Web 配置界面,可以轻松完成 nagios 的各种繁琐配置。
1.6 Prometheus
Prometheus是一套开源的监控&报警&时间序列数据库的组合,起始是由SoundCloud公司开发的。随着发展,越来越多公司和组织接受采用Prometheus,社区也十分活跃,他们便将它独立成开源项目,并且有公司来运作。google SRE的书内也曾提到跟他们BorgMon监控系统相似的实现是Prometheus。现在最常见的Kubernetes容器管理系统中,通常会搭配Prometheus进行监控。
Prometheus 的优点:
- 非常少的外部依赖,安装使用超简单
- 已经有非常多的系统集成 例如:docker HAProxy Nginx JMX等等
- 服务自动化发现
- 直接集成到代码
- 设计思想是按照分布式、微服务架构来实现的
Prometheus 的特性:
- 自定义多维度的数据模型
- 非常高效的存储 平均一个采样数据占 ~3.5 bytes左右,320万的时间序列,每30秒采样,保持60天,消耗磁盘大概228G。
- 强大的查询语句
- 轻松实现数据可视化
1.7 应用场景
1、中小企业监控平台选择 Zabbix
Zabbix 是一款综合了数据收集、数据展示、数据提取、监控报警配置、用户展示等方面 的一款综合运维监控平台。
Zabbix 学习入门较快,功能也很强大,是一个可以迅速用起来的监控软件,能够满足中 小企业(服务器数 500 台一下)的监控报警需求,因此是中小型企业运维监控的首选平台。
但是,Zabbix 当监控服务器数量较多时,会产生很多问题,如监控数据不及时、报警超 时等等问题,这是因为 Zabbix 对服务器性能要求较高,当监控的服务器数量超过 500 台后, 监控性能急剧下降,此时需要进行分布式监控部署,并且需要提升监控服务器的性能。
安全性方面,Zabbix 客户端的 agent 如果故障,收集到的数据将丢失,同时 Zabbix Server也是单点,可能还需要对 Zabbix Server 做 HA 保证数据的安全和监控的高可用。
2、互联网大企业监控平台选择 Ganglia+Centreon
开源监控软件组合应用+二次开发
是大型互联网企业构建监控平台的一个基本策略,
对于有海量服务器、多业务系统的复杂监控,没有哪个软件能独立完成企业的所有监控需求, 因此,多种开源监控软件组合应用+二次开发才是监控平台的最终方向。
推荐 ganglia 是因为 ganglia 客户端软件对服务资源占用非常低,并且扩展插件非常多,
监控扩展也非常容易,同时结合专业的 web 监控平台 centreon,可以实现在数据收集、数 据展示、数据提取、监控报警配置、用户展示等方面的完美配合,因此这里对海量服务器进
行监控
二、zabbix
2.1 zabbix简介
Zabbix是一个基于WEB界面的分布式开源监控系统,主要有2部分构成,Zabbix server与Zabbix agent,同时也支持Zabbix proxy。zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。
zabbix server可以单独监视远程服务器的服务状态;同时也可以与zabbix agent配合,可以轮询zabbix agent主动接收监视数据(agent方式),同时还可被动接收zabbix agent发送的数据(trapping方式)。
zabbix agent需要安装在被监视的目标服务器上,它主要完成对硬件信息或与操作系统有关的内存,CPU等信息的收集。
另外zabbix server还支持SNMP (v1,v2),可以与SNMP软件(例如:net-snmp)等配合使用。
Zabbix的底层采集程序是用C语言编写的Server和Agent,而用户界面是通过PHP编写WEB,采用Mysql(Pgsql)数据库来存储数据。整个Zabbix其实就是一个框架,其中内置了一些针对各类OS的系统参数采集命令,可以直接调用,而其它的自定义监控参数,则可以通过自己来写一些快捷的Shell命令通过管道传递,或通过各种脚本甚至程序来传递。Zabbix只管把最后的返回值通过agent拿到,存储统计,绘图,根据定义的阀值进行报警等。
2.2 zabbix特点
zabbix的主要特点:
- 安装与配置简单,学习成本低
- 支持多语言(包括中文)
- 免费开源
- 自动发现服务器与网络设备
- 分布式监视以及WEB集中管理功能
- 可以无agent监视
- 用户安全认证和柔软的授权方式
- 通过WEB界面设置或查看监视结果
- email等通知功能
zabbix主要功能:
- CPU负荷
- 内存使用
- 磁盘使用
- 网络状况
- 端口监视
- 日志监视
zabbix监控的内容
- 系统基础监控zabbix agent
内存、CPU、硬盘.... - 网络设备snmp
路由器、防火墙、交换机.... - 硬件监控IPMI
电源、CPU温度、硬盘温度.... - 业务监控
进程
端口
日志
2.3 zabbix组成
zabbix程序的组件:
- zabbix_server:服务端守护进程;
- zabbix_agentd:agent守护进程;
- zabbix_proxy:代理服务器,可选组件;
- zabbix_get:命令行工具,手动测试向agent发起数据采集请求;
- zabbix_sender:命令行工具,运行于agent端,手动向server端发送数据;
- zabbix_java_gateway: java网关;
- zabbix_database:MySQL或PostgreSQL;
- zabbix_web:Web GUI
zabbix逻辑组件:
- 主机组
- 主机
- 监控项(item)
- key:实现获取监控的目标上的数据的命令或脚本的名称;
- 应用(application):同一类监控项的集合;
- 触发器(trigger):表达式;PROBLEM, OK;
- 事件(event):
- 动作(action):由条件(condition)和操作(operation)组件;
- 媒介(media):发送通知的通道;
- 通知(notification):
- 远程命令(remote command):
- 报警升级():
- 模板(template):快速定义被监控主机的各监控项的预设项目集合;
- 图形(graph):用于展示历史数据或趋势数据的图像;
- 屏幕(screen):由多个graph组成;
2.4 zabbix配置文件
zabbix配置文件有两种:
- 服务器端配置文件(/usr/local/etc/zabbix_server.conf)
- 客户端配置文件(/usr/local/etc/zabbix_agentd.conf)
- zabbix代理配置文件(/usr/local/etc/zabbix_proxy.conf)
服务器端配置文件zabbix_server.conf常用配置参数:
参数 | 作用 |
---|---|
LogFile | 设置服务端日志文件存放路径 |
ListenIP | 设置服务端监听IP |
ListenPort | 设置服务端监听的端口号 |
PidFile | 设置服务端进程号文件存放路径 |
DBHost | 指定zabbix的数据库服务器IP |
DBName | 指定zabbix使用的数据库库名 |
DBUser | 指定zabbix数据库登录用户 |
DBPassword | 指定zabbix数据库登录密码 |
DBPort | 指定zabbix数据库端口号 |
User | 设置zabbix以什么用户的身份运行 |
AlertScriptsPath | 设置告警脚本存放路径 |
ExternalScripts | 外部脚本存放路径 |
客户端配置文件zabbix_agentd.conf常用配置参数:
参数 | 作用 |
---|---|
Server | 指定zabbix服务器的IP或域名 |
ServerActive | 指定zabbix服务器的IP或域名 |
Hostname | 指定本机的主机名,此项必须与web界面配置项一致 |
UnsafeUserParameters | 是否启用自定义监控项,可选值为{1 |
UserParameter | 指定自定义监控脚本参数 |
LogFile | 设置客户端日志文件存放路径 |
2.5 zabbix的工作流程
创建主机组—>创建主机并加入主机组——>创建监控项——>告警触发器配置——>配置警告动作
三、部署zabbix
环境说明:因为zabbix是用php语言开发的,所以必须先部署lamp架构,使其能够支持运行php网页
环境|IP| 要安装的应用
-|-
服务器端|192.168.43.166|lamp架构,zabbix server,zabbix,agent
客户端|192.168.43.247|zabbix agent
3.1 zabbix服务端安装
//安装依赖包
[root@localhost ~]# yum -y install net-snmp-devel libevent-devel
//下载源码包(速度很慢)
[root@localhost ~]# cd /usr/src/
[root@localhost src]# wget https://nchc.dl.sourceforge.net/project/zabbix/ZABBIX%20Latest%20Stable/4.0.3/zabbix-4.0.3.tar.gz
//解压
[root@localhost src]# tar xf zabbix-4.0.3.tar.gz
//创建zabbix用户和组
[root@localhost ~]# groupadd -r zabbix
[root@localhost ~]# useradd -r -g zabbix -M -s /sbin/nologin zabbix
//配置zabbix数据库
[root@localhost mysql]# mysql
Welcome to the MySQL monitor. Commands end with ; or g.
Your MySQL connection id is 9
Server version: 5.7.22-log MySQL Community Server (GPL)
Copyright (c) 2000, 2018, Oracle and/or its affiliates. All rights reserved.
Oracle is a registered trademark of Oracle Corporation and/or its
affiliates. Other names may be trademarks of their respective
owners.
Type 'help;' or 'h' for help. Type 'c' to clear the current input statement.
mysql> create database zabbix character set utf8 collate utf8_bin;
Query OK, 1 row affected (0.00 sec)
mysql> grant all privileges on zabbix.* to zabbix@localhost identified by '123456';
Query OK, 0 rows affected, 2 warnings (0.29 sec)
mysql> flush privileges;
Query OK, 0 rows affected (0.01 sec)
mysql> quit
Bye
[root@localhost ~]# cd /usr/src/zabbix-4.0.3/database/mysql/
[root@localhost mysql]# ls
data.sql images.sql Makefile.am Makefile.in schema.sql
//导入数据库文件到zabbix
[root@localhost mysql]# mysql zabbix < schema.sql
[root@localhost mysql]# mysql zabbix < images.sql
[root@localhost mysql]# mysql zabbix < data.sql
//编译安装zabbix
[root@localhost ~]# cd /usr/src/zabbix-4.0.3
[root@localhost zabbix-4.0.3]# ./configure --enable-server
--enable-agent
--with-mysql
--with-net-snmp
--with-libcurl
--with-libxml2
[root@localhost zabbix-4.0.3]# make install
3.2 zabbix服务端配置
//配置文件路径
[root@localhost zabbix-4.0.3]# ls /usr/local/etc/
zabbix_agentd.conf zabbix_agentd.conf.d zabbix_server.conf zabbix_server.conf.d
//修改配置文件(常用参数),保持默认不变只设置数据库信息
vim /usr/local/etc/zabbix_server.conf
DBHost=localhost
DBName=zabbix
DBUser=zabbix
DBPassword=123456
//启动zabbix_server和zabbix_agentd,提前做好环境变量
[root@localhost etc]# ln -s /usr/local/mysql/lib/* /usr/lib/ (mysql库文件如果没做软连接会报错)
[root@localhost etc]# ldconfig -v (查看库文件连接情况)
[root@localhost etc]# zabbix_agentd
[root@localhost etc]# zabbix_server
[root@localhost etc]# ss -ntl
State Recv-Q Send-Q Local Address:Port Peer Address:Port
LISTEN 0 128 *:111 *:*
LISTEN 0 5 192.168.122.1:53 *:*
LISTEN 0 128 *:22 *:*
LISTEN 0 128 127.0.0.1:631 *:*
LISTEN 0 100 127.0.0.1:25 *:*
LISTEN 0 128 127.0.0.1:6010 *:*
LISTEN 0 128 *:10050 *:*
LISTEN 0 80 :::3306 :::*
LISTEN 0 128 :::111 :::*
LISTEN 0 128 :::80 :::*
LISTEN 0 128 :::22 :::*
LISTEN 0 128 ::1:631 :::*
LISTEN 0 100 ::1:25 :::*
LISTEN 0 128 ::1:6010 :::*
3.3 zabbix web界面安装和配置
//修改php配置文件并重启php-fpm
[root@localhost ~]# sed -ri 's/(post_max_size =).*/1 16M/g' /etc/php.ini
[root@localhost ~]# sed -ri 's/(max_execution_time =).*/1 300/g' /etc/php.ini
[root@localhost ~]# sed -ri 's/(max_input_time =).*/1 300/g' /etc/php.ini
[root@localhost ~]# sed -i '/;date.timezone/a date.timezone = Asia/Shanghai' /etc/php.ini
[root@localhost ~]# service php-fpm restart
Gracefully shutting down php-fpm . done
Starting php-fpm done
//准备zabbix的php页面
[root@localhost ~]# cd /usr/src/zabbix-4.0.3
[root@localhost zabbix-4.0.3]# ls
aclocal.m4 ChangeLog config.log configure.ac frontends m4 man README
AUTHORS compile config.status COPYING include Makefile misc sass
bin conf config.sub database INSTALL Makefile.am missing src
build config.guess configure depcomp install-sh Makefile.in NEWS upgrades
[root@localhost zabbix-4.0.3]# mkdir /usr/local/apache/htdocs/zabbix
[root@localhost zabbix-4.0.3]# cp -a frontends/php/* /usr/local/apache/htdocs/zabbix/
[root@localhost zabbix-4.0.3]# chown -R apache.apache /usr/local/apache/htdocs
//配置apache虚拟主机
[root@localhost ~]# vim /etc/httpd24/httpd.conf
//取消注释,启用proxy模块
#LoadModule proxy_module modules/mod_proxy.so
#LoadModule proxy_http_module modules/mod_proxy_http.so
//在配置文件的末尾加如下内容
<VirtualHost *:80>
DocumentRoot "/usr/local/apache/htdocs/zabbix"
ServerName www.wang.com
ProxyRequests Off
ProxyPassMatch ^/(.*.php)$ fcgi://127.0.0.1:9000/usr/local/apache/htdocs/zabbix/$1
<Directory "/usr/local/apache/htdocs/zabbix">
Options none
AllowOverride none
Require all granted
</Directory>
</VirtualHost>
//设置zabbix/conf目录的权限,让zabbix有权限生成配置文件zabbix.conf.php
[root@localhost ~]# chmod 777 /usr/local/apache/htdocs/zabbix/conf
[root@localhost ~]# ll -d /usr/local/apache/htdocs/zabbix/conf
drwxrwxrwx 2 apache apache 81 Aug 17 13:03 /usr/local/apache/htdocs/zabbix/conf
//重启Apache
[root@localhost zabbix-4.0.3]# service httpd stop
[root@localhost zabbix-4.0.3]# service httpd start
[root@localhost zabbix-4.0.3]# ss -ntl
State Recv-Q Send-Q Local Address:Port Peer Address:Port
LISTEN 0 128 *:111 *:*
LISTEN 0 5 192.168.122.1:53 *:*
LISTEN 0 128 *:22 *:*
LISTEN 0 128 127.0.0.1:631 *:*
LISTEN 0 100 127.0.0.1:25 *:*
LISTEN 0 128 127.0.0.1:6010 *:*
LISTEN 0 128 *:10050 *:*
LISTEN 0 128 127.0.0.1:9000 *:*
LISTEN 0 80 :::3306 :::*
LISTEN 0 128 :::111 :::*
LISTEN 0 128 :::80 :::*
LISTEN 0 128 :::22 :::*
LISTEN 0 128 ::1:631 :::*
LISTEN 0 100 ::1:25 :::*
LISTEN 0 128 ::1:6010 :::*
3.4 zabbix客户端配置
/安装依赖包
[root@localhost ~]# yum -y install net-snmp-devel libevent-devel
//下载源码包(速度很慢)
[root@localhost ~]# cd /usr/src/
[root@localhost src]# wget https://nchc.dl.sourceforge.net/project/zabbix/ZABBIX%20Latest%20Stable/4.0.3/zabbix-4.0.3.tar.gz
//解压
[root@localhost src]# tar xf zabbix-4.0.3.tar.gz
//编译安装zabbix
[root@localhost ~]# cd /usr/src/zabbix-4.0.3
[root@localhost zabbix-4.0.3]# ./configure --enable-agent
//修改配置文件
[root@localhost etc]# vim zabbix_agentd.conf
Server = 192.168.43.166
ServerActive = 192.168.43.166
Hostname = client247
UnsafeUserParameters = 1
UserParameter = 1
//启动zabbix_agent服务
[root@localhost etc]# zabbix_agentd
3.5 zabbix登录
- 修改/etc/hosts文件,添加域名与IP的映射
zabbix初次默认登录用户名和密码:
用户名:Admin
密码: zabbix
3.6 添加客户端
3.7 修改显示语言
如果出现中文乱码
解决中文乱码方法:
上传本地字体
找到本地C:WindowsFontsSTXINWEI.TTF(华文新魏)上传到/usr/local/apache/htdocs/zabbix/fonts/
将上传字体改名成默认字体并覆盖,zabbix_server命令刷新即可