(转)浅谈 Linux 系统中的 SNMP Trap

原文：https://www.ibm.com/developerworks/cn/linux/l-cn-snmp/index.html

简介

本文讲解 SNMP Trap，在介绍 Trap 概念之前，首先认识一下 SNMP 吧。

简单网络管理协议(Simple Network Management Protocol)是一种应用层协议，是TCP/IP协议族的一部分。它使网络设备之间能够方便地交换管理信息。能够让网络管理员管理网络的性能，发现和解决网络问题及进行网络的扩充。

目前SNMP已成为网络管理领域中事实上的工业标准，并被广泛支持和应用，大多数网络管理系统和平台都是基于SNMP的。

SNMP 管理控制框架

简而言之，SNMP 协议是用来管理设备的协议，何谓管理呢？我斗胆将其归纳为两个基本点：监控（get）和配置（set）。也就是说：人们管理一个设备的基本手段可以归纳为 get 和 set 两种操作。如图 1 所示。

图 1. SNMP 基本管理控制框架

如果 NMS( 网管系统 ) 需要查询被管理设备的状态，则需要通过 SNMP 的 get 操作获得设备的状态信息；同样，如果 NMS 需要修改或者配置被管理设备的参数，则需要通过 SNMP 的 set 操作来完成。

什么是 MIB?

MIB 是描述被管理设备上的参数的数据结构。如前所述，管理一个设备，就是利用 SNMP 协议，通过网络对被管理设备上的参数进行 get 和 set 操作。

那么如何组织被管理设备上的参数呢？多数情况下，可以 get 和 set 的参数实在多得惊人，假如仅仅简单地线性罗列它们，操作会十分不便。想象一下把 1000 个参数列成一张表，需要使用的时候查询这样一张表会有多么困难啊？比如您打算在地球上找一个城市，”Ithaca”，如果没有归类和分级，则需要查找一张巨大的表格。但如果告诉您城市” Ithaca”是：南美洲国家圭亚那的北部城市"Ithaca"，那么就容易些了吧？

被管理的设备相当复杂，拥有很多可以被管理的参数，需要对它们进行归类，分级。管理信息库 (MIB) 是一个具有分层特性的信息的集合，我们可以通过 SNMP 去存取它。MIB 的成员是一些被管理的对象 (Managed Object)，以对象标示符 (Object Identifiers) 来区分它们。被管理的对象由一个或多个对象实例 (Object Instances) 组成，本质上，这些对象实例就是变量。

在 MIB 的层次结构中，一个对象标示符唯一标识了被管理对象。MIB 的层次结构可以被描述成无根名的树，树的级别被不同的组织所划分。如下图所示：

图 2. MIB 树

很多能够被 SNMP 管理的对象都是由标准组织定义好的。比如系统磁盘的信息，用 OID ”1.3.6.1.4.1.2021.9” 表示。这串数字是国际标准化组织协商定义好的，大家都要去遵循它。当然，国际组织不可能预知未来，如果您要开发的设备有一些管理需求没有任何 RFC 定义过，那么您也可以编写自己的 MIB 文件来定义私有的 MIB 对象。

什么是 SNMP Trap

前面介绍的 get/set 操作都是从 NMS 发送到被管理设备的。但有时候，能够从被管理设备主动发送信息到 NMS 也是非常必要的。

SNMP Trap 是 SNMP 的一部分，当被监控段出现特定事件，可能是性能问题，甚至是网络设备接口宕掉等，代理端会给管理站发告警事件。假如在特定事件出现的时刻，不是由 Agent 主动通知 NMS，那么 NMS 必须不断地对 Agent 进行轮询。这是非常浪费计算资源的方法，正如人们用中断通知 CPU 数据的到达，而不是让 CPU 进行轮询一样。Trap 通知是更加合理的选择。

用一句话来说的话，SNMP Trap 就是被管理设备主动发送消息给 NMS 的一种机制。这是本文主要关注的话题。

NET-SNMP 简介

在 Linux 系统中，我们可以选择 net-snmp 来处理绝大多数和 SNMP 相关的工作。

NET-SNMP 是一种开放源代码的 SNMP 协议实现。它支持 SNMP v1, SNMP v2c 与 SNMP v3，并可以使用 IPV4 及 IPV6 。也包含 SNMP Trap 的所有相关实现。Net-snmp 包含了 snmp 实用程序集和完整的 snmp 开发库。

用户使用 net-snmp 提供的工具，可以完成很多关于 SNMP 的操作，具体说来，包括以下一些命令行应用程序：

一些应用程序可以用来从支持 SNMP 的设备获得数据。其中 snmpget, snmpgetnext 可以支持独立请求，比如：

% snmpget -v 1 -c demopublic test.net-snmp.org system.sysUpTime.0 
system.sysUpTime.0 = Timeticks: (586731977) 67 days, 21:48:39.77

该命令获得单个独立的 MIB 对象 system.sysUpTime.0 的值。

而 snmpwalk, snmptable, snmpdelta 则用来支持重复请求。

% snmpwalk -v 2c -c demopublic test.net-snmp.org system 
SNMPv2-MIB::sysDescr.0 = HP-UX net-snmp B.10.20 A 9000/715 
SNMPv2-MIB::sysObjectID.0 = OID: enterprises.ucdavis.ucdSnmpAgent.hpux10 
SNMPv2-MIB::sysUpTime.0 = Timeticks: (586998396) 67 days, 22:33:03.96 
SNMPv2-MIB::sysContact.0 = Wes Hardaker wjhardaker@ucdavis.edu 
SNMPv2-MIB::sysName.0 = net-snmp

上面的命令返回所有 system 节点以下的 MIB 对象的值。

命令 snmpset 对支持 SNMP 的设备配置属性。如下例所示：

$ snmpget -v 1 -c demopublic test.net-snmp.org ucdDemoPublicString.0 
 UCD-DEMO-MIB::ucdDemoPublicString.0 = "hi there!"
$ snmpset -v 1 -c demopublic test.net-snmp.org ucdDemoPublicString.0 s "Hello, world!"
 UCD-DEMO-MIB::ucdDemoPublicString.0 = "Hello, world!"
$ snmpget -v 1 -c demopublic test.net-snmp.org ucdDemoPublicString.0 
 UCD-DEMO-MIB::ucdDemoPublicString.0 = "Hello, world!"

命令 snmpdf, snmpnetstat, snmpstatus 可以从支持 SNMP 的设备获取特定的信息。比如下面的命令从目标系统上获得类似 netstat 的信息：

% snmpnetstat -v 2c -c public -a testhost 
 
Active Internet (tcp) Connections (including servers) 
Proto Local Address Foreign Address           (state) 
tcp   *.echo         *.*                      LISTEN 
tcp   *.discard      *.*                      LISTEN 
tcp   *.daytime      *.*                      LISTEN 
tcp   *.chargen      *.*                      LISTEN 
tcp   *.ftp          *.*                      LISTEN 
tcp   *.telnet       *.*                      LISTEN 
tcp   *.smtp         *.*                      LISTEN 
Active Internet (udp) Connections 
Proto Local Address 
udp    *.echo 
udp    *.discard 
udp    *.daytime 
udp    *.chargen 
udp    *.time

snmptranslate 命令将 MIB OIDs 的两种表现形式 ( 数字及文字 ) 相互转换。并显示 MIB 的内容与结构，如下所示：

% snmptranslate .1.3.6.1.2.1.1.3.0 
    SNMPv2-MIB::sysUpTime.0 
% snmptranslate -On SNMPv2-MIB::sysUpTime.0 
    .1.3.6.1.2.1.1.3.0

Net-snmp 还提供了一个基于 Tk/perl 的，图形化的 MIB 浏览器 tkmib。

图 2. Tkmib 界面

Net-snmp 还提供了接收 SNMP traps 的守护程序 snmptrapd。可以将选定的 SNMP 消息记录到系统日志 syslog,NT 事件日志，或者文本文件中。或是转发到其它的 SNMP 管理程序 , 也可以传给外部的应用程序。本文的后面我们将用它来演示 SNMP Trap 的收发。

Net-snmp 还提供了一个回应 SNMP 查询的客户端 snmpd. 它集成了大量 SNMP 的模块 . 并可通过动态链接库 , 外部脚本与命令 , 多路 SNMP 技术 (SMUX), 以及可扩客户端协议 (AgentX) 进行扩展 .

此外，net-snmp 还包含了用来开发 SNMP 应用程序的程序库。支持 C 与 perl 的 APIs。因此您可以使用 net-snmp 的工具集完成一些关于 SNMP 的工作，也可以依赖 net-snmp 提供的开发包自己写程序开发您所需要的 snmp 应用。

NET-SNMP 的安装

不同的 Linux 发行版有不同的包管理机制，因此在这里，我打算写下从源代码安装 net-snmp 的过程，适用于各种 Linux 发行版。

到 sourceforge网站下载适合的 net-snmp 版本，解压。

执行文件目录下的 configure 可执行文件，如果想指定程序包的安装路径，那么您首先建立相应的文件夹来存放安装信息，您可以写成 ./configure --prefix= 您指定的路径名。参数 --prefix 用来告诉系统安装信息存放的路径，如果您没有指定路径，直接执行 ./configure，那么程序包都会安装在系统默认的目录下，通常为：/usr/local 下。例如：

./configure --prefix=/usr/local/snmp // 配置指定安装目录，

在配置过程中需要进行一些简单的选择：

default version of-snmp-version: 2 
 
Systemcontact information（配置该设备的联系人）: yourname 
 
System location ( 该设备的位置 ): china 
 
Location to write logfile ( 日志文件位置 ): /var/log/snmpd.log 
 
Location to Write persistent( 数据存储目录 ): /var/net-snmp

之后编译并且安装：

#make && make install // 编译并且安装

Snmp Trap 的发送和接收演示

实验环境如图 4 所示。在测试机 M1 上启动 snmptrapd 进程，并且在 UDP 1162 端口上监听 SNMP Trap 信息，一旦收到 Trap，snmptrapd 将所接收到的 Trap 信息内容打印到一个本地的文本文件中。机器 M2 模拟发送 SNMP Trap 的设备，将调用 net-snmp 的命令行程序 snmptrap 发送一个 Trap。

图 4. SNMP Trap 实验环境

设计一个 Trap 消息

Trap 消息也是用 MIB 来定义的。在下面的例子中，我们定义了一个 Trap 消息：nodeDown

清单 1. Trap nodeDown 的 MIB 定义

nodeDown NOTIFICATION-TYPE 
   STATUS          current 
   DESCRIPTION     "node down notification"
::= { notification 1 }

nodeDown 被定义为 Notification 类型，即 SNMPv2 类型的 Trap。

受空间所限，这里无法贴出完整的 MIB 文件。感兴趣的读者可以参考本文的附件。图 5 给出了实验所用的完整 MIB 树：

图 5. 包含 Trap nodedown 的完整 MIB 树

NodeDown 对象位于 notification 节点下，子 OID 为 1。该 Trap 消息中我们打算包含两个数据对象：Host 名字和 IP 地址。Host 和 ip 位于 enterprises.sampleTest.data 分支下。

搭建接受 Trap 的 snmptrapd 进程

可以利用 Net-snmp 提供的 snmptrapd 应用程序作为后台 SNMP Trap 服务器，负责接收被管理设备发送过来的 Trap 消息。

在图 4 实验机 M1 的命令行窗口中输入以下命令：

snmptrapd – c mysnmptrad.conf udp:1622

该命令启动了一个 snmptrapd 进程，守候在 UDP 端口 1622 上，侦听 SNMP Trap 消息。-c 命令行指定了名为 mysnmptrapd.conf 的配置文件。文件内容如下：

$cat mysnmptrapd.conf 
traphandle default lognotify IBM-DW-SAMPLE::nodeDown 
authCommunity log,execute,net public

其中，以 traphandle 开头的一行定义了 snmptrapd 进程接收到 Trap 消息后应该执行的动作。在本例中，lognotify 是一个 shell 脚本，功能是将接收到的 Trap 信息写入文件 checkfile。

以 authCommunity 开头的一行配置了 snmptrapd 的安全设置，表示可以接收 community 为”public”的 SNMP Trap，并且本进程可以有 log，net 和 execute 的权限。

Log 权限表明收到 Trap 之后 snmptrapd 可以记录日志；execute 表明收到 Trap 之后可以执行 traphandle 中所指定的操作。Net 表示 snmptrapd 可以将接收到的 Trap 信息转发到其他的 Receiver 去。（假如需要转发，还需要对给定的 OID 指定以 forward 为开始的处理细节：forward OID|default DESTINATION）

脚本 lognotify 代码如下：

清单 2. Lognotify 脚本

$cat lognotify 
#!/bin/sh 
 
read host 
read ip 
vars= 
 
while read oid val 
do 
  if [ "$vars" = "" ] 
  then 
    vars="$oid = $val"
  else 
    vars="$vars, $oid = $val"
  fi 
done 
 
echo trap: $1 $host $ip $vars >checkfile

使用 snmptrap 发送 SNMP Trap

可以用命令 snmptrap 在测试机 M2 上发送一个 SNMP Trap。假定 Trap 定义在文件 sample-trap.mib 中。在测试机 M2 上输入以下命令：

snmptrap -m ./sample- trap.mib  -v 2c -c public 16.157.76.227:1622  
"" IBM-DW-SAMPLE::nodeDown     IBM-DW-SAMPLE::nodeDown.1 s "M1"

您在试验的时候，将 IP 地址替换为 M1 的真实 IP 地址即可。在上面的例子命令中我们只设置了 Trap nodeDown 消息中的 host 信息。其 OID 为 IBM-DW-SAMPLE::nodeDown.1。字母 s 表示该 OID 的类型为 string。“M1”为该 OID 变量的值。

打开文件 checkfile，应该能够看到如下信息：

Trap: IBM-DW-SAMPLE::nodeDown <UNKNOWN> UDP: [16.157.76.221]: 
 54329->[16.157.76.227]:1622 DISMAN-EVENT-MIB::sysUpTimeInstance= 
 5:2:22:26.99, SNMPv2-MIB::snmpTrapOID.0 = SNMPv2-SMI:: 
 enterprises.10234.100.1 SNMPv2-SMI::enterprises.10234.100.1.1 = 
“M1”

还不错，这表示我们已经能够用 snmptrap 发送 Trap；并且能够使用 snmptrapd 来接收 Trap 消息了。

此例虽然简单，但却是 SNMP Trap 的典型应用。实际生产环境中的 SNMP Trap 应用的基本模型和本例是类似的。

此外，有的时候，我们可能不仅需要 net-snmp 所提供的现成工具，还需要在自己开发的应用程序中编码发送 Trap。Net-snmp 不仅提供了现成的工具，也提供了开发库，下面我们来看看如何在 C 程序中调用 net-snmp 的库函数进行 SNMP Trap 的开发吧。

C 语言直接调用 API 进行 SNMP Trap 处理

C/C++ 依旧是很多系统必须的编程语言，当您的 C/C++ 程序需要发送 SNMP Trap 时，便可以考虑使用 net-snmp 提供的 SNMP 库函数来实现。

所需要的头文件

为了使用 netsnmp 的 API，必须 include 以下这些头文件：

#include <net-snmp/net-snmp-config.h> 
#include <net-snmp/net-snmp-includes.h>

初始化

在使用 netsnmp 库之前，先要做一些必要的初始化工作。函数 init_snmp 初始化 SNMP Library。假如在调用 init_snmp 函数时指定了文件名，init_snmp 函数将读取配置文件，设置诸如 Access Control 等具体配置。否则会使用默认的 /etc 下面的配置文件。

初始化 SNMP 库之后，我们就可以打开一个会话 session。此后所有和 NMS 的信息交互都在该 session 内进行，因为可能在同一台机器上运行多个 SNMP 进程，每个进程都需要自己独立的 session 来和 NMS 进行信息交互。

调用函数 snmp_sess_init 成功后将返回一个 session 数据结构。我们用该数据结构来设置 session 的属性，比如 peer 的 IP 信息。

这里 peer 就是图 2 中的 M2，在我本人的试验环境下，该机器的 IP 地址为 16.157.76.227。因此在下面的代码中，我将 peername 设置为 16.157.76.227。

还可以设置其它的必要信息，比如 Community，即用于 SNMP 安全的社区设置，前面 snmptrapd 设置为 public，因此这里也设置为 public。这类似于通行密码，不过安全性的确比较弱。

Session 属性设置好之后便可以使用函数 snmp_open 打开 session。示例代码如下。

清单 3. 代码最大长度示例

init_snmp("myexample"); 
struct snmp_session session；
snmp_sess_init(&session); 
session.version = SNMP_VERSION_2c; 
strcpy(peername,"16.157.76.227:1622"); 
strcpy(commu,"public"); 
session.peername = peername; 
session.community = (unsigned char*)commu; 
session.community_len = strlen(commu); 
ss = snmp_open(&session);

打开一个会话之后，程序可以通过该会话发送 Trap 给 NMS，也可以从 NMS 接受 SNMP get/set 操作。

创建 pdu，发送 Trap

每个 Trap 都由 PDU 承载，PDU 有固定的格式。为了简化描述，本文只描述 SNMPv2 的 Trap 发送方法。SNMP v2c 和 v1 的 Trap 有所不同。请阅读参考文献了解这些不同的细节，此外本文的附件代码中也实现了 v1 的支持代码。SNMPv2 的 Trap PDU 定义如下：

图 3. SNMP Trap PDU 格式

其中各个组成部分的解释如下： sysUpTime– 被管理设备上一次初始化网络到本 Trap 发送以来的累积时间。 snmpTrapOID– 表示本 PDU 是一个 Trap，有固定的值。对于一般的 Trap，RFC1907 给出了通用的定义。用户自定义的 Trap 通常是由以下几个部分连接而成：SNMPv1 Enterprise parameter + '0' + SNMPv1 Specific trap code。 VarBindList– 变量列表，所谓变量就是 Trap 消息中所携带的信息单元。

下面的代码片断用来填充如图三所示的一个 PDU。

oid objid_sysuptime[] = { 1, 3, 6, 1, 2, 1, 1, 3, 0 }; 
 oid objid_snmptrap[] = { 1, 3, 6, 1, 6, 3, 1, 1, 4, 1, 0 }; 
 netsnmp_pdu * pdu = NULL; 
 oid tmpOID[MAX_OID_LEN]; 
 size_t tmpOID_len; 
 in_addr_t addr; 
 
 pdu = snmp_pdu_create(SNMP_MSG_TRAP2); 
 long sysuptime; 
 char tempbuf[128]; 
 memset(tempbuf,128,0); 
 sprintf(tempbuf,"%ld",sysuptime); 
 sysuptime = get_uptime(); 
 oid tmpOID[MAX_OID_LEN]; 
 size_t tmpOID_len; 
 tmpOID_len = MAX_OID_LEN; 
 if(!snmp_parse_oid(TRAP_NAME_1, tmpOID, &tmpOID_len)) 
snmp_error(“snmp_parse_oid”); 
 snmp_add_var(pdu, objid_sysuptime, sizeof(objid_sysuptime)/sizeof(oid), 't', tempbuf); 
 snmp_add_var(pdu, objid_snmptrap, sizeof(objid_snmptrap)/sizeof(oid),'o', 
              “IBM-DW-SAMPLE::nodeDown”);

首先调用函数 snmp_pdu_create 创建一个 SNMPv2 的 Trap PDU。然后调用 snmp_add_var 向该 PDU 中添加图三所示的三个部分。 sysUpTime 在 SNMPv2-MIB 中定义，其 OID 为”1.3.6.1.2.1.1.3.0”。我们只需要通过 get_uptime() 函数获得该值，然后调用 snmp_add_var 将该变量加入刚才创建的 PDU 中。

同理，snmpTrapOID 也是固定的 :” 1.3.6.1.6.3.1.1.4.1.0”。同样利用 snmp_add_var 函数将我们定义的 OID 为“IBM-DW-SAMPLE::nodeDown”的 Trap 加入该 PDU。稍稍留意一下，您应该可以发现，sysUpTime 的类型为't'，即 timestamp；而 snmpTrapOID 的类型为’ o ’，即 OID 类型。PDU 内的每一个元素都拥有自己的类型。在该 Trap 中，我们还打算携带两个变量：IBM-DW-SAMPLE::host 和 IBM-DW-SAMPLE::ip。表示一些真正有趣的信息。添加这两个变量的代码如下所示：

HP-DW-SAMPLE::ip",varId,&varIdLen)) 
    { 
      snmp_perror("ip"); 
    } 
    else 
    { 
       printf("Success snmp_parse_oid
"); 
       snmp_add_var(pdu, varId, sizeof(varId)/sizeof(oid),'s',"2.2.2.2"); 
    } 
    if(!snmp_parse_oid("HP-DW-SAMPLE::host",varId,&varIdLen)) 
    { 
      snmp_perror("host"); 
    } 
    else 
    { 
       retv =  snmp_add_var(pdu, varId, sizeof(varId)/sizeof(oid),'s',”M1”); 
 }

用 snmp_parse_oid 解析相应变量的 OID，然后就可以调用 snmp_add_var 将您想设置的值加入 PDU 中了。假如您直接在代码中使用”HP-DW-SAMPLE::ip”的 OID，（即 1.3.6.1.4.1.10234.10.2），那么可以不需要调用 snmp_parse_oid。该函数只是把一个好记的字符串翻译为一串数字的 OID。不过这就好比用 16.157.1.2 而不使用 www.ibm.com 一样。

至此，一个 SNMP Trap PDU 就创建成功了。将该 PDU 发送出去即可：

if( !snmp_send(sptr, pdu) ) 
{ 
  snmp_error("Send pdu error 
"); 
}

结束清理

程序结束之前需要做清理工作，代码如下：

snmp_close(sptr); 
snmp_shutdown( "myexample" ); 
SOCK_CLEANUP;

一个基本的 SNMP Trap 发送程序就这样完成了。我们在 M1 上编译运行它：

-bash-3.2$ gcc -o t1 snmptrap.c – lnetsnmp 
-bash-3.2$ ./t1

在 M2 上查看 checkfile，可以验证所收到的 Trap 消息的内容。假如您能看到该文件中正确的内容，那么恭喜您，您已经拥有了编程发送 SNMP Trap 的能力了。

结束语

虽然 SNMP 叫做简单网络管理协议，但似乎并不简单，甚至可以说十分复杂，本文只关注 Trap 的相关概念和编程方法，却也只能走马观花地说个皮毛，还是完全的实用主义。于我而言，这点儿皮毛便可以让我交代手头的工作任务了，但一个有理想的程序员或许会仅将本文当作一个起点，坚定不移地继续深入地了解更多 SNMP 的知识吧。