zabbix实战——监测路由器、IP监测及常见异常排错处理
前面一篇文章介绍了zabbix是干嘛的以及zabbix的基本搭建过程,接下来是zabbix的实战篇。
一、基本概念介绍
我相信大家在搜索如何通过zabbix监测路由器等网络设备时,会有很多文章可以参考,但是比起直接按照文章傻瓜式操作,对于我个人而言,觉得还是得先明白一些基本概念比较好,这样对于加深你对于整个过程的理解。所以在实战之前,先简单介绍一些基本概念。
- SNMP
SNMP协议又称简单网络管理协议(Simple Network Manage Protocol),该协议是专门设计在用于IP网络管理节点的一种标准协议,是一种应用层协议。我的理解就是为了方便统一管理而设立的一种协议,通过SNMP协议达成不同设备的网络管理。
而且目前SNMP分为 SNMPV1 、 SNMPV2 、 SNMPV3三种,就是越来越增强,V2比V1增强了,V3就是包含了更多的安全和远程配置,而且目前为了兼容不同版本,所以目前还是都是共存的。 - OID
OID也称一般对象标识符,是用来无歧义唯一标识一个对象的值,可以保证对象在通信信息处理过程中正确定位和管理。可以理解成设备的“身份证”?每个网络设备都有唯一的OID。 - 模板
模板是zabbix的核心,因为模板集成了所有要监控的内容以及展示的图形等等,zabbix的安装部署完成后,自带了很多模板(网络设备模板、操作系统模板、常见应用软件模板),一般我们所需要监测的利用模板就可以了。下面介绍三类模板。
监控系统的模板
Template OS Linux #对linux系统的监控模板
Template OS Windows #对Windows系统的监控模板
Template OS Mac OS X #对Mac OS X系统的监控模板
Template VM VMware #对VM VMware系统的监控模板
监控网络和网络设备的模板
Template Module Generic SNMPv1 #开启SNMPv1监控的模板
Template Module Generic SNMPv2 #开启SNMPv2监控的模板
Template Module Interfaces Simple SNMPv2
Template Net Cisco IOS SNMPv2
Template Net Juniper SNMPv2
Template Net Huawei VRP SNMPv2
监控应用软件和服务的模板
Template App HTTP Service #对HTTPD服务的监控模板
Template DB MySQL #对MySQL服务的监控模板
Template App SSH Service #对SSH服务的监控模板
Template Module ICMP Ping #对主机Ping的监控模板
Template App Generic Java JMX #对Java服务的监控模板
Template App Zabbix Agent #对Zabbix Agent状态的监控模板
Template App Zabbix Server #对Zabbix Server状态的监控模板
这些模板都是需要我们能够灵活掌握的,也是做监控的基础。
- 应用集
应用集就是一个模板中,针对一类监控项的集合。 - 监控项及触发器
监控项是zabbix监控的基础,默认的模板下都存在了很多监控项,每个监控项都对应一个键值,就是具体要监控的内容,用户 可以自定义,但是需要遵循zabbix的书写规范。如果,一个监控项需要添加告警的话,就可以添加一个触发器,触发器就是专门用来触发告警的。
二、监控路由器
上面简单介绍完一些基本概念之后,你也对zabbix有一个基本的了解了,接下来监控一下路由器,本次实践检测的是H3C的路由器,其他的也是同理的。
- 在zabbix服务端安装snmp工具
yum -y install net-snmp-utils net-snmp-libs net-snmp-devel net-snmp
- 检测与路由器的连通性
snmpwalk -v 2c -c public 192.168.48.11
snmpwalk基本用法:
snmpwalk -v 1或2 -c SNMP读密码 IP地址 OID(非必填)
-v :后面跟snmp协议号,上面有提到有3种,确认一下路由器是那个填进去就行
-c:指定连接设备的SNMP读密码,默认是public
IP:需要监测的路由器的IP号
OID:代表要获取设备的指标OID。
如果是联通的,会显示出很多设备信息;如果不通的话,可以看最后的问题处理。 - 添加zabbix监测主机,用SNMP协议进行监控
把主机名称,群组和Interfaces一一填好,这里有个坑,就是它默认是客户端,你需要移除后,再选择SNMP添加
模板选择
Template Module Interfaces Simple SNMP
这些都配置好之后,点击更新即可。
这里也有一个坑,就是我添加完之后一直SNMP那个绿灯一直没亮,我就一直在网上找原因,结果过了一阵子,它就好了,所以你添加完之后,如果一些没问题的话,需要耐心等待一会儿,大概10分钟左右。
然后就能在监测,主机那里看到路由器的情况了。
三、监测IP设备
我目前的应用场景是,一些开启了SNMP协议的路由器就加入监测,然后还有另外一些路由器,只是需要查看它ping包的丢失率和响应时间就行,那么就需要加入IP的监测。
- 安装fping服务
如果没有安装fping的话,使用该监测ping的模块的服务端会报错,所以要先在服务端装好fping。可以使用find / -name fping*
看看你电脑有没有装过fping。
我这边是装了fping了,所以具体过程就不再撰述了。主要是用/usr/sbin/fping IP
测试你的IP是否通,如果显示
则证明可以进行监测了。
- 填写信息
按照下面的模板填写就行,也是分别填入主机名称,群组和客户端IP,端口默认就行。
模板选择
更新就行了,最后在监测那里查询就可以了。
四、常见异常排错处理
这里直接贴一个我在其他贴看到的吧,涵盖了很多常见的错误。
https://blog.csdn.net/weixin_43631631/article/details/107043397