zabbix使用之常用功能使用心得

ZABBIX 使用

Written by: Jane.Hoo

1.zabbix监控概念介绍

项目(iterm)定义收集被监控的数据项,如收集被监控机内存使用情况

应用集(application)一些项目的汇总,目录与文件的关系

触发器(trigger)通过项目获得的数据或通过计算来判断主机状态的定义

图形(graph)通过项目获得数据,以图形方式展示

模板(template)可将项目,集合,触发器,图形汇总为一个模板,直接连接到一类主机,实现批量定义

主机(host)被监控对象,服务器或其他网络设备

主机组(host group)一类主机可以定义到一个主机组

动作(action)触发器,自动发现或自动注册状态改变触发的动作

自动发现(discovery)通过定义自动发现条件,配合动作批量加监控主机

维护(maintenace)定义主机什么时候处于维护状态

拓扑图(map)可以绘画出主机的拓扑

屏幕(screen)多种类型显示到一个screen里

IT服务(IT service)有时一台主机宕掉可能不会影响服务,IT服务定义服务容忍额限度

仪表盘(dashboard)监控的整体状态显示

总览(overview)显示所有的机器的数据或者触发器状态

web:通过定义场景监控web服务器

最新数据(last data)可查看主机项目获得的最新数据

事件(event)触发器状态改变的记录

报表(reports)创建事件报表

资产记录(Inventory)可以记录相关服务器的硬件信息等

告警类型(media types)定义相关告警方式

2.configuration

 2.1 Host groups         

Host groups、主机组,是主机的一个集合,定义主机组所包含的模板及主机列表。

注意点:1、建主机链接到主机组后,可以继承主机组所包含的所有模板;

            2、一个主机可以隶属于多个主机组;

            3、组名必须唯一,不得与其它组名重复;

            4、新建的组允许不包含任何模板和主机;

            5、zabbix内置的主机组不允许删除;

            6、建议根据应用模块划分主机组;

2.2 Templates

Templates 模板,一系列监控项、触发器、图、场景的集合

注意点:

1、  模板定义的时候可以定义此模板应用到哪些主机主和模板;模板修改后,对应的主机监控项目也会改变;

2、  模板定义时可以嵌套模板,嵌套模板是一个继承的关系,会继承被嵌套模板的所有子项;

3、   如果模板间有相互冲突的项目(使相同键值的项目),做相互关联或一同应用到同一主机的时候,报错。

4、  模板可以克隆,只需修改模板名称就可以在其基础上做修改,很快地完成一个新模板;完全克隆,比clone多一点东西,例如screen;

5、  Delete:删除模板,如果主机有嵌套当前模板,那么item依旧保留在主机上,主机不受影响;

6、  Delete and clear:删除模板,如果主机有嵌套当前模板,那么item也会被删除掉;

7、  模板可以外部导入也可以内部新建; 

2.3 Hosts

Hosts是zabbix监控的基本载体,所有监控项目都是基于hosts的。

注意点:1、主机可以外部导入也可以内部新建;

            2、主机名(hostname)不允许重复,由字母、下划线、数字,标点符号组成,必须和客户端配置文件中的hostname保持一致;

            3、unlink:取消和模板的关联,但是已有的监控项目不会删除;

            4、unlink and clear: 取消和模板的关联并删除已有的监控项目;

            5、hostname必须与客户端配置文件内的hostname一致。
            但也可以通过在服务器端的/etc/hosts文件里添加对应的ip 主机名配置,实现即使和客户端hostname不一致也不影响监控,但此时hostname必须和服务器端/etc/hosts中的hostname保持一致。

2.3.1 Items

Items可以在单台机器上添加,也可以在templates上面添加,然后再通过模板连接到主机上。定义Items需要先定义key。

在zabbix agentd端查看配置文件zabbix_agentd.conf查看记录,如:

include=/usr/local/zabbix/etc/zabbix_agentd.conf.d/

修改对应目录下的参数定义文件:

----------------------------------------------------------------------------

|   key的格式为:UserParameter=,

|   key的组成:数字、字母、下划线

|   传递参数UserParameter=wc[*],grep -c "$2" $1

|     zabbix_get -s 127.0.0.1 -k wc[/etc/passwd,root]

----------------------------------------------------------------------------

UserParameter=count.line.passwd,wc -l /etc/passwd|awk '{print $1}'

修改配置文件后,需要重启客户端:

service zabbix_agentd restart

key创建成功后,通过如下命令来检测:

zabbix_get -s 127.0.0.1 -k count.line.passwd

注意:1、可以定义该值得更新频率(upate interval)、历史数据保留天数,整体变化趋势保留时间段;

          2、定义完成后,点击status启动/禁用该监控项;         

2.3.2 Triggers

Triggers是触发器,当Items采集值满足trigger触发条件时,就会产生actions。每一个trigger必须对应一个trigger,但一个item可以对应多个trigger。通过设置多个trigger,实现触发条件不同,达到不同级别的告警。

         Expression:选择对应的item、触发方式及触发值

                     ---------------------------------------------------------------------------

                     |   last value 最近一次采集

                     |   maximal value for period of time:一段时间内的最大值

                     | sum(600) 600秒内所有值的和

                     | sum(#5)  最近5秒值得和  //可以用#表示一个变量有不同的意思

                     | last(#5)  返回第5个值

                     |avg,count,last,minand max 支持在某个时间段之前的。avg(1h,1d),

                     | 表示1小时之前的1天的平均值

                     | 触发器表达式中支持单位符号,5m(分钟)代替300s(秒)

                ----------------------------------------------------------------------------

         severity:告警级别

         注意:1、引用自template的trigger触发值是不能单独修改的,必须在template中修改,或是复制一个同样的trigger再修改,然后禁用掉之前的。

2.3.3 Graphs

新建图表选项的各项参数说明:

Items属性展示:          

在创建图表的过程中,我们可以随时预览修改的配置图表,点击标签preview即可。备注:如果是template预览时没有意义的,毕竟没有任何数据。关于触发器限制:如果图表的高度小于120像素,那么图标上将不会展示触发器相关信息。

2.4 web

web monitoring 是用来监控web程序的,可以监控到web程序的下载速度、返回码及响应时间,还支持一组连续的web动作作为一个整体来监控。

scenaria:必须选择host后才能创建,zabbix的所有items都必须创建在hosts上

Application:选择这个scenario所在的application组

Name:   scenario(方案)的名字

status:   默认为active

variables: 变量定义,这里定义的变量可以在后续的steps中使用

steps: web程序的各个步骤,选择add新增一个Login的step,来模拟用户登录

         URL:监控的web页面

         POST:传递给页面的参数,多个参数用&相连

         Timeout:超时时间

         Required:页面中能匹配到字符,匹配不到即认为错误

         Status codes:页面返回码

定义完成后,就可以在web页面看到监控的状态和图示,可以给对应的scenaria建立对应的触发器

2.4 Actions

action是告警动作,当触发器条件被满足时,就会执行指定的action

action支持如下事件:触发器事件、发现事件、自动注册时间、内部事件

action的conditions配置:

   ----------------------------------------------------------------------------------------

   |       Type of calculation:各种条件之间的关系

   |        condition:机器不在维护状态

   |                   触发器状态为problems

   |   new condition:可以定位到某个、某些或全部触发器

   ----------------------------------------------------------------------------------------

action的operations配置:        

2.5 Medias

    一般使用scripts媒介,可以实现邮件、微信、短信告警方式

2.6 Users

         创建用户时可以根据用户的不同作用划分到不同的组,media中天入告警接受地址及告警接受时间等信息。

user:  用户姓名、所属组别、密码、语言集、每页显示行数及首页设置

media:一个用户可以有多个媒介,接收地址,接收时间段,状态

permissions: 对应主机组、主机、模板的读写权限 

2.6 Screens

将多种信息放在一起展示,便于集中展示某个host的多个信息,或者比较多个host的同一种信息。这些信息可以是graphs、maps、server infos等等,几乎涵盖zabbix所有的监控信息。

         选择建立几行几列的screens

         点击change,添加响应信息,设置对齐方式

2.7 Maps

添加关于主机的拓扑图,configuration-maps,在右上角可以create maps或者import map

创建图中的+-可以增加主机,link说明主机的连接 情况。

2.8 Discovery

通过zabbix的discovery功能自动添加主机并附加相应模版到制定的主机组内

http://blog.chinaunix.net/uid-26204366-id-4318443.html

本文转载自:http://blog.itpub.net/30109892/viewspace-1815185/

猜你喜欢

转载自www.cnblogs.com/momoyan/p/9163175.html
今日推荐