银行 Zabbix 监控架构

【导读】某银行 Zabbix 系统经过两年多发展,从小范围试用逐步扩展到涵盖硬件、应用、平台、业务等更大范围的场景,架构上从单数据中心进化为三中心的分布式部署。除了逐渐替代旧的监控系统,越来越多的第三方系统也开始对接起了 Zabbix,通过 API 或者数据库抽数的方式,使用海量的运维监控数据实现智能运维的工作模式。本文从架构部署、监控维度、自动化方案、运营管理层面,分享 Zabbix 在银行应用的实践经验,希望对广大同行有所帮助。

Zabbix 平台概述

平台介绍

Zabbix 是一个基于 Web 界面提供分布式系统监视及网络监视功能的企业级开源解决方案。它能监视各种网络参数,保证服务器系统的安全运营,并提供灵活的通知机制以让系统管理员快速定位、解决存在的各种问题,借助Zabbix 可很轻松地减轻运维人员繁重的服务器管理任务,保证业务系统持续运行。其后端使用数据库存储监控配置和历史数据,可以非常方便地对接数据分析、报表定制等渠道,在前端开放了丰富的 RESTful API 供第三方平台调用,整体架构在当下的 DevOps 的趋势下显得非常亮眼。

选型过程

我们于 2017 年开始接触 Zabbix,之前运维内主要使用的监控系统是 Nagios,但 Nagios 的页面展示、监控配置、自动化等各项功能对基础架构的运维人员来说不是特别友好,而风头正劲的 Zabbix 正好引起了我们的注意。基础架构的运维工作中,需要面对各种各样的监控场景,例如 PC 服务器的故障灯巡检、存储设备的阵列健康判断、小型机 LPAR 的资源监控、操作系统的多路径检查,等等。而 Zabbix 内置提供了 SNMP、IMPI、SSH

猜你喜欢

转载自blog.csdn.net/weixin_70923796/article/details/130469948