集群监控

其他 2018-07-08 21:33:39 阅读次数: 0

监控指标

1、load

　　load表示在特定时间间隔内运行队列中的线程数，每个CPU核维护着一个运行队列，队列中的线程数越多，意味着cpu越繁忙。一般一个队列维护的线程数不大于3表示cpu运行正常，如果大于5表明cpu运行超负荷。查看load指标的指令为uptime

2、cpu使用率

　　通过top指令来查看cpu的使用率

3、trafic

　　可以通过sar指令查看每个节点的trafic状态。指令为：sar -n DEV 1 1。n表示汇报网络状态，DEV表示查看各个网卡的网络流量，第一个1表示每一秒抽样一次，第二个1表示总共抽样一次。

4、磁盘I/O

　　对于数据库应用和分布式文件存储系统，I/O指标在一定程度上反映了服务的繁忙程度，IO查看指令为：iostat -d -k。

5、内存使用

　　free -g指令查看系统内存。total表示物理内存。剩余内存的计算方式为free=free+buffers+cached。使用内存used=used-buffers-cached。对于应用来说更应该关注的是swap，swap消耗过多表示物理内存已经不够用了。因为如果内存不够，部分数据会从内存转到磁盘，以腾出足够的空间给当前进程。内存越不够用，内存与磁盘的交换越频繁，swap使用越高。

心跳检测

1、ping

　　ping指令可以查看地址的响应数据。

2、应用层检测

　　通过curl指令可以访问应用层预留的自检url，通过响应数据来感知应用的健康状态，一旦响应超时或者无响应可以输出报警信息。

猜你喜欢

转载自www.cnblogs.com/youzhongmin/p/9280861.html

集群监控

监控集群

【etcd集群监控】prometheus监控etcd集群

Hystrix集群及集群监控turbine

redismon监控redis集群

netdata集群监控

elasticsearch集群搭建与监控

监控hbase集群

springcloud turbine集群监控

Server集群的监控方案

ganglia集群监控

Kubernetes集群监控

用 Heapster 监控集群

zabbix集群监控

Riak集群监控详解

MySQL Galera集群监控

Turbine集群监控

Redis集群监控方法

hadoop集群监控总结

Kubernetes集群资源监控

Kubernetes集群监控详解

mongo集群的监控（一）

熔断监控集群（Turbine）

Prometheus 监控 Redis 集群

Hystrix集群及监控turbine

Hbase集群监控

ZABBIX监控vcenter集群

clickhouse（七、集群监控）

Kubernetes 集群的监控方案

zabbix 监控ceph集群

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)