Prometheus监控服务器内存监控

Prometheus监控服务器内存监控

异常现象

监控的centos7使用Prometheus2.5的node_exporter1.6一直收到微信告警信息如下:

然后登陆服务器查询,执行命令free -m,信息如下:

发现:告警信息和实际服务器信息不一致;

处理过程

查询PromQL公式:

ceil(100 - (((node_memory_MemFree_bytes{
    
    job="gtcq-gt-devops-node-exporter"} + node_memory_Buffers_bytes{
    
    job="gtcq-gt-devops-node-exporter"} + node_memory_Cached_bytes{
    
    job="gtcq-gt-devops-node-exporter"}) / node_memory_MemTotal_bytes{
    
    job="gtcq-gt-devops-node-exporter"}) * 100)) > 90

说明:经过验证,以上的PromQL公式不适用于centos7,此公式验证适用于centos6;

修改公式

修改公式如下,查询PromQL公式:

ceil((1 - (node_memory_MemAvailable_bytes{
    
    job="gtcq-gt-devops-node-exporter"} / (node_memory_MemTotal_bytes{
    
    job="gtcq-gt-devops-node-exporter"}))) * 100) >90 

说明:这个公式和服务器实际数据还是有些出入,但已经比较接近了,希望有更精准的监控公式可以留言;

猜你喜欢

转载自blog.csdn.net/qq_31555951/article/details/109068097