메테우스 + + Alertmanager Grafana 컴포넌트 배치 용기 모니터링

직접 배포 구성 파일에

도커-compose.yml

버전 : '3' 

네트워크 : 
 모니터 : 
  드라이버 : 브리지 

서비스 : 
 프로 메테우스 : 
   이미지 : 무도회 / 프로 메테우스 
   CONTAINER_NAME : 프로 메테우스 
   호스트 이름 : 프로 메테우스의 
   재시작 : 항상 
   볼륨 : 
     - /data/monitor/prometheus.yml:/etc/prometheus/prometheus.yml 
     - / 데이터 / 모니터 / prom_db : / 프로 메테우스 
     - / 데이터 / 모니터 / prom_rules :은 / etc / 프로 메테우스 / 규칙 
   포트 : 
     - "9090 : 9090" 
   네트워크 : 
     - 모니터 

 grafana : 
   이미지 : grafana / grafana 
   CONTAINER_NAME : grafana의 
   호스트 이름 : grafana의 
   재시작 : 항상 
   볼륨 :
     - / 데이터 / 모니터 / ga_data 경우 : / var / lib 디렉토리 / grafana의 
   환경 : 
     - GF_SECURITY_ADMIN_PASSWORD = 관리자 @ 123 
   포트 : 
     - "3000 : 3000" 
   네트워크 : 
     - 모니터 
 노드 - 수출 : 
  이미지 : quay.io/prometheus/node-exporter 
  CONTAINER_NAME : 노드 수출 
  호스트 이름 : 노드 수출 
  재시작 : 항상 
  포트 : 
    - "9100 : 9100" 
  네트워크 : 
    - 모니터 

 alertmanager : 
   이미지 : 무도회 / alertmanager 
   CONTAINER_NAME : alertmanager의 
   볼륨 : 
     - /data/monitor/alertmanager.yml:/etc/alertmanager /alertmanager.yml 
   포트 : 
     - "9093 : 9093"
   다시 시작 : 항상 
   네트워크 : 
     - 모니터

promethues.yml

글로벌 : 
  scrape_interval : 60 년대는 
  evaluation_interval : 60 년대 
scrape_configs을 : 
  - 작업 이름을 : 무도회 서버 
    static_configs를 : 
      - 대상 : [ '로컬 호스트 : 9090'] 
        레이블 : 
          인스턴스 : 프로 메테우스 
  - 작업 이름을 "node_exporter" 
    static_configs을 : 
      - 대상 : 
        - 로컬 호스트 : 9100 
경고 : 
  alertmanagers : 
  - static_configs : 
    - 대상 : "loclhost : 9093"] 
rule_files : 
  - /etc/prometheus/rules/rules.yml

alertmanager.yml

글로벌 : 
  smtp_smarthost : 'smtp.126.com:25' 
  smtp_from '[email protected]' 
  smtp_auth_username 'XXXXX' 
  smtp_auth_password 'XXXXX' 
  smtp_require_tls : 거짓 
수신기 : 
  - 이름 : 기본적으로 수신기 
    email_configs : 
    -에 "battlescars @ qq.com " 
      require_tls : 거짓 
      send_resolved : 진정한 
경로 : 
  GROUP_BY : [ 'alertname', '클러스터', '서비스'] 
  group_wait : 10 초는 
  group_interval : 5m 
  수신기를 기본적-수신기 
  REPEAT_INTERVAL을 : 3 시간

rule.yml

그룹 : 
  - 이름 : 응답 규칙 
    규칙 : 
    - 경고 : NodeDiskUsageException의 
      EXPR :. (1 - (node_filesystem_free_bytes {마운트 포인트 = ~ "/ | / 로그 | 백업 / | / 홈"} / node_filesystem_size_bytes {마운트 포인트 = ~ "/ | / 로그 | 백업 / | / 홈 "})) * 100> 75 
      레이블 : 
        ai_mon : 노드 
      주석 : 
        설명 : 서버 {{$ labels.instance}} 등의 점유 공간이 디스크의 {{$ labels.device}} 비율 {{$ 값}} 임계 값 75보다 %% 큰 
        과도한 디스크 사용량 : 요약

추천

출처www.cnblogs.com/battlescars/p/prometheus_deployment.html