직접 배포 구성 파일에
도커-compose.yml
버전 : '3'
네트워크 :
모니터 :
드라이버 : 브리지
서비스 :
프로 메테우스 :
이미지 : 무도회 / 프로 메테우스
CONTAINER_NAME : 프로 메테우스
호스트 이름 : 프로 메테우스의
재시작 : 항상
볼륨 :
- /data/monitor/prometheus.yml:/etc/prometheus/prometheus.yml
- / 데이터 / 모니터 / prom_db : / 프로 메테우스
- / 데이터 / 모니터 / prom_rules :은 / etc / 프로 메테우스 / 규칙
포트 :
- "9090 : 9090"
네트워크 :
- 모니터
grafana :
이미지 : grafana / grafana
CONTAINER_NAME : grafana의
호스트 이름 : grafana의
재시작 : 항상
볼륨 :
- / 데이터 / 모니터 / ga_data 경우 : / var / lib 디렉토리 / grafana의
환경 :
- GF_SECURITY_ADMIN_PASSWORD = 관리자 @ 123
포트 :
- "3000 : 3000"
네트워크 :
- 모니터
노드 - 수출 :
이미지 : quay.io/prometheus/node-exporter
CONTAINER_NAME : 노드 수출
호스트 이름 : 노드 수출
재시작 : 항상
포트 :
- "9100 : 9100"
네트워크 :
- 모니터
alertmanager :
이미지 : 무도회 / alertmanager
CONTAINER_NAME : alertmanager의
볼륨 :
- /data/monitor/alertmanager.yml:/etc/alertmanager /alertmanager.yml
포트 :
- "9093 : 9093"
다시 시작 : 항상
네트워크 :
- 모니터
promethues.yml
글로벌 :
scrape_interval : 60 년대는
evaluation_interval : 60 년대
scrape_configs을 :
- 작업 이름을 : 무도회 서버
static_configs를 :
- 대상 : [ '로컬 호스트 : 9090']
레이블 :
인스턴스 : 프로 메테우스
- 작업 이름을 "node_exporter"
static_configs을 :
- 대상 :
- 로컬 호스트 : 9100
경고 :
alertmanagers :
- static_configs :
- 대상 : "loclhost : 9093"]
rule_files :
- /etc/prometheus/rules/rules.yml
alertmanager.yml
글로벌 :
smtp_smarthost : 'smtp.126.com:25'
smtp_from '[email protected]'
smtp_auth_username 'XXXXX'
smtp_auth_password 'XXXXX'
smtp_require_tls : 거짓
수신기 :
- 이름 : 기본적으로 수신기
email_configs :
-에 "battlescars @ qq.com "
require_tls : 거짓
send_resolved : 진정한
경로 :
GROUP_BY : [ 'alertname', '클러스터', '서비스']
group_wait : 10 초는
group_interval : 5m
수신기를 기본적-수신기
REPEAT_INTERVAL을 : 3 시간
rule.yml
그룹 :
- 이름 : 응답 규칙
규칙 :
- 경고 : NodeDiskUsageException의
EXPR :. (1 - (node_filesystem_free_bytes {마운트 포인트 = ~ "/ | / 로그 | 백업 / | / 홈"} / node_filesystem_size_bytes {마운트 포인트 = ~ "/ | / 로그 | 백업 / | / 홈 "})) * 100> 75
레이블 :
ai_mon : 노드
주석 :
설명 : 서버 {{$ labels.instance}} 등의 점유 공간이 디스크의 {{$ labels.device}} 비율 {{$ 값}} 임계 값 75보다 %% 큰
과도한 디스크 사용량 : 요약