CCE 서비스 상세 설명 : 원스톱 알람 구성 및 클라우드 네이티브 로그 보기

이 기사는 Cloud Container Future의 Huawei Cloud 커뮤니티 " 차세대 클라우드 네이티브 관찰 가능 플랫폼의 CCE 서비스 로그 및 경보 "에서 공유되었습니다.

경보와 로그는 운영 및 유지보수 담당자가 신속하게 문제를 찾아 이상 상황에서 복구할 수 있는 주요 수단입니다. 운영 및 유지보수 담당자의 일상적인 작업 방식은 먼저 경보 정보를 수신한 다음 경보 정보를 기반으로 이상 현상의 범위와 영향을 초기에 판단하고 관련 구성 요소의 로그를 통해 고장 원인을 찾아 시스템 복구를 수행하는 경우가 많습니다. . 따라서 운영 및 유지보수 담당자에게 간단하고 사용하기 쉬운 경보 및 로그 관리 플랫폼을 어떻게 제공할 것인가는 다양한 클라우드 네이티브 플랫폼에서 큰 관심사입니다.

기존 시스템에 비해 클라우드 네이티브 시나리오의 애플리케이션 수는 엄청나며 모니터링 지표, 이벤트, 로그와 같은 운영 및 유지 관리 데이터는 훨씬 더 방대합니다. 동시에 경보 구성은 여러 시스템을 연결해야 합니다.예를 들어 경보 알리미 구성에는 메시지 알림 시스템이 포함되고 지표 임계값 경보 규칙에는 모니터링 시스템이 포함되며 로그 키워드 경보에는 로그 관리 시스템이 포함됩니다. 이로 인해 클라우드 네이티브 시나리오의 경보 구성이 매우 복잡해지며, 다른 시스템으로의 점프가 포함되며 프로세스에 중단점이 있습니다.

마찬가지로 클라우드 네이티브 시나리오의 로그 파일은 복잡합니다. 로그에는 컨테이너 표준 출력 로그, 컨테이너 내 로그, 노드 로그 등이 포함되며, 로그는 서로 다른 호스트에 분산될 수 있고 위치가 고정되어 있지 않아 로그를 찾기가 어렵습니다. 따라서 운영 및 유지보수 담당자가 장애 시점에 대한 전체 로그 링크를 빠르고 정확하게 찾아 이를 명확하게 제시할 수 있도록 돕는 것이 로그 서비스가 직면한 주요 과제입니다.

cke_134.png

그림 1  로그 및 경고의 과제

위의 클라우드 네이티브 시나리오의 알람 및 로그 문제에 대응하여 Huawei Cloud CCE 서비스는 " 원스톱 알람 구성 " 및 " 클라우드 네이티브 로그 보기 "를 달성하기 위해 알람 센터 및 로그 센터 기능을 출시했습니다.

원스톱 알람 구성

사용자가 매우 짧은 시간에 시스템의 기본 알람 구성을 완료할 수 있도록 CCE 서비스와 AOM 서비스는 한 번의 클릭으로 클라우드 네이티브 시스템의 알람 규칙을 구성할 수 있는 클라우드 네이티브 전용 알람 템플릿을 출시합니다. 이 경보 템플릿은 Huawei Cloud의 일일 운영 및 유지 관리 경험에 대한 요약 및 개선을 기반으로 하며 클러스터, 노드 및 로드 리소스 모니터링 임계값과 같은 여러 측면에서 클러스터 오류 이벤트 및 일반적인 오류 시나리오를 다룹니다. 사용자는 CCE에서 알람 센터를 열고 오류를 통보한 사람의 이메일이나 휴대폰을 바인딩하기만 하면 됩니다.

cke_135.png

그림 2  원클릭 활성화

또한 알람 센터에는 알람 알림 그룹 구성, 알람 규칙 구성, 알람 보기 및 역추적 등의 기능이 있어 운영 및 유지 관리 담당자가 원스톱으로 알람 구성 및 처리 프로세스를 완료하여 폐쇄 루프를 완료할 수 있습니다.

알람 센터는 Huawei Cloud SMN 서비스를 기반으로 알람 알림 그룹 기능을 제공합니다. 알람 알림 그룹을 구성하면 장애 발생 시 개입할 문제를 유발하는 시스템의 종류와 수준에 따라 해당 운영 및 유지 보수 담당자에게 적시에 통보할 수 있습니다.

cke_136.png

그림 3  알람 알림 그룹 구성

클러스터의 공통 지표 경보 및 이벤트 경보를 포함하는 경보 템플릿을 통해 한 번의 클릭으로 경보 규칙을 발행할 수 있습니다. 물론 사용자는 이러한 알람 규칙을 자유롭게 선택하고 구성할 수도 있습니다.

cke_137.png

그림 4  알람 규칙 구성

알람이 발생하면 알람 알리미는 알람 알림을 적시에 수신하고 알람 센터에서 제공하는 시각적 인터페이스를 통해 알람을 확인하고 제거할 수 있습니다. 사용자가 발생한 결함을 쉽게 추적할 수 있도록 알람 센터에서는 제거된 과거 알람 보기도 지원합니다.

cke_138.png

그림 5 알람 목록

클라우드 네이티브 로그 보기

클라우드 네이티브 비즈니스의 특성에 적응하고 운영 및 유지 관리 담당자가 신속하게 로그를 쿼리하고 오류를 정확하게 찾을 수 있도록 Huawei Cloud CCE 서비스는 로그 센터 기능을 시작하고 클라우드 네이티브 관점에서 전용 페이지 레이아웃을 제공합니다.

cke_139.png

그림 6  로그 센터

로그 센터는 워크로드, 포드 등과 같은 K8s 리소스 개체를 기반으로 필터링을 지원합니다. 또한 K8s 관리 로그, 감사 로그, 비즈니스 로그 등의 분류된 표시를 지원합니다. 전체 페이지가 더욱 간결해지고, 로그의 주요 내용 및 관련 K8s 리소스와 같은 핵심 정보가 더욱 눈에 띄게 표시되어 운영 및 유지 보수 담당자가 결함 지점 로그에 집중하고 간섭을 제거합니다.

cke_140.png

그림 7  다차원 필터링

로그 센터는 로그 수집 전략을 위한 구성 관리 기능도 제공하고 수집된 K8s 리소스 개체의 무료 구성을 지원합니다. 또한, 로그 사용 임계값을 더욱 낮추기 위해 로그 센터에서는 컨트롤 플레인 로그, 감사 로그, 컨테이너 표준 출력 로그에 대한 수집 구성 템플릿을 제공하며, 이를 원클릭으로 켜거나 끌 수 있습니다.

cke_141.png

그림 8  컬렉션 템플릿

이번 호에서는 알람센터와 로그센터의 기능에 대해 간략하게 소개하겠습니다. 우리는 이러한 기능이 귀하의 운영 및 유지 관리 경험을 효과적으로 개선할 수 있기를 매우 기대합니다. 계속해서 최적화하겠습니다. 귀하의 이용과 개선을 위한 귀중한 제안을 기대합니다.

서비스 체험을 원하시면 방문해주세요

관련된 링크들

화웨이 클라우드의 신기술에 대해 빨리 알아보고 팔로우하려면 클릭하세요~

OpenAI는 모든 사용자에게 ChatGPT Voice Vite 5를 무료로 공개합니다. 공식 출시됩니다. 운영자의 마법 작전: 백그라운드에서 네트워크 연결을 끊고, 광대역 계정을 비활성화하고, 사용자가 광 모뎀을 강제로 변경하도록 합니다. Microsoft 오픈 소스 터미널 채팅 프로그래머가 ETC 잔액을 조작하고 연간 260만 위안 이상 횡령 Redis의 아버지가 사용하는 Pure C 언어 코드는 Telegram Bot 프레임워크를 구현합니다. 오픈 소스 프로젝트 관리자라면 이런 답변을 어디까지 견딜 수 있습니까? Microsoft Copilot Web AI는 중국 OpenAI를 지원하는 12월 1일 공식 출시될 예정입니다 . 전 CEO이자 사장인 Sam Altman과 Greg Brockman이 Microsoft에 합류했습니다. Broadcom은 VMware의 성공적인 인수를 발표했습니다.
{{o.이름}}
{{이름}}

추천

출처my.oschina.net/u/4526289/blog/10151116