데이터에 비정상적인 변동이 발견되면 어떻게 해야 하나요? 당황하지 마세요. 지표 모니터링과 기여 분석이 도움이 될 것입니다.

완전하고 포괄적인 지표 시스템을 구축하는 것은 기업이 데이터를 사용하여 비즈니스 운영 결정을 내리는 첫 번째 단계입니다. 그러나 지표를 설정한 후 모든 사람이 지표 모니터링을 무시하는 경우가 많습니다. 지표가 비정상적으로(위 또는 아래) 변동할 때 기업은 이를 적시에 감지하고 그 이면의 실제 원인을 신속하게 찾아 그에 맞는 전략을 세울 수 있어야 합니다. 그렇지 않으면 맹목적으로 목표를 달성하고 돌아다닐 수 있습니다. 서클.

다음과 같이 지표가 비정상적으로 변동하는 특정 시나리오:

· 기업용 키워드의 검색 트래픽이 갑자기 감소한 이유는 무엇입니까?

· 3월 GMV 수치는 2월 대비 40% 감소했습니다. 이를 어떻게 분석해야 할까요?

· 최근 특정 카테고리의 주문량이 급증한 이유는 무엇입니까?

그런 다음 이 기사 에서는 향후 이러한 문제가 발생할 때 데이터에서 비즈니스 문제와 기회를 신속하게 발견하고 비즈니스 속도를 향상시킬 수 있도록 완전한 지표 이상 모니터링 및 해당 속성 분석 메커니즘을 설정하는 방법을 자세히 소개합니다. 진보.

통계분석을 통한 지표 이상 징후 탐지

기업의 일일 데이터 추세는 특정 범위 내에서 위아래로 변동하지만 다양한 지표의 변동 범위는 다릅니다. 기업이 급속한 성장기에 있을 때 지표의 일일 변동 범위는 더 크고, 기업이 안정적인 기간에 있을 때는 지표의 일일 변동 범위가 더 작으며, 통계 수준이 낮을수록 데이터의 양이 더 많습니다. , 통계 결과의 변동성은 작아집니다. 따라서 지표변동에 이상이 있는지를 측정하기 위해서는 지표별로 서로 다른 기준을 적용할 필요가 있다.

지표 이상을 모니터링하는 세 가지 주요 방법은 다음과 같습니다.

· 실제 사업 경험을 바탕으로 한도 설정

· 데이터 결과를 바탕으로 통계분석 수행

· 알고리즘을 모델링 예측 에 통합

이번 글에서는 주로 통계분석 방법을 바탕으로 지표변동의 이상여부를 평가하는 방법을 소개하겠습니다 .

통계에서 지표의 데이터 분포는 일반적으로 정규분포를 만족합니다 . 정규분포는 대칭적이며 평균과 표준편차라는 두 가지 데이터를 사용합니다. 평균은 데이터의 평균 수준을 반영할 수 있으며, 표준편차는 데이터의 변동 범위를 반영할 수 있습니다. 표준편차가 클수록 데이터의 변동성은 커집니다. 표준편차를 계산하는 공식은 다음과 같습니다.

파일

정규 분포에서 데이터의 위치를 ​​사용하여 지표 변동이 예상과 일치하는지 여부를 확인할 수 있습니다. 정규분포에서 데이터가 표준편차의 2배 이내로 분포할 확률은 95.5%, 표준편차의 3배 이내로 분포할 확률은 99.7%이다. 일상생활에서는 표준편차의 2배를 측정기준으로 사용할 수 있습니다.

정상적인 데이터 결과는 평균 ±2* 표준편차 범위 내에서 변동합니다. 실제 데이터가 이 범위를 초과하면 데이터 변동이 비정상적인 것으로 간주됩니다.

일일 데이터 변동 패턴은 일, 주, 월, 년 단위로 동일하거나 유사한 변화 패턴을 갖습니다. 여기서는 비정상적인 지표 변동에 대한 모니터링 프로세스를 설명하기 위해 일일 활동 지표를 예로 들어 보겠습니다.

특정 게임 APP의 일일 활동 지표는 일반적으로 주 단위로 변동됩니다. 이제 지난 5주간의 데이터 추세를 기반으로 이번 월요일의 일일 활동 데이터에 비정상적인 변동이 있는지 확인할 계획입니다.

데이터 준비는 다음과 같습니다.

파일

위 데이터의 첫 5주 동안 월요일의 평균값은 10900, 표준편차: 1507입니다. 데이터의 2배 표준편차는 각각 7887, 13913입니다. 이번주 월요일 데이터는 7700입니다. 2배의 표준편차 범위는 이번 주 어느 날의 활동이 지표 데이터에 비정상적으로 변동한다는 의미이며, 이러한 비정상적인 변동이 실제로 비즈니스에 비정상인지 여부를 판단하려면 추가 분석이 필요합니다.

지표변화의 귀인분석

지표 변화에 대한 귀인 방법은 다양하며 , 이는 수평적 귀인 분석과 수직적 귀인 분석의 두 가지 범주로 요약할 수 있습니다.

수평적 귀속 분석

수평적 귀인분석이란 결합지표에 대해 프로세스 지표를 분할하여 각 프로세스 지표의 변동영향요인을 분석한 후, 복수의 영향요인을 통합하여 분석하는 것을 의미합니다.

예: 어제 결제 금액이 크게 증가했습니다. 증가 원인을 분석할 때 먼저 결제 금액을 결제 금액 = 일일 활동 * 평균 결제 금액으로 분류합니다. 평균 결제 금액이 정상 범위 내에서 변동하고 관련 비즈니스를 추가로 분석한 결과 일일 활동이 크게 증가했습니다. 어제 구매량이 증가한 것으로 나타났습니다.

수직적 귀속 분석

수직적 귀속분석은 차원 드릴다운을 통해 지표에 대한 귀속분석을 수행 하는 것입니다 . 차원 드릴다운 분석에는 주로 두 가지 분석 세분성이 포함됩니다. 하나는 지표에 대한 각 차원의 기여도를 분석하는 것이고, 다른 하나는 지표에 대한 차원 값의 기여도를 분석하는 것입니다.

차원의 기여도 계산은 각 차원 값의 기여도 요약을 기반으로 계산할 수 있습니다. 각 차원 값의 기여도를 계산하는 방법은 여러 가지가 있습니다. 예측 알고리즘 등 다양한 방법. 이 글에서는 평균 성장률을 기준으로 기여도를 계산하는 간단한 방법을 소개합니다.

단일 측정기준에서 각 측정기준 값의 기여도는 다음 공식으로 계산할 수 있습니다.

파일

다음으로 매출을 예로 들어 계산 과정을 소개하겠습니다.

1월 1일과 1월 2일 특정 제품군의 매출은 각각 3,097만 위안과 3,300만 위안을 기록했다. 도시 차원으로 세분화하면 각 도시의 2일간 데이터 성능은 다음과 같습니다.

파일

도시 차원에서:

파일

위의 단계를 바탕으로 차원기여도와 차원값 기여도 계산을 간단하게 구현할 수 있습니다.

지능형 지표 변동 모니터링 및 지능형 기여 분석

실제 데이터 시나리오에서 각 차원의 차원 값 수는 수십에서 수백, 수천에 이릅니다. 매일 수동으로 차원 기여도를 계산하는 것은 엄청난 작업량입니다. 분석 효율성이 너무 낮아 비즈니스 당사자가 경험을 바탕으로 결론을 내리기 쉽습니다. 추론이 틀리면 잘못된 결정을 내릴 가능성이 높습니다.

Kangaroo Cloud Indicator Platform지능형 지표 변동 모니터링지능형 속성 분석 기능은 사용자가 비즈니스 성과를 신속하고 포괄적으로 추적할 수 있도록 지원하여 비즈니스 개발을 더욱 촉진할 수 있습니다.

지표 대시보드 보기

기업이 우려하는 지표에 대해서는 주의 게시판 에 지표를 추가하여 매일 데이터를 관찰하고 모니터링할 수 있습니다. 대시보드에서는 모든 지표의 현재 데이터 성과와 최근 데이터 추세를 시각적으로 확인할 수 있습니다. 시스템은 현재 데이터를 기반으로 지능적인 진단을 수행하여 지표 변동이 정상적인 변동인지 여부를 결정하고 사용자가 비정상적인 데이터를 신속하게 찾을 수 있도록 지원하며 목표 방식으로 데이터 변경을 분석하고 대응합니다.

파일

지표 기여 분석

지표 결과가 비정상인 경우 차원과 차원값에 대한 귀인분석을 순차적으로 수행하는 것은 많은 작업이 소요됩니다. 분석 방법과 프로세스를 체계화할 수 있으면 속성 분석의 효율성이 크게 향상되고 비즈니스 개발을 촉진하는 데 매우 긍정적인 역할을 할 수 있습니다.

파일

지표 귀속 분석을 수행할 때 시스템은 차원 값 계산 지표 변동을 구분하고 차원 기여도를 추가로 계산하며 기여도에 따라 내림차순으로 정렬하므로 사용자는 더 중요한 영향 요인에 집중할 수 있습니다.

해당 차원에서 사용자는 세분화된 차원 값의 기여도를 더욱 자세히 확인할 수 있고, 데이터 변경 이유를 빠르게 발견할 수 있으며, 데이터를 통해 비즈니스 개선을 촉진할 수 있습니다.

아래 링크를 클릭하여 [ 지표 관리 플랫폼 ]을 무료로 사용해 보세요: https://www.dtstack.com/easydigit/dataindex?src=szsm

"산업 지표 시스템 백서" 다운로드 주소: https://www.dtstack.com/resources/1057?src=szsm

"Dutstack 제품 백서" 다운로드 주소: https://www.dtstack.com/resources/1004?src=szsm

"데이터 거버넌스 산업 실무 백서" 다운로드 주소: https://www.dtstack.com/resources/1001?src=szsm

빅데이터 제품, 산업 솔루션, 고객 사례에 대해 더 알고 싶거나 상담하고 싶은 분들은 Kangaroo Cloud 공식 홈페이지( https://www.dtstack.com/?src=szkyzg )를 방문해 주세요.

Linus는 커널 개발자가 탭을 공백으로 대체하는 것을 막기 위해 스스로 노력했습니다. 그의 아버지는 코드를 작성할 수 있는 몇 안되는 리더 중 한 명이고, 둘째 아들은 오픈 소스 기술 부서의 책임자이며, 막내 아들은 오픈 소스 코어입니다. 기고자 Robin Li: 자연 언어 새로운 범용 프로그래밍 언어가 될 것입니다. 오픈 소스 모델은 Huawei에 비해 점점 더 뒤쳐질 것입니다 . 일반적으로 사용되는 5,000개의 모바일 애플리케이션을 Hongmeng으로 완전히 마이그레이션하는 데 1년이 걸릴 것입니다. 타사 취약점. 기능, 안정성 및 개발자의 경험이 크게 개선된 Quill 2.0 출시되었습니다. Ma Huateng과 Zhou Hongyi는 "원한을 제거하기 위해" 공식적으로 출시되었습니다. Laoxiangji의 소스는 코드가 아닙니다. Google이 대규모 구조 조정을 발표한 이유는 매우 훈훈합니다.
{{o.이름}}
{{이름}}

추천

출처my.oschina.net/u/3869098/blog/11049507