Что делать, если я обнаружил аномальные колебания данных? Не паникуйте, мониторинг показателей и анализ атрибуции помогут вам.

Создание полной и комплексной системы показателей — это первый шаг для предприятий к использованию данных для принятия решений по бизнес-операциям. Но после установки показателей мониторинг показателей часто всеми игнорируется. Когда показатели колеблются аномально (вверх или вниз), компаниям необходимо уметь вовремя их обнаружить и быстро найти реальные причины, стоящие за ними, чтобы сформулировать соответствующие стратегии. В противном случае они просто слепо попадут в цель и уйдут в обход. круги.

Конкретные сценарии, в которых показатели колеблются аномально, например:

· Поисковый трафик по корпоративным ключевым словам внезапно снизился. В чем причина?

· Показатель GMV в марте упал на 40% по сравнению с февралем. Как его анализировать?

· Количество заказов в определенной категории в последнее время резко возросло. Почему?

Затем в этой статье будет подробно описано, как настроить полный мониторинг аномалий показателей и соответствующий механизм анализа атрибуции , чтобы, когда вы столкнетесь с такими проблемами в будущем, вы могли быстро обнаружить бизнес-проблемы и возможности на основе данных и повысить скорость бизнеса. продвижение.

Обнаружение аномалий показателей на основе статистического анализа

Тенденции ежедневных данных предприятий будут колебаться вверх и вниз в определенном диапазоне, но плавающие диапазоны разных показателей будут разными. Когда бизнес находится в периоде быстрого роста, диапазон ежедневных колебаний показателей больше; когда бизнес находится в стабильном периоде, диапазон ежедневных колебаний показателей меньше; чем грубее статистическая детализация, тем больше объем данных; , и тем меньше волатильность статистических результатов. Поэтому для разных показателей необходимо использовать разные стандарты, чтобы определить наличие отклонений в колебаниях показателей.

Существует три основных метода мониторинга аномалий показателей:

· Установка пороговых значений на основе реального делового опыта

· Выполнение статистического анализа на основе результатов данных

· Интеграция алгоритмов в прогнозы моделирования

В этой статье в основном рассказывается о том, как оценить, являются ли колебания индикатора аномальными, на основе методов статистического анализа .

В статистике распределение данных показателей обычно удовлетворяет нормальному распределению . Нормальное распределение симметрично и использует два данных: среднее значение и стандартное отклонение. Среднее значение может отражать средний уровень данных, а стандартное отклонение может отражать диапазон колебаний данных. Чем больше стандартное отклонение, тем выше волатильность данных. Формула расчета стандартного отклонения выглядит следующим образом:

файл

Положение данных в нормальном распределении можно использовать для определения того, соответствуют ли колебания индикатора ожиданиям. При нормальном распределении вероятность того, что данные распределятся в пределах 2-кратного стандартного отклонения, составляет 95,5%, а вероятность того, что они находятся в пределах 3-кратного стандартного отклонения, составляет 99,7%. В повседневной жизни в качестве стандарта измерения можно использовать 2-кратное стандартное отклонение.

Нормальные результаты данных будут колебаться в пределах среднего стандартного отклонения ±2*. Если фактические данные выходят за пределы этого диапазона, колебания данных считаются ненормальными.

Модели ежедневных колебаний данных будут иметь одинаковые или похожие закономерности изменения в днях, неделях, месяцах и годах. Здесь мы используем индикатор ежедневной активности в качестве примера, чтобы проиллюстрировать процесс мониторинга аномальных колебаний индикатора.

Индикатор ежедневной активности определенного игрового приложения обычно колеблется еженедельно. Теперь мы планируем определить, есть ли аномальные колебания в ежедневных данных об активности в этот понедельник, основываясь на тенденциях данных за последние пять недель.

Подготовка данных происходит следующим образом:

файл

Среднее значение понедельника за первые пять недель приведенных выше данных составляет: 10900, стандартное отклонение: 1507. Двукратное стандартное отклонение данных составляет 7887 и 13913 соответственно. Данные в понедельник на этой неделе составляют 7700. Если он находится за пределами. Если диапазон стандартного отклонения составляет 2 раза, это означает, что активность в один день на этой неделе является аномальной. Данные индикатора колеблются аномально, и необходим дальнейший анализ, чтобы определить, действительно ли аномальные колебания являются ненормальными для бизнеса.

Атрибутивный анализ изменений показателей

Существует множество методов атрибуции изменений показателей , которые можно разделить на две категории: анализ горизонтальной атрибуции и анализ вертикальной атрибуции.

Анализ горизонтальной атрибуции

Горизонтальный анализ атрибуции означает, что для комбинированных показателей можно разделить показатели процесса, проанализировать факторы, влияющие на колебания каждого показателя процесса, а затем объединить и проанализировать несколько влияющих факторов.

Например: Вчера сумма платежа значительно увеличилась. При анализе причин увеличения сначала разложите сумму платежа: сумма платежа = ежедневная активность * средняя сумма платежа. Средняя сумма платежа колеблется в пределах нормального диапазона, а ежедневная активность значительно увеличилась. Выяснилось, что объем закупок вчера увеличился, что отразилось на результатах.

анализ вертикальной атрибуции

Анализ вертикальной атрибуции заключается в выполнении анализа атрибуции показателей посредством детализации измерений . Анализ детализации измерений в основном включает в себя две степени детализации анализа: одна предназначена для анализа вклада каждого измерения в показатель, а другая — для анализа вклада значения измерения в показатель.

Расчет степени вклада измерения может быть рассчитан на основе сводной информации о степени вклада каждого значения измерения. Существует множество методов расчета для расчета степени вклада каждого значения измерения. Расчет степени вклада может быть основан на расчете степени вклада каждого значения измерения. различные методы, такие как алгоритмы прогнозирования. В этой статье представлен простой метод расчета степени вклада на основе среднего темпа роста.

В рамках одного измерения вклад каждого значения измерения можно рассчитать по следующей формуле:

файл

Далее рассмотрим продажи в качестве примера, чтобы представить процесс расчета.

Продажи определенной линейки продуктов 1 и 2 января составили 30,97 млн ​​юаней и 33 млн юаней соответственно. В разбивке по городу двухдневные данные по каждому городу выглядят следующим образом:

файл

В городском измерении:

файл

На основе вышеуказанных шагов можно легко реализовать расчет вклада измерения и вклада значения измерения.

Интеллектуальный мониторинг колебаний показателей и интеллектуальный анализ атрибуции

В реальных сценариях с данными количество значений измерения в каждом измерении варьируется от десятков до сотен и тысяч. Вычисление вклада измерения вручную каждый день будет огромной рабочей нагрузкой. Эффективность анализа слишком низка, что позволяет бизнес-участникам делать выводы на основе опыта. Если вывод неверен, скорее всего, будут приняты неправильные решения.

Интеллектуальный мониторинг колебаний показателей и функции интеллектуального анализа атрибуции платформы Kangaroo Cloud Indicator могут быстро и всесторонне помочь пользователям отслеживать эффективность бизнеса, тем самым способствуя дальнейшему развитию бизнеса.

Просмотр индикаторной панели

Индикаторы, которые беспокоят предприятие, можно добавить на доску объявлений для ежедневного наблюдения и мониторинга данных. На информационной панели вы можете визуально просмотреть текущие показатели данных и последние тенденции данных всех показателей. Система будет проводить интеллектуальную диагностику на основе текущих данных, чтобы определить, являются ли колебания индикатора нормальными колебаниями, помогать пользователям быстро находить аномальные данные, а также анализировать и целенаправленно реагировать на изменения данных.

файл

Метрический анализ атрибуции

Когда результат индикатора является ненормальным, необходимо выполнить большой объем работы для последовательного выполнения анализа атрибуции по измерениям и значениям измерений. Возможность систематизировать методы и процессы анализа значительно повысит эффективность атрибутивного анализа и сыграет чрезвычайно положительную роль в содействии развитию бизнеса.

файл

При выполнении анализа атрибуции показателей система будет различать колебания показателя расчета значения измерения, дополнительно рассчитывать вклад измерения и сортировать их в порядке убывания в зависимости от вклада, позволяя пользователям сосредоточиться на более важных влияющих факторах.

В рамках интересующего измерения пользователи могут дополнительно проверить вклад значений разделенных измерений, быстро обнаружить причины изменений данных и способствовать улучшению бизнеса с помощью данных.

Нажмите на ссылку ниже, чтобы бесплатно попробовать [ Платформу управления индикаторами ]: https://www.dtstack.com/easydigit/dataindex?src=szsm

Адрес загрузки «Белой книги по системе отраслевых индикаторов»: https://www.dtstack.com/resources/1057?src=szsm

Адрес загрузки «Информационного документа о продукте Dutstack»: https://www.dtstack.com/resources/1004?src=szsm

Адрес для скачивания «Белой книги по отраслевой практике управления данными»: https://www.dtstack.com/resources/1001?src=szsm

Для тех, кто хочет узнать или получить дополнительную информацию о продуктах больших данных, отраслевых решениях и историях клиентов, посетите официальный сайт Kangaroo Cloud: https://www.dtstack.com/?src=szkyzg .

Линус взял на себя задачу не допустить, чтобы разработчики ядра заменяли табуляции пробелами. Его отец — один из немногих руководителей, умеющих писать код, его второй сын — директор отдела технологий с открытым исходным кодом, а младший сын — ядро ​​с открытым исходным кодом. участник Робин Ли: Естественный язык станет новым универсальным языком программирования. Модель с открытым исходным кодом будет все больше и больше отставать от Huawei: потребуется 1 год, чтобы полностью перенести 5000 часто используемых мобильных приложений на язык Hongmeng, наиболее подверженный этому . сторонние уязвимости. Расширенный текстовый редактор Quill 2.0 был выпущен с функциями, надежностью и разработчиками. Опыт был значительно улучшен. Ма Хуатэн и Чжоу Хунъи пожали друг другу руки, чтобы «устранить обиды». Meta Llama 3 официально выпущен. источник Laoxiangji не является кодом, причины этого очень трогательны. Google объявил о масштабной реструктуризации.
{{o.name}}
{{m.name}}

рекомендация

отmy.oschina.net/u/3869098/blog/11049507