因果分析:原理、方法论、应用

什么是因果分析?

因果分析(Causal Analysis)是分析彼此之间的因果关系。

因果推断(Causal Inference)是基于原因推结果,是因果分析的一部分。

因果分析是数据分析、数据科学中重要的方法,广泛应用于A/B实验,异常分析,用户增长等领域。

本文尝试从宏观视角,用逻辑来推导因果分析的基础、原理、方法,应用的知识体系。

首先,介绍了因果分析的概念、要素和分类等基础知识;

接着,介绍了因果分析的A/B实验、鱼骨图分析等常见的因果分析方法的原理;

然后,介绍了A/B实验(策略调整)、异常分析(DAU下降)等因果分析方法的应用,并介绍了R、Python因果推断工具;

最后,对因果分析进行总结,指出因果分析的本质,介绍了因果关系与相关关系的区别,及发展趋势。

本文目录如下:

1. 因果分析基础
1.1. 因果分析的概念
1.2. 因果分析的要素
1.3. 因果分析的分类

2. 因果分析原理
2.1. A/B 实验的原理
2.2. 鱼骨图分析的原理

3. 因果分析应用
3.1. A/B 实验:策略调整
3.2. 异常分析:DAU下降
3.3. 因果推断工具

4. 因果分析总结
4.1. 因果分析的本质
4.2. 因果关系 VS 相关关系
4.3. 因果分析的发展趋势

接下来,让我们一起走进因果分析的世界,去尝试探讨因果分析的基础、原理、方法论和应用。

1. 因果分析基础

1.1. 因果分析的概念

因果是指原因和结果,因果关系则是原因和结果的关系。

什么是因果分析?

这里推荐知乎的一篇优秀文章:较清晰的描述了因果分析的概念:因果关系 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/555170435

因果分析是分析彼此之间的因果关系。

1.2. 因果分析的要素

原因可能是多个,导致的结果也可能是多个。

这里我们把问题聚焦,仅探讨抽象的因果关系,所以因果分析可以抽象如下:

因果分析的三要素是:原因、结果和关系。

1.3. 因果分析的分类

  • 按照因果分析的三要素,把因果分析分为三类:
  • 第一类:由原因推结果,又称为因果推断(Causal Inference);
  • 第二类:由结果找原因;
  • 第三类:原因和结果互推;

因果分析都有哪些方法?

因果分析三类典型代表方法如下表所示:

这里特别说明:因果推断(Causal Inference)是由原因推结果,又称因果推理,因果推断法,是因果分析的一类,在数据科学得到广泛应用,与机器学习结合越来越紧密。

2. 因果分析原理

互联网领域,A/B 实验、鱼骨图分析法是常用的因果分析方法,所以接下来重点阐述这两种方法的原理。

2.1. A/B 实验的原理

A/B 实验,也称 A/B 测试、A/B 试验,是一种随机对照实验,用于实验验证因果关系。

A/B 实验,是因果实验的代表,是因果归因、数据归因的主要手段。

A/B 实验是一种单因素归因,适用于验证单因素的因果关系。

2.2. 鱼骨图分析的原理

鱼骨图分析(Cause and Effect Analysis Chart,也称因果分析法)是典型的由结果找原因的方法。

鱼骨图分析法是对一个问题,分类别、穷举性地列出所有影响因素,进行进一步分析。

其中鱼头是结果(问题),大鱼骨是原因的类别,小鱼骨是具体原因。

鱼骨图分析适用于头脑风暴,寻找多个可能的原因。

3. 因果分析应用

接下来介绍一些因果分析的典型应用场景。

由原因推结果的A/B实验的应用;由结果找原因的异常分析的应用。

3.1. A/B 实验:策略调整

微软的调整页面颜色,提高点击率的A/B实验。

3.2. 异常分析:DAU下降

在异常分析中,异常是结果,找到导致异常的原因,并给出优化建议。

3.3. 因果推断工具

R、Python因果推断工具很多,比如Dowhy、Causal ML、EconML、causalToolbox等。更多因果推断工具、因果推断方法、因果推断模型可参考论文《A Survey on Causal Inference》以及关河因果产品:

新型数据分析产品_因果分析_关河因果【官网】 (grandhoo.com)https://yinguo.grandhoo.com/home

4. 因果分析总结

4.1. 因果分析的本质

因果分析的本质就是论证因果关系的充分性、必要性。

4.2. 因果关系 VS 相关关系

因果关系一定是相关关系,但相关关系不一定是因果关系。

4.3. 因果分析的发展趋势

个人觉得:

原因推结果这个方向,比如元分析(Meta-analysis)、因果推断机器学习;

结果找原因这个方向,比如破界创新。

关于破界创新的工业应用案例,可以参考《因果分析应用之破界创新:从结果到原因,再从原因到结果》。

https://zhuanlan.zhihu.com/p/539417288

参考文献:

总结:

《精益数据分析》作者认为:"发现相关性可以帮助你预测未来,而发现因果关系意味着你可以改变未来",所以重视因果关系,重视因果分析吧。

因果分析可以定位问题,挖掘商业价值,洞见机会,在互联网领域有广泛的应用,比如因果推断、A/B实验、用户增长、异常分析和流失分析等。

但是商业是个复杂生态,因果分析是个很好的分析工具,还要结合具体的用户、业务、数据进行针对性的分析。

结束语:

由于个人的经历、能力和水平是有限的,我的可能是片面的,也可能是错的,这里抛砖引玉。

由于个人的经历、能力和水平是有限的,我的可能是片面的,也可能是错的

理论本身是务虚的,需要实践、实践、再实践。可以参考阿里、快手、关河因果在因果推断上的实践。

你的反馈,正的负的都是有价值的,有助于我加速迭代升级——更深入、更全面。留下您的精彩评论吧!

猜你喜欢

转载自blog.csdn.net/DuJinn/article/details/126609562