[DataAnalysis]数据分析基础-茆诗松概率论知识点汇总

一、切比雪夫不等式

证明:

二、常用离散分布

  1. 二项分布
  2. 泊松分布

ps:二项分布的泊松近似

  1. 超几何分布:N件产品中有M件不合格,从中随机抽n件,其中不合格件数X服从的分布
  2. 几何分布:记事件A发生的概率为p,则X为时间A首次出现的概率

  1. 负二项分布:记事件A发生的概率为p,则X为事件A第r次出现时的试验次数

三、常用连续分布:

  1. 正态分布
  2. 均匀分布
  3. 指数分布

  1. 伽马分布

ps:伽马分布中α=1即指数分布;Ga(n/2,1/2)即自由度为n的卡方分布。

  1. 贝塔分布

四、分布的特征数:

  1. k阶原点矩和k阶中心矩
  2. 变异系数:标准差除以均值,衡量波动的无量纲特征数
  3. 分位数
  4. 偏度系数:设随机变量X的前三阶矩存在,则偏度

        峰度系数:设随机变量X的前四阶矩存在:

ps:峰度是描述分不足尖峭程度或者尾部粗细的特征数,其中标准正态分布的峰度是3。峰度表示X的标准化变量与标准正态变量四阶原点矩之差。

五、全概率公式和贝叶斯公式

六、大数定律的一般形式:一般的大数定律都涉及到一个随机变量序列{Xn},结论都形如下式:对任意的 ,有

  1. 伯努利大数定律
  2. 切比雪夫大数定律
  3. 马尔可夫大数定律: 两两不相关;方差存在且有上界
  4. 辛钦大数定律: 独立同分布;期望存在

七、中心极限定理:

1、独立同分布下的中心极限定理:林德伯格-莱维中心极限定理

条件:(1) ;(2)

结论:记

,即 的极限分布服从于标准正态分布

2、二项分布的正态近似:拉普拉斯中心极限定理

 

 

猜你喜欢

转载自blog.csdn.net/tomocat/article/details/81137505