知识储备:概率论(持续更新)

I.基本定理:

1.组合与排列,二项式

2.全概率

已知某个事件的条件概率,求该事件在总样本空间中的概率

3.贝叶斯

根据先验知识和已知的条件概率求得另一条件概率(即求后验知识

II.离散型随机变量

1.伯努利实验

只有两个可能结果的实验。(抛硬币)

2.二项分布

n次伯努利实验随机变量 \xi 的概率分布,记

b(k;n,p) = \binom{n}{k}p^{k}q^{n-k} = \frac{n!}{k!(n-k)!)}p^{k}q^{n-k}=P(\xi = k)

\xi \sim B(n,p)

定理:当k=ent( (n+1)p ) 时 , b(k;n,p) 最大。其中ent(x)为不大于x的最大整数。

3.泊松定理与泊松分布

随机变量 \xi 以全体自然数为其一切可能值,其分布律为

P(\xi = k) =e^{-\lambda}\frac{\lambda^k}{k!} , k = 1, 2, 3

二项分布的n很大而p很小时,可用泊松分布近似替代。

扫描二维码关注公众号,回复: 2555561 查看本文章

4. 超几何分布

(如在一箱有N件产品中混入M件次品,抽n件,其查出次品的件数 \xi 的概率分布)

5.几何分布 

(在伯努利实验直到成功时所进行实验的次数 \xi 的分布律 )

6.负二项分布(巴斯卡分布)

(在独立重复的伯努利试验序列中第r次成功的试验次数序号 \xi  是个随机变量,其值可能为r, r+1, r+2 ,…)

二项分布、负二项分布、几何分布等都涉及了独立重复试验序列(如伯努利试验),不同之处在于实验序列的停止规则。

(二项分布对应于n次伯努利试验,即试验独立进行确定的n次后就停,而出现事件A(成功)的次数是随机的;负二项分布则相反,事件A(成功)出现的次数r是确定的,而独立重复进行的实验次数却是随机的,直到看到第r次出现事件A(成功)时才停止)

III. 连续型随机分布

1.分布函数(累积分布函数)

F(x)

2.概率分布密度,密度函数:

概率密度函数f(x)满足:

 f(x)\geq 0

\int _{-\infty }^{\infty }f(x)dx=1

分布函数和密度函数的关系:

F(x)=\int _{-\infty }^{x }f(x)dx

P(a<\xi\leq b)=F(b)-F(a)=\int _{a}^{b}f_{\xi}(x)dx

3. 期望与方差

3.1 当满足 \int _{-\infty }^{\infty }|x|f(x)dx< + \infty时(若发散则不满足,如柯西分布),则 \xi 存在数学期望  E \xi,有:

E \xi = \int _{-\infty }^{\infty }xf(x)dx

 3.2 若已知连续随机变量 \xi 的密度函数为f(x),又知随机变量\eta =g(\xi),则满足不发散的条件\int _{-\infty }^{\infty }g(x)f(x)dx< + \infty时候,有

E\eta = E g(\xi)= \int _{-\infty }^{\infty }g(x)f(x)dx

(而不用求E\eta = \int _{-\infty }^{\infty }\eta f(\eta)dx中密度函数 f(\eta) 。)

 

3.3 方差D\xiVar\xi(样本点与期望差值(距离、误差)的期望)

 D\xi =E(\xi - E \xi)^2

= \int _{-\infty }^{\infty }(x - E \xi)^2f(x)dx

= \int _{-\infty }^{\infty }x^2f(x)dx - (E \xi)^2

 

其中E \xi^2= \int _{-\infty }^{\infty }x^2f(x)dx为 \xi 的二阶原点矩

       D\xi =E(\xi - E \xi)^2 为 \xi 的二阶中心矩

4. 契比雪夫不等式

4.1 方差由期望和样本点推导出来,是刻画随机变量对数学期望离散程度的最重要的数字特征。

4.2 契比雪夫定理:对于任何具有有限方差的随机变量 \xi 都有 

P (|\xi - E\xi | \geq \varepsilon) \leq \frac{D\xi}{\varepsilon ^2}

4.2.1 由不等式可知,随机变量 \xi 的取值离其期望距离大于 \varepsilon 的概率,为方差所控制(也与 \varepsilon​​​​​​​ 有关)。若方差很小,则这个概率也很小。从这也可以看出方差是描述随机变量与其均值离散程度的一个量。

4.2.2 只需要知道随机变量的期望(均值)和方差,不必知道分布(密度函数),就能求出随机变量取值偏离期望大于任意给定 \varepsilon 的概率之上界。

5. 均匀分布

6.正态分布(高斯分布)

猜你喜欢

转载自blog.csdn.net/linyijiong/article/details/81352585