统计-大数定律及中心极限定理

第五章 大数定律及中心极限定理

切比雪夫不等式

定理

设随机变量X的数学期望E(X)和方差D(X)都存在,则对任意 ε >0,都有

P{|X-E(X)|≥ ε }≤ D(X)ε2 ( ε >0)

P{|X- μ |≥ ε }≤ σ2ε2

{|X- μ |≥ ε }的对立事件是{|X- μ |< ε }

另一个形式

P{|X- μ |< ε }≥ 1σ2ε2

意义

在随机变量X的分布位置,而只知道X的均值和方差(或已知分布但很复杂)的情况下,切比雪夫不等式给出了概率P{|X-E(X)|≥ ε }的一个估计范围

1.对给定的 ε >0,估计|X-E(X)|≥ ε 的概率

2.对给定的概率p,确定所需的区间长度,即确定满足不等式

P{|X-E(X)|≥ ε }≥p的 ε

例子

设某电网有1000盏灯,夜里每盏灯开灯的概率都是0.7.假设电灯开关时间彼此独立,试估计夜晚同时开着的灯数在6800与7200之间的概率

X表示在夜晚开着电灯的数

X服从参数n=10000,p=0.7的二项分布

p{6800

大数定律

依概率收敛

设X1,X2,…,Xn,…是一个随机变量的序列,a是一个常数。

若对应任意实数 ε >0都有

limnP|Xna|<ε=1

则称序列X1,X2,…,Xn,…依概率收敛与a,记为

XnPa

以上极限等价于 limnP|Xna|ε=0

{Xn}依概率收敛与a是指:当n充分大后,随机变量Xn几乎总是取值a,或者取值与a非常接近。

大数定律是有关随机变量序列的前n项的算术平均值在一定条件下收敛到这n项的数学期望的算术均值的定理

大数定律定理

设{ Xk }为随机变量序列,它们数学期望都存在。若对于任意 ε >0都有

limnP{|1nnk=1Xk1nnk=1E(Xk)|<ε}=1

则称随机变量序列{ Xk }服从大数定律。

以上极限表明: 1nnk=1XkP1nnk=1E(Xk)

#### 切比雪夫大数定理

设X1,X2,…,Xn,…是相互独立的随机变量的序列,它们的数学期望和方差都存在,且存在常数C,使得D(Xk)≤C(k=1,2,..)则对于任意 ε >0有

limnP{|1nnk=1Xk1nnk=1E(Xk)|<ε}=1

1nnk=1XkP1nnk=1E(Xk)

所有随机变量互相独立

X= 1nnk=1Xk

limnP{|XE(X)|<ε}=1

XPE(X)

当n充分大时,X1,X2,…,Xn的算术平均值

X= 1nnk=1Xk

在概率意义下会充分接近其数学期望E( X )

辛钦大数定理

设X1,X2,…,Xn,…是相互独立, 的随机变量的序列,且具有数学期望E( Xk )= μ (k=1,2,..)则对于任意 ε >0有

limnP{|1nnk=1Xkμ|<ε}=1

limnP{|Xμ|<ε}=1

即在定理的条件下,随机变量X1,X2,…,Xn,..的算术平均值将以概率收敛到 μ

XPμ

伯努利大数定理

设在n次独立实验中事件A发生的次数为 fA ,p是事件A在每次事件中发生的概率,则对于任意 ε >0有

limnP{|fAnp|<ε}=1

fAnPμ

在实际运用中,当试验次数较多时,我们常以事件发生的频率来近似地估计事件发生的概率。

中心极限定理

概念

在一定条件下,充分多的相互独立的随机变量的算术平均值将服从正态分布,不管这些随机变量本身服从什么分布。

列维-林德伯格定理 Levy-Lindberg(独立同分布的中心极限定理)

定义

设随机变量X1,X2,…,Xn,…是相互独立, 并且E( Xk )= μ ,D( Xk )= σ2 >0(k=11,2,..),则随机变量

Yn=nk=1Xknμnσ (前n个随机变量和-n乘数学期望)

的分布函数 Fn=P{Ynx} 满足

limnFn(x)=limnP{Ynx}=Φ(x)=x12/piet22dt (标准正态分布)

以上定理表示:若随机变量X1,X2,…,Xn,…是相互独立同分布,且E(Xk)D(Xk)存在,当n很大时,Yn近似地服从标准正态分布N(0,1)

同时除以n Yn=1nnk=1Xkμσn = Xμσn ~N(0,1)

E(X)=E(1nnk=1Xk)=1nnk=1E(Xk)=μ

D(X)=D(1nnk=1Xk)=1n2nk=1D(Xk)=1n2nσ2=σ2n

Yn X=1nnk=1Xk 的标准化变了

以上定理表明,在定理的条件下,无论{Xk}服从什么分布,当n很大时候,其前n项的算术均值 X 的标准化服从正态分布N(0,1)

或者等价地,为标准化的

X=1nnk=1Xk ~ N(μ,σ2n)

X~ N(μ,σ2)=>Y=aX+b N(aμ+b,a2σ2)

写法

部分和 Sn=nk=1Xk ~ N(nμ,nσ2)

部分和标准化 Yn=nk=1Xknμnσ ~N(0,1)

算术平均值 X=1nnk=1Xk ~ N(μ,σ2n)

算术平均值标准化 YN=Xμσ/n ~N(0,1)

例子

设某糖厂包装一批白糖,每袋标准量为1kg,由于误差,每袋白糖的重量在0.95,1.05kg上均匀分布。设每袋白糖的重量相互独立。若装1200袋白糖,问总质量大于1202kg的概率是多少?

设Xi表示第i袋的白糖重量 i=1,。。。,1200

Xi ~U(0.95,1.05) μ=E(Xi) =(0.95+1.05)/2=1

σ2=D(Xi) = (1.050.95)212 =1\1200

独立分布方差,期望都存在, 符合列定理 部分和 Sn=nk=1Xk ~ N(nμ,nσ2)

白糖总重量

X= 1200k=1Xk ~N(1200x1,1200*1/1200)=N(1200,1 )

p{X>1201}=1-{X≤1202}≈1- Φ(120212001) (正态分布标准化)=1- Φ (2)=1-0.9772(查表)=0.0228

棣莫弗-拉姆拉斯定理 (二项分布的极限分布)

定义

设随机变量 Xn 服从参数为n,p(0

例子

设在某实验中,事件A发生的概率为1/3。若独立的做了90000次试验,qui事件A发生次数在29500~30500之间的概率。

记X是90000次试验中事件A发生的次数

X服从二项分布b(90000,1/3),其中分布律为

P{X=k}= \Ck90000(13)k(23)90000k

P{29500≤X≤30500}= \C30500k=29500(13)k(23)90000k

计算量太大,用正态分布近似计算

np=90000*1/3=30000

np(1-p)=90000 * 1/3 * 2/3=20000

P{a

李雅普诺夫定理 (独立不同分布的中心极限定理)

猜你喜欢

转载自blog.csdn.net/jshazhang/article/details/79732057