正态分布
关于正态分布的由来,在文章《正态分布的前世今生》中写的很清楚,正态分布是由二项分布而来。正态分布的密度形式首次发现是在棣莫弗-拉普拉斯中心极限定理中。读者可以通过以下几个链接深入了解正态分布的含义
正态分布的前世今生(上)
正态分布的前世今生(下)
为什么正态分布如此常见
棣莫弗-拉普拉斯中心极限定理
设随机变量
Xn(n=1,2,⋯)
服从参数为
n,p(0<p<1)
的二项分布,则对于任意
x
, 有
limn→∞P{Xn−npnp(1−p)−−−−−−−−√≤x}=∫x−∞12π−−√exp(−t22)dt=Φ(x)(1)
从该定理中可以看出,当
n→∞
时候,可以用二项分布趋于高斯分布。我们可以通过棣莫弗-拉普拉斯中心极限定理来计算二项分布的概率。
设随机变量随机变量
X
服从正态分布(高斯分布)
X∼N(μ,σ22)
,则其概率密度函数表示为
p(x)=12πσ2−−−−√exp[−(x−μ)22σ](2)
多元正态分布
设
X,Y
为独立同分布的随机变量,且
X∼N(0,1)
。则
X,Y
的联合分布为
p(x,y)=p(x)p(y)=12πexp(−12(x2+y2))(3)
设
z=[X,Y]T
,则有
p(z)=1πexp(−12zTz)=1πexp(−12tr(zzT))(4)
令
z=A(x−μ)
,该线性变换的雅可比行列式为
J=|A|(5)
代入
z
的概率公式中有,
p(x)=|A|πexp[−12(x−μ)TATA(x−μ)](6)
令
Σ−1=ATA
,则
p(x)=1|Σ|−−−√2πexp[−12(x−μ)TΣ−1(x−μ)](7)
若
x
的维数是
n
,则有
p(x)=1|Σ|−−−√(2π)n/2exp[−12(x−μ)TΣ−1(x−μ)](8)
矩阵正态分布
设随机矢量
x∈Rn
服从多元高斯分布
x∼N(0,I)
,随机矢量
y
与
x
独立同分布,则
x,y
的联合概率密度为
p(x,y)=1(2π)nexp[−12(xTx+yTy)](9)
令
Z=[x,y]
,则有
p(Z)=1(2π)nexp[−12tr(ZZT)](10)
设
Z=A(X−M)B
, 其中
A∈Rn×n,B∈R2×2
。其雅可比行列式为
J=|A|n|B|2(11)
关于上式的详细解释参见附录A。
因此
p(X)=1(2π)n|A|n|B|2exp[−12tr(A(X−M)BBT(X−M)TAT)]=1(2π)n|A|n|B|2exp[−12tr(ATA(X−M)BBT(X−M)T)](12)(13)
令
Ω−1=ATA
,
Σ−1=BBT
, 则
p(X)=1(2π)n|Ω|−n/2|Σ|−2/2exp[−12tr(Ω−1(X−M)Σ−1(X−M)T)](14)
若
Z
有
p
列,则
p(X)=1(2π)np|Ω|−n/2|Σ|−p/2exp[−12tr(Ω−1(X−M)Σ−1(X−M)T)](15)
附录 A
设线性变换
Y=AX
, 其中
X∈Rm×n
,
A∈Rm×m
vec(Y)=vec(AX)=(In⊗A)vec(X)(16)
因此该线性变换的雅可比行列式为
J=|In⊗A|=|A|n(17)
设置线性变换
Y=XB
,其中
X∈Rm×n
,
B∈Rn×n
vec(Y)=vec(XB)=(BT⊗Im)vec(X)(18)
因此该线性变换的雅可比行列式为
J=|BT⊗Im|=|B|m(19)