1、数学期望
离散型数据
设随机变量
X只取得有限个可能值
a1,⋯,am,其概率分布为
P(X=ai)=pi,(i=1,⋯,m),则
X的数学期望,即
E(X)∗=EX=a1p1+a2p2+⋯ampm
一般理解为以概率为权的加权平均。
N次试验中
X的取值,记为
Xˉ=(a1N1+a2N2+⋯+amNm)/N=a1(N1/N)+a2(N2/N)+⋯+am(Nm/N)
其中
Ni/N是事件
X=ai在
N次试验中的频率,当
N很大时
Ni/N接近
pi,
X的数学期望
E(X),可认为在大量试验之下
X在各次试验中取值的平均。
连续型数据
设
X有概率密度函数
f(x),如果
∫−∞∞∣x∣f(x)dx≤∞
则称
E(x)=∫−∞∞xf(x)dx
为
X的数学期望(由
E(X′)≈∑ixif(xi)Δxi推导而来)。
常见分布的数学期望
(1)设
X服从泊松分布
X∼P(λ),则
E(X)=i=0∑∞ii!λie−λ=λe−λi=1∑∞(i−1)!λi−1=λe−λi=0∑∞i!λi=λ
(2)设
X服从
[a,b]区间的均匀分布,则
E(X)=b−a1∫abxdx=21(a+b)
(3)若
X服从指数分布,则
E(X)=λ∫0∞xe−λxdx=λ−1∫0∞xe−xdx=λ−1Γ(2)=λ−1
(4)设
X服从正太分布
N(μ,σ2),则
E(X)=2π
σ1∫−∞∞xe−2σ2(x−u)2dx
令
x=μ+σt,则由对称性容易推得
E(X)=2π
1∫−∞∞(μ+σt)e−t2/2dt=u
数学期望性质
(1)若干个随机变量之和的期望等于各变量的期望之和,即
E(X1+X2+⋯+Xn)=E(X1)+E(X2)+⋯+E(Xn)
(2)若干个独立随机变量之积的期望等于各变量的期望之和,即
E(X1X2⋯Xn)=E(X1)E(X2)⋯E(Xn)
(3)设随机变量
X为离散型,有分布
P(X=ai)=pi(i=1,2,⋯);或者为连续型,有概率密度函数
f(x),则
E(g(X))=i∑g(ai)pi或E(g(X))=∫−∞∞g(x)f(x)dx
特殊情况下,若
c为常数,则
E(cX)=cE(X)
(4)设连续型随机变量
X的分布函数为
F(x),则满足条件
P(X≤m)=F(m)=1/2
的数
m称为
X或分布
F的中位数。
2、方差与矩
方差
设
X为随机变量,分布为
F,则
Var(X)=E(X−EX)2=E(X2)−(EX)2
称为
X(或分布
F)的方差,其平方根
Var(X)
称为
X(或分布
F)的标准差。
性质:
1。常数的方差为0;
2。若
c为常数,则
Var(X+c)=Var(X);
3。若
c为常数,则
Var(cX)=c2Var(X);
如对于随机变量
X={1,2,3},均值
Xˉ=2,则方差
S2=3(1−2)2+(2−2)2+(3−2)2
可视为
{1,2,3}发生的概率均为
1/3。
矩
设
X为随机变量,
c为常数,
k为正整数,则量
E[(X−c)k]称为
X关于
c点的
k阶矩。
(1)
c=0,此时
αk=E(Xk)称为
X的
k阶原点矩;
(2)
c=E(X),此时
μ=E[(X−EX)k]称为
X的k阶中心矩;
即一阶原点矩就是期望,二阶中心矩就是方差。
协方差
Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=E(XY)−E(X)E(Y)
性质:
1。若
X,
Y独立,则
Cov(X,Y)=0;
2。
Cov2(X,Y)≤σ12σ22,当前仅当
X,
Y有严格线形关系时,等号成立(即
Y=a+bX);
证明: 考虑下式
E[t(X−E(X))+(Y−E(Y))]2=σ12t2+2Cov(X,Y)t+σ22
显然上式对于所有的
t均成立,由一元二次方程大于零,知系数满足
σ12σ22≥Cov2(X,Y)
若上式等号成立,则有
σ12t2+2Cov(X,Y)t+σ22=(tσ1+σ2)2=0
故
t0=−σ2/σ1时,等式成立。由于
E2(Z)的非负性,知性质2得证,即
t(X−E(X))+(Y−E(Y))=0
相关系数
Corr(X,Y)=Cov(X,Y)/(σ1σ2)
性质:
1。若
X,
Y独立,则
Corr(X,Y)=0;
2。
∣Corr(X,Y)∣≤1,当且仅当
X,
Y有严格线形关系时等式成立;
相关系数常称为"线形相关系数",相关系数只是反映了
X,
Y的"线性"相关程度;对于非线性关系,
∣Corr(X,Y)∣的值不定。
如
设
X∼R(−1/2,1/2),即区间
[−1/2,1/2]内的均匀分布,而
Y=cos(X),由于
E(X)=0知
Cov(X,Y)=E(XY)=E(Xcos(X))=∫−1/21/2xcosxdx=0
X,
Y有严格的函数关系(非线性),但其协方差为0。