随机变量的数字特征
一、数学期望
定义:
1 设离散型随机变量X的分布律为P{X=xk}=pk, k=1,2,…。若级数
绝对收敛,则称级数
的和为随机变量X的数学期望,记为E(X),即E(X)=
2.设连续型随机变量X的概率密度为f(x),若积分 绝对收敛,则称积分 的值为随机变量X的数学期望,记为E(X),即E(X)=
数学期望简称期望,又称为均值。
定理:
设Y是随机变量X的函数:Y=g(X)(g是连续函数)。
(i) 如果X是离散型随机变量,它的的分布律为P{X=xk}=pk, k=1,2,…,若
绝对收敛,则有E(Y)=E[g(X)]=
.
(ii) 如果X是连续型随机变量,它的的概率密度为f(x),若
绝对收敛,则有E(Y)=E[g(X)]=
.
定理的重要意义在于当我们求E(Y)时,不必计算出Y的分布律或概率密度,而只需利用X的分布律或概率密度就可以了。
性质:
1.设C是常数,则有E(C )=C.
2.设X是一个随机变量,C是常数,则有E(CX)=CE(X).
3.设X,Y是两个随机变量,则有E(X+Y)=E(X)+E(Y). 这一性质可以推广到任意有限个随机变量之和的情况。
4.设X,Y是相互独立的随机变量,则有E(XY)=E(X)E(Y)。这一性质可以推广到任意有限个相互独立的随机变量之积的情况。
二、方差
定义:
设X是一个随机变量,若E{[X-E(X)]2}存在,则称E{[X-E(X)]2}为X的方差 ,记为D(X)或Var(X),即D(X)=Var(X)=E{[X-E(X)]2}.
在应用上还引入量
,记为
,称为标准差或均方差。
方差度量了随机变量X与其均值E(X)的偏离程度。刻画了X取值的分散程度。
由定义知,方差是随机变量X的函数g(X)=(X-E(X))2的数学期望,于是
1.对于离散型随机变量,X的分布律为P{X=xk}=pk, k=1,2,…,有
D(X)=
.
2.对于连续型随机变量,X的概率密度为f(x),有
D(X)=
.
随机变量X的方差可按下列公式计算:
性质:
1.设C是常数,则有D(C )=0.
2.设X是一个随机变量,C是常数,则有D(CX)=C2D(X),D(X+C)=D(X).
3.设X,Y是两个随机变量,则有D(X+Y)=D(X)+D(Y)+2E{(X-E(X))(Y-E(Y))}.
特别,若X,Y相互独立,则有D(X+Y)=D(X)+D(Y).这一性质可以推广到任意有限多个相互独立的随机变量之和的情况。
4.D(X)=0的充要条件是X以概率1取常数E(X),即P{X=E(X)}=1.
几个重要分布的均值与方差:
1.泊松分布
设随机变量X~
(
),E(X)=
,D(X)=
.
2.二项分布
设随机变量X~b(n,p),E(X)=np,D(X)=np(1-p).
3.均匀分布
设随机变量X~U(a,b),E(X)=
,D(X)=
.
4.指数分布
设随机变量X服从指数分布,E(X)=
,D(X)=
5.正态分布
设随机变量X~N(
,
),,E(X)=
,D(X)=
.
切比雪夫不等式:
设随机变量X具有数学期望E(X)=
,方差D(X)=
,则对于任意正数
,不等式
成立.
或
切比雪夫不等式给出了在随机变量的分布未知,而只知道E(X)和D(X)的情况下估计概率
的界限。
三、协方差及相关系数
定义:
量E{(X-E(X))(Y-E(Y))}称为随机变量X与Y的协方差,记为Cov(X,Y),即Cov(X,Y)=E{(X-E(X))(Y-E(Y))}.而
称为随机变量X与Y的相关系数。
由定义即知,Cov(X,Y)=Cov(Y,X),Cov(X,X)=D(X).
对于任意两个随机变量X和Y,D(X+Y)=D(X)+D(Y)+2Cov(X,Y).
Cov(X,Y)的定义式展开得Cov(X,Y)=E(XY)-E(X)E(Y).
协方差性质:
1.Cov(aX,bY)=abCov(X,Y),a,b是常数。
2.Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
相关系数性质:
1.
2.
的充要条件是,存在常数a,b使P{Y=a+bX}=1
是一个可以用来表征X,Y之间线性关系紧密程度的量。当X,Y相互独立时,Cov(X,Y)=0,从而
=0,即X,Y不相关;反之,X,Y不相关,X和Y不一定相互独立。不相关只是就线性关系来说的,而相互独立是就一般关系而言的。
不过,当(X,Y)服从二维正态分布时,X和Y不相关与X和Y相互独立是等价的。
四、矩、协方差矩阵
矩:
设X和Y是随机变量,若E(Xk), k=1,2,…,存在,称它为X的k阶原点矩,简称k阶矩。
若E{[X-E(X)]k}, k=1,2,…,存在,称它为X的k阶中心矩。
若E(XkYl), k,l=1,2,…,存在,称它为X和Y的k+l阶混合矩。
若E{[X-E(X)]k [(Y-E(Y)]l}, k,l=1,2,…,存在,称它为X和Y的k+l阶混合中心矩。
协方差矩阵:
设n维随机变量(X1, X2, …, Xn)的二阶混合中心距
都存在,则称矩阵
为n维随机变量(X1, X2, …, Xn)的协方差矩阵。协方差矩阵是一个对称的矩阵。
n维正态随机变量:
n维正态随机变量(X1, X2, …, Xn)的概率密度定义为:
, 其中C是(X1, X2, …, Xn)的协方差矩阵。
,
n维正态随机变量的性质:
1.n维正态随机变量(X1, X2, …, Xn)的每一个分量Xi, i=1,2,…,n都是正态随机变量;反之,若**X1, X2, …, Xn**都是正态随机变量,且相互独立,则(X1, X2, …, Xn)是n维正态随机变量。
2.n维随机变量(X1, X2, …, Xn)服从n维正态分布的充要条件是**X1, X2, …, Xn**的任意线性组合l1X1+l2X2+ …+ ln**Xn**服从一维正态分布(其中l1, l2, …, ln不全为零)。
3.若(X1, X2, …, Xn)服从n维正态分布,设Y1, Y2, …, Yk是Xj (j=1,2,…,n)的线性函数,则(Y1, Y2, …, Yk)也服从多维正态分布。(正态变量的线性变换不变性)。
4.设(X1, X2, …, Xn)服从n维正态分布,则“X1, X2, …, Xn 相互独立”与“X1, X2, …, Xn 两两不相关”是等价的。