Lecture5_1&5_2随机变量的数字特征(数学期望、方差、协方差)

一、数学期望

1.离散型随机变量的数学期望

设X为离散随机变量,其概率分布为:P(X=xk)=pk

若无穷级数$\sum_{k=1}^{+\infty}x_kp_k$绝对收敛

(即满足$\sum_{k=1}^{+\infty}|x_kp_k|$收敛)

则称其为X的数学期望,记作$E(X)=\sum_{k=1}^{+\infty}x_kp_k$

二项分布,X~B(n,p),E(X)=np

泊松分布,X~P(λ),E(X)=λ

超几何分布,X~H(N,M,n),E(X)=nM/N

几何分布,X~GE(p),E(X)=1/p

2.连续型随机变量的数学期望

设连续型随机变量X的概率密度为f(x)

若广义积分$\int_{-\infty}^{+\infty}xf(x)dx$绝对收敛

则称此积分为X的数学期望

$E(X)=\int_{-\infty}^{+\infty}xf(x)dx$

均匀分布,X~U[a,b],E(X)=(a+b)/2

指数分布,X~E(λ),E(X)=1/λ

正态分布,X~N(μ,σ2),E(X)=μ

卡方分布,X~Γ(α,β),E(X)=α/β

3.随机变量函数Y的数学期望

Y=g(X)

离散型,$E(Y)=\sum_{i=1}^{+\infty}g(x_i)p_i$

连续型,$E(Y)=\int_{-\infty}^{+\infty}g(x)f(x)$

Z=φ(X1,...,Xn)

$E(Z)=\int_{-\infty}^{+infty}...\int_{-\infty}^{+\infty}\varphi(x_1,x_2,...,x_n)f(x_1,x_2,...,x_n)dx_1dx_2...dx_n$

4.数学期望的性质

设a,ai,C为常数

(1)E(C)=C

(2)E(aX)=aE(X)

(3)E(X+Y)=E(X)+E(Y)

(4)X,Y独立->E(XY)=E(X)E(Y)

逆命题不成立,可推广到n个独立随机变量

(5)若存在数a使得P(X≥a)=1,则E(X)≥a

(6)[E(XY)]2≤E(X2)(Y2),许瓦尔兹不等式

二、方差

1.方差的定义

若E[X-E(X)]2存在,则称其随机变量X的方差,记为D(X)或Var(X),即:

D(X)=E[X-E(X)]2

称$σ=\sqrt{D(X)}$为X的均方差或标准差

【方差描述随机变量 X 的取值偏离其平均水平的平均偏离程度,从而刻划了X 可能取值的分散程度】

2.

离散型随机变量的方差:$D(X)=\sum_{k=1}^{+\infty}(x-E(X))^2p_k$

连续型随机变量的方差:$D(X)=\int_{-\infty}^{+\infty}(x-E(X))^2f(x)dx$

计算方差常用公式:D(X)=E(X2)-E2(X)

证:D(X)=E[(X-EX)2]=E[X2-2XEX+(EX)2]=E(X2)-E(2XEX)+E[(EX)2]=E(X2)-2(EX)2+(EX)2=E(X2)-(EX)2

0-1分布,D(X)=pq

二项分布,D(X)=npq

泊松分布,D(X)=λ

几何分布,D(X)=q/p2

均匀分布,D(X)=(b-a)2/12

指数分布,D(X)=1/λ2

正态分布,D(X)=σ2

Γ分布,D(X)=α/β2

3.方差的性质:

(1)D(C)=0

(2)D(aX)=a2D(X)

D(aX+b)=a2D(X)

(3)D(X±Y)=D(X)+D(Y)±2E((X-E(X))(Y-E(Y))

特别地,若X,Y相互独立,则D(X+Y)=D(X)+D(Y),反之不成立

(4)若X1,...,Xn相互独立,a1,a2,...,an,b为常数

则$D\left(\sum_{i=1}^{n}a_iX_i+b\right)=\sum_{i=1}^{n}a_i^2D(X_i)$

(5)对任意常数C,D(X)≤E(X-C)2,当且仅当C=E(X)时,等号成立

(6)D(X)=0 <==> P(X=E(X))=1

即X服从单点分布

切尔雪夫不等式:对随机变量X,设E(X),D(X)存在,则对任意ε>0:

P{|X-E(X)|≥ε}≤$\frac{D(X)}{\varepsilon^2}$

注:

(1)不是所有的随机变量都有数学期望和方差

(2)数学期望和方差不能确定分布

(3)已知分布类型,数学期望和方差的情况下,可完全确定分布

4.偏度系数,峰度系数,分位数,中位数,变异系数

设随机变量X,a和p(0<p<1),若下式成立

P(X≤a)≥p≥P(X<a)

则称a为X的p分位数,记为xp=a

0.5分位数又称为X的中位数,记位med(X)

p分位数一定存在,但不唯一

当X为连续随机变量时,p分位数通常存在且唯一,可(重新)定义分位数如下:

设连续随机变量X的概率分布密度为f(x),0<p<1.若xp使得

P(X≤xp)=p

即$\int_{-\infty}^{x_p}f(x)dx=p$

则称xp为X的p分位数,该分位数又称下侧分位数(左)

上侧分位数(右):

若xα使得P(X>xα)=α

即$\int_{x_\alpha}^{+\infty}f(x)dx=\alpha$

三、协方差与相关系数

1.协方差的定义

对二维随机变量(X,Y),若E([X-E(X)][Y-E(Y)])存在,称其为二维随机变量(X,Y)的协方差,记为

cov(X,Y)=E((X-E(X)(Y-E(Y)))

2.协方差的性质

(1)cov(X,Y)=cov(Y,X)=E(XY)-E(X)E(Y)

(2)cov(X,X)=D(X)

(3)cov(a1X+b1,a2Y+b2)=a1a2cov(X,Y),其中a1,b1,a2,b2为常数

(4)cov(X+Y,Z)=cov(X,Z)+cov(Y,Z)

(5)D(X±Y)=D(X)+D(Y)±2cov(X,Y)

(6)|cov(X,Y)|2≤D(X)D(Y)

3.随机变量的标准化

设随机变量X的期望E(X)、方差D(X)都存在,且D(X)≠0,则称

$X*=\frac{X-E(X)}{\sqrt{D(X)}}$

为X的标准化随机变量.易见,

E(X*)=0,D(X*)=1

4.相关系数的定义

对二维随机变量(X ,Y),若其协方差存在,且D(X)>0,D(Y)>0,则称

$E\left(\frac{(X-E(X))(Y-E(Y))}{\sqrt{D(X)}\sqrt{D(Y)}}\right)=\frac{cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}$

为X,Y的相关系数,记为ρXY=cov(X*,Y*)

若ρXY=0,则称X,Y(线性)不相关<==>cov(X,Y)=0<==>E(XY)=E(X)E(Y)<==>D(X±Y)=D(X)+D(Y)

(注:独立一定不相关,不相关不一定独立。若(X,Y)服从二维正态分布,则等价)

若ρXY=1,则X,Y有线性相关的概率为1<==>存在常数a,b,且a≠0,使得P(Y=aX+b)=1

5.协方差矩阵

$$
\left\[
\begin{matrix}
   D(X) & cov(X,Y) \\
   cov(Y,X) & D(Y)
  \end{matrix}
  \right\] \tag{2}
$$

为二维随机变量(X,Y)的协方差矩阵

n维随机变量的协方差矩阵

设n维随机变量(X1,X2,...,Xn),记σij=cov(Xi,Xj),若σij都存在,则称

$$
\left\{
\begin{matrix}
   \sigma_{11} & \sigma_{12} & \cdots & \sigma_{1n} \\
   \sigma_{21} & \sigma_{22} & \cdots & \sigma_{2n} \\

   \vdots & \vdots & \ddots & \vdots \\

   \sigma_{n1} & \sigma_{n2} & \cdots & \sigma_{nn}

  \end{matrix}
  \right\} \tag{2}
$$

为(X1,X2,...,Xn)的协方差矩阵

性质:(1)对称非负定(2)σii=DXi(3)$\sigma_{ij}^2<\sigma_{ii}\sigma_{jj}$

猜你喜欢

转载自www.cnblogs.com/victorique-de-blois/p/10703126.html