学习笔记——概率论与数理统计(第四章)
学习来源:https://www.bilibili.com/video/av36206436/
第四章
4.1.1 离散型变量的数学期望
P ( X = x k ) = P k ,若 ∑ k = 1 ∞ x k P k 绝对收敛,则 E X = ∑ k = 1 ∞ x k P k 称为期望或均值 P(X=x_k)=P_k,若\displaystyle\sum\limits_{k=1}^\infin x_kP_k 绝对收敛,则E_X=\displaystyle\sum\limits_{k=1}^\infin x_kP_k称为期望或均值 P(X=xk)=Pk,若k=1∑∞xkPk绝对收敛,则EX=k=1∑∞xkPk称为期望或均值
定义中要求积数绝对收敛,保证了积数的和与求和顺序无关
离散型变量可以是无穷多个
4.1.2 连续型变量的数学期望
随机变量 X ,密度函数为 f ( x ) ,若 ∫ − ∞ + ∞ x f ( x ) d x 绝对收敛,则 E X = ∫ − ∞ + ∞ x f ( x ) d x 称为数学期望 随机变量 X,密度函数为f ( x ),若\displaystyle\int_{-\infin}^{+\infin}xf(x)dx绝对收敛,则E_X=\displaystyle\int_{-\infin}^{+\infin}xf(x)dx称为数学期望 随机变量X,密度函数为f(x),若∫−∞+∞xf(x)dx绝对收敛,则EX=∫−∞+∞xf(x)dx称为数学期望
4.1.3 随机变量函数的数学期望
Y=g(X)
离散:
E X = ∑ x i P i E_X=\displaystyle\sum x_iP_i EX=∑xiPi
E Y = ∑ g ( x i ) P i E_Y=\displaystyle\sum g(x_i)P_i EY=∑g(xi)Pi
连续:
E X = ∫ − ∞ + ∞ x f ( x ) d x E_X=\displaystyle\int_{-\infin}^{+\infin}xf(x)dx EX=∫−∞+∞xf(x)dx
E Y = ∫ − ∞ + ∞ g ( x ) f ( x ) d x E_Y=\displaystyle\int_{-\infin}^{+\infin}g(x)f(x)dx EY=∫−∞+∞g(x)f(x)dx
二维变量函数:
设二维变量( X , Y ) ,求Z = g ( X , Y )的期望
离散: E Z = ∑ i ∑ j g ( x i , y i ) P i j E_Z=\displaystyle\sum_i\sum_jg(x_i,y_i)P_{ij} EZ=i∑j∑g(xi,yi)Pij
连续: E Z = ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y E_Z=\displaystyle\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}g(x,y)f(x,y)dxdy EZ=∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy
4.1.4 数学期望的性质
- E( C )=C(常数的期望等于常数)
- E ( X + C ) = E ( X ) + C
- E ( CX ) = C ⋅ E ( X )
- E ( kX + b ) = k ⋅ E ( X ) + b
- E ( X ± Y ) = E ( X ) ± E ( Y ) E(X\pm Y)=E(X)\pm E(Y) E(X±Y)=E(X)±E(Y)
E ( ∑ C i X i ) = ∑ C i E ( X i ) E(\sum C_iX_i)=\sum C_iE(X_i) E(∑CiXi)=∑CiE(Xi)
E ( 1 n ∑ X i ) = 1 n ∑ E ( X i ) \displaystyle E(\frac{1}{n}\sum X_i)=\frac{1}{n}\sum E(X_i) E(n1∑Xi)=n1∑E(Xi) - X Y 独立时,有:E ( XY ) = E ( X ) ⋅ E ( Y )
4.1.5 条件期望
定义:一个变量取某个值的前提下,另一个变量的期望
离散型
E ( X ∣ Y = y j ) = ∑ x i P ( X = x i ∣ Y = y j ) E(X|Y=y_j)=\displaystyle\sum x_iP(X=x_i|Y=y_j) E(X∣Y=yj)=∑xiP(X=xi∣Y=yj)
E ( Y ∣ X = x i ) = ∑ y j P ( Y = y j ∣ X = x i ) E(Y|X=x_i)=\displaystyle\sum y_jP(Y=y_j|X=x_i) E(Y∣X=xi)=∑yjP(Y=yj∣X=xi)
连续型
E ( X ∣ Y = y ) = ∫ − ∞ + ∞ x f ( x ∣ y ) d y E(X∣Y=y)=\displaystyle\int_{-\infin}^{+\infin}xf(x|y)dy E(X∣Y=y)=∫−∞+∞xf(x∣y)dy
E ( Y ∣ X = x ) = ∫ − ∞ + ∞ y f ( y ∣ x ) d y E(Y|X=x)=\displaystyle\int_{-\infin}^{+\infin}yf(y|x)dy E(Y∣X=x)=∫−∞+∞yf(y∣x)dy
4.2.1 方差
偏离程度
方差: D ( X ) = E ( ( X − E X ) 2 ) D(X)=E((X-EX)^2) D(X)=E((X−EX)2)
标准差: D ( X ) \sqrt{D(X)} D(X)
- 离散型: D ( X ) = ∑ k ( x k − E ( X ) ) 2 P k D(X)=\displaystyle\sum_k(x_k-E(X))^2P_k D(X)=k∑(xk−E(X))2Pk
- 连续型: D ( X ) = ∫ − ∞ + ∞ ( x − E ( X ) ) 2 f ( x ) d x D(X)=\displaystyle\int_{-\infin}^{+\infin}(x-E(X))^2f(x)dx D(X)=∫−∞+∞(x−E(X))2f(x)dx
常用公式: D ( X ) = E ( X 2 ) − E ( X ) 2 D(X)=E(X^2)-E(X)^2 D(X)=E(X2)−E(X)2
4.2.2 方差的性质
- D( C )=0
- D ( X + C ) = D ( X )
- D ( C X ) = C 2 D ( X ) D(CX)=C^2D(X) D(CX)=C2D(X)
- D ( k X + b ) = k 2 D ( X ) D(kX+b)=k^2D(X) D(kX+b)=k2D(X)
- 当 X Y 独立时, D ( X ± Y ) = D X + D Y D(X\pm Y)=DX+DY D(X±Y)=DX+DY
推论:当 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,⋯,Xn独立时, D ( X 1 ± X 2 ± ⋯ ± X n ) = D X 1 + ⋯ + D X n D(X_1\pm X_2\pm\cdots\pm X_n)=DX_1+\cdots+DX_n D(X1±X2±⋯±Xn)=DX1+⋯+DXn - D ( X ) = 0 ⟺ P ( X = E ( X ) ) = 1 D(X)=0\iff P(X=E(X))=1 D(X)=0⟺P(X=E(X))=1
标准化:令 X ∗ = X − E ( X ) D X X^*=\displaystyle\frac{X-E(X)}{\sqrt{DX}} X∗=DXX−E(X),则一定有: E ( X ∗ ) = 0 , D ( X ∗ ) = 1 E(X^*)=0,D(X^*)=1 E(X∗)=0,D(X∗)=1
4.3.1 常见离散型的期望和方差
分布 定义 E ( X ) D ( X ) 0 − 1 分布 P ( X = k ) = p k ( 1 − p ) 1 − k , k = 0 , 1 p p q 二项分布 P ( X = k ) = C n k p k q n − k , k = 0 , 1 , ⋯ , n n p n p q 几何分布 P ( X = k ) = ( 1 − p ) k − 1 p , k = 1 , 2 , ⋯ 1 p 1 − p p 2 泊松分布 P ( X = k ) = λ k k ! e − λ , k = 0 , 1 , ⋯ λ λ 均匀分布 f ( x ) = { 1 b − a x ∈ [ a , b ] 0 else a + b 2 ( b − a ) 2 12 指数分布 f ( x ) = { λ e − λ x x > 0 0 else 1 λ 1 λ 2 正态分布 ϕ ( x ) = 1 2 π σ e ( x − μ ) 2 2 σ 2 μ σ 2 \begin{array}{cccc} {分布}&{定义}&{E(X)}&{D(X)}\\ \hline {0−1分布}&{P(X=k)=p^k (1−p) ^{1−k},k=0,1}&{p}&{pq}\\ \hline {二项分布}&{P(X=k)=C_n^kp^kq^{n−k},k=0,1,⋯,n}&{np}&{npq}\\ \hline {几何分布}&{P(X=k)=(1−p)^{k−1}p,k=1,2,⋯}&{\displaystyle\frac{1}{p}}&{\displaystyle\frac{1-p}{p^2}}\\ \hline {泊松分布}&{P(X=k)=\displaystyle\frac{\lambda^k}{k!}e^{−λ},k=0,1,⋯}&{\lambda}&{\lambda}\\ \hline {均匀分布}&{f(x)=\begin{cases} \displaystyle\frac{1}{b-a}& x\in [a,b]\\0& \text{else} \end{cases}}&{\displaystyle\frac{a+b}{2}}&{\displaystyle\frac{(b-a)^2}{12}}\\ \hline {指数分布}&{f(x)=\begin{cases} \lambda e^{-\lambda x}& x > 0\\0& \text{else} \end{cases}}&{\displaystyle\frac{1}{\lambda}}&{\displaystyle\frac{1}{\lambda^2}}\\ \hline {正态分布}&{\phi(x)=\displaystyle\frac{1}{\sqrt{2\pi}\sigma}e^{\frac{(x-\mu)^2}{2\sigma^2}}}&{\mu}&{\sigma^2}\\ \end{array} 分布0−1分布二项分布几何分布泊松分布均匀分布指数分布正态分布定义P(X=k)=pk(1−p)1−k,k=0,1P(X=k)=Cnkpkqn−k,k=0,1,⋯,nP(X=k)=(1−p)k−1p,k=1,2,⋯P(X=k)=k!λke−λ,k=0,1,⋯f(x)=⎩ ⎨ ⎧b−a10x∈[a,b]elsef(x)={ λe−λx0x>0elseϕ(x)=2πσ1e2σ2(x−μ)2E(X)pnpp1λ2a+bλ1μD(X)pqnpqp21−pλ12(b−a)2λ21σ2
4.4.1 协方差
定义: C o v ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] Cov(X,Y)=E[(X-E(X))(Y-E(Y))] Cov(X,Y)=E[(X−E(X))(Y−E(Y))]
C o v ( X , Y ) = E ( X Y − X E ( Y ) − Y E ( X ) + E ( X ) E ( Y ) ) = E ( X Y ) − E ( Y ) E ( X ) − E ( X ) E ( Y ) + E ( X ) E ( Y ) = E ( X Y ) − E ( X ) E ( Y ) Cov(X,Y)=E(XY-XE(Y)-YE(X)+E(X)E(Y))=E(XY)-E(Y)E(X)-E(X)E(Y)+E(X)E(Y)=E(XY)-E(X)E(Y) Cov(X,Y)=E(XY−XE(Y)−YE(X)+E(X)E(Y))=E(XY)−E(Y)E(X)−E(X)E(Y)+E(X)E(Y)=E(XY)−E(X)E(Y)
(常用计算公式)
D ( X ± Y ) = D ( X ) + D ( Y ) ± 2 C o v ( X , Y ) D(X\pm Y)=D(X)+D(Y)\pm 2Cov(X,Y) D(X±Y)=D(X)+D(Y)±2Cov(X,Y)
协方差的性质:
- C o v ( X , Y ) = C o v ( Y , X ) C o v ( X , Y ) = C o v ( Y , X ) Cov(X,Y)=Cov(Y,X)
- C o v ( a X , b Y ) = a b ⋅ C o v ( X , Y ) C o v ( a X , b Y ) = a b ⋅ C o v ( X , Y ) Cov(aX,bY)=ab⋅Cov(X,Y)
- C o v ( X 1 + X 2 , Y ) = C o v ( X 1 , Y ) + C o v ( X 2 , Y ) Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
- C o v ( C , X ) = 0 C o v ( C , X ) = 0 Cov(C,X)=0
- X Y 独立时, C o v ( X , Y ) = 0 X Y独立时,C o v ( X , Y ) = 0 XY独立时,Cov(X,Y)=0
协方差 C o v ( X , Y ) 表示 X Y 的关系,受到计量单位的影响 协方差C o v ( X , Y )表示 X Y 的关系,受到计量单位的影响 协方差Cov(X,Y)表示XY的关系,受到计量单位的影响
标准化:
X ∗ = X − E ( X ) D ( X ) X^*=\displaystyle\frac{X-E(X)}{\sqrt{D(X)}} X∗=D(X)X−E(X)
Y ∗ = Y − E ( Y ) D ( Y ) Y^*=\displaystyle\frac{Y-E(Y)}{\sqrt{D(Y)}} Y∗=D(Y)Y−E(Y)
C o v ( X ∗ , Y ∗ ) = E ( X ∗ Y ∗ ) − E ( X ∗ ) E ( Y ∗ ) = E ( X − E ( X ) D ( X ) Y − E ( Y ) D ( Y ) ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] D ( X ) D ( Y ) = C o v ( X , Y ) D ( X ) D ( Y ) = ρ Cov(X^*,Y^*)=E(X^*Y^*)-E(X^*)E(Y^*)=E(\displaystyle\frac{X-E(X)}{\sqrt{D(X)}}\frac{Y-E(Y)}{\sqrt{D(Y)}})=\frac{E[(X-E(X))(Y-E(Y))]}{\sqrt{D(X)}\sqrt{D(Y)}}=\frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}=\rho Cov(X∗,Y∗)=E(X∗Y∗)−E(X∗)E(Y∗)=E(D(X)X−E(X)D(Y)Y−E(Y))=D(X)D(Y)E[(X−E(X))(Y−E(Y))]=D(X)D(Y)Cov(X,Y)=ρ
4.4.2 相关系数
ρ = C o v ( X , Y ) D ( X ) D ( Y ) = E ( X Y ) − E ( X ) E ( Y ) D ( X ) D ( Y ) \rho = \cfrac{Cov(X,Y)}{\sqrt {D(X)}\sqrt {D(Y)}} = \cfrac{E(XY)−E(X)E(Y)}{\sqrt {D(X)}\sqrt {D(Y)}} ρ=D(X)D(Y)Cov(X,Y)=D(X)D(Y)E(XY)−E(X)E(Y)
与 C o v ( X , Y ) 同正同负同 0 与C o v ( X , Y )同正同负同0 与Cov(X,Y)同正同负同0
性质: ∣ ρ ∣ ≤ 1 |\rho|\leq1 ∣ρ∣≤1
引理: [ E ( X Y ) ] 2 ≤ E ( X 2 ) E ( Y 2 ) [E(XY)]^2\leq E(X^2)E(Y^2) [E(XY)]2≤E(X2)E(Y2)(柯西-施瓦兹 不等式)
定理: ∣ ρ ∣ = 1 ⟺ X 与 Y 以 P = 1 成线性关系(即 P ( Y = a X + b ) = 1 ) |\rho|=1\iff X 与 Y 以 P = 1 成线性关系(即P ( Y = a X + b ) = 1) ∣ρ∣=1⟺X与Y以P=1成线性关系(即P(Y=aX+b)=1)
- ρ = 1 \rho=1 ρ=1,则称 X , Y 完全正相关
- ρ = − 1 \rho=-1 ρ=−1,则称 X , Y 完全负相关
- ∣ ρ ∣ |\rho| ∣ρ∣接近 0 时,表示 X , Y 线性关系弱
- ρ = 0 \rho=0 ρ=0,X , Y 不存在线性关系
概念区分:
“X , Y 不相关”——指X , Y 线性不相关
“X , Y 独立”——指X , Y 没有任何关系(包括线性、非线性)
- X , Y 独立,则X , Y 不相关
- X , Y 不相关,则X , Y 不一定独立
特例:对于二维正态分布( X , Y ),独立与不相关是等价的
4.5 中心距与原点矩
中心距: E [ ( X − E ( X ) ) k ] (以 E ( X ) 为中心) E[(X-E(X))^k](以E ( X )为中心) E[(X−E(X))k](以E(X)为中心)
原点矩: E ( X k ) = E [ ( X − 0 ) k ] (期望 E ( X ) 又称一阶原点矩) E(X^k)=E[(X-0)^k](期望E ( X ) 又称一阶原点矩) E(Xk)=E[(X−0)k](期望E(X)又称一阶原点矩)
一阶中心距:E ( X − E ( X ) ) = E ( X ) − E ( X ) = 0
二阶中心距: E [ ( X − E ( X ) ) 2 ] E[(X-E(X))^2] E[(X−E(X))2],即方差