关于概率论的一些基本知识

概率空间

随机试验是概率论的基本概念,实验的结果实现不能准确的语言,但具有如下三个特性:
(1)可以在相同的条件下重复进行;
(2)每次试验的结果不止一个,但预先知道实验的所有可能的结果;
(3)每次试验前不能确定哪个结果会出现。

随机试验所有可能结果组成的集合被称为这个试验的样本空间基本事件空间,记为 Ω \Omega Ω Ω \Omega Ω中的元素e称为样本点基本事件 Ω \Omega Ω的子集事件A称为事件,样本空间 Ω \Omega Ω称为必然事件,空集 ∅ \emptyset 称为不可能事件

定义1:设 Ω \Omega Ω是一个集合,F是 Ω \Omega Ω的某些子集组成的集合族。如果
(1) Ω ∈ F \Omega \in F ΩF
(2)若 A ∈ F A \in F AF,则 A ~ = Ω \ A ∈ F \widetilde{A} = \Omega \backslash A \in F A =Ω\AF
(3)若 A n ∈ F , n = 1 , 2 , . . . A_{n} \in F,n=1,2,... AnF,n=1,2,...,则 ∪ n = 1 ∞ A n ∈ F \cup^{\infty}_{n=1}A_{n} \in F n=1AnF
则称F为 σ − \sigma^{-} σ代数(Borel域)。 ( Ω , F ) (\Omega,F) (ΩF)为可测空间,F中的元素称为事件。
由定义易知:
(4) ∅ ∈ F \emptyset \in F F
(5)若A,B ∈ \in F,则 A \ B ∈ F A \backslash B \in F A\BF
(6)若 A i ∈ F , n = 1 , 2 , . . . A_{i} \in F,n=1,2,... AiF,n=1,2,...,则 ∪ i = 1 ∞ A i \cup^{\infty}_{i=1}A_{i} i=1Ai ∩ i = 1 ∞ A i \cap^{\infty}_{i=1}A_{i} i=1Ai ∩ i = 1 ∞ A i ∈ F \cap^{\infty}_{i=1}A_{i} \in F i=1AiF

随机变量及其分布

随机变量是概率论的主要研究对象,随机变量的统计规律用分布函数来描述。

定义4:设 ( Ω , F , P ) (\Omega,F,P) (Ω,F,P)是概率空间, X = X ( e ) X=X(e) X=X(e)是定义在 Ω \Omega Ω上的实函数,如果对任意实数 x , { e : X ( e ) ≤ x } x,\{e:X(e) \leq x\} x,{ eX(e)x},则称 X ( e ) X(e) X(e)是F上的随机变量,简记为随机变量 X X X,称
F ( x ) = P ( e : X ( e ) ≤ x ) , ∞ < x < ∞ F(x)=P(e:X(e) \leq x), \infty < x<\infty F(x)=P(e:X(e)x),<x<
为随机变量的分布函数

分布函数具有以下的性质:
(1) F ( x ) F(x) F(x)是非降函数,即当 x 1 < x 2 x_1 < x_2 x1<x2时,有 F ( x 1 ) ≤ F ( x 2 ) F(x_1) \leq F(x_2) F(x1)F(x2).
(2) F ( − ∞ ) = lim ⁡ x → − ∞ F ( x ) = 0 , F ( ∞ ) = lim ⁡ x → ∞ F ( x ) = 1 F(- \infty) =\lim _{x \to -\infty}F(x)=0, F(\infty)=\lim _{x \to \infty}F(x)=1 F()=limxF(x)=0,F()=limxF(x)=1.
(3) F ( x ) F(x) F(x)是右连续的,即 F ( x + 0 ) = F ( x ) F(x+0)=F(x) F(x+0)=F(x).

离散型速记变量X的概率分布用分布列描述:
p k = P ( X = x k ) , k = 1 , 2 , . . . p_k=P(X=x_k),k=1,2,... pk=P(X=xk),k=1,2,...
其分布函数
F ( x ) = ∑ x k ≤ x p k F(x)=\sum_{x_k \leq x}p_k F(x)=xkxpk
连续性随机变量X的概率分布用概率密度 f ( x ) f(x) f(x)描述,其分布函数
F ( x ) = ∫ − ∞ x f ( t ) d t F(x)= \int_{- \infty}^{x}f(t)dt F(x)=xf(t)dt

常见的随机变量分布表如下所示:

在这里插入图片描述
定义5:设 ( Ω , F , P ) (\Omega,F,P) (ΩFP)是概率空间, X = X ( e ) = ( X 1 ( e ) , . . . X n ( e ) ) X=X(e)=(X_1(e),...X_n(e)) X=X(e)=(X1(e),...Xn(e))是定义在 Ω \Omega Ω上的在n维空间 R n R^{n} Rn中取值的向量函数,如果对于任意 x = ( x 1 , x 2 , . . . x n ) ∈ R n , { e : X 1 ( e ) ≤ x 1 , X 2 ≤ x 2 , . . . , X n ( e ) ≤ x n } ∈ F x=(x_1,x_2,...x_n) \in R^{n}, \{ e:X_1(e)\leq x_1,X_2 \leq x_2,...,X_n(e)\leq x_n\} \in F x=(x1,x2,...xn)Rn,{ e:X1(e)x1,X2x2,...,Xn(e)xn}F,则称 X = X ( e ) X=X(e) X=X(e)n维随机变量n维随机向量,称
F ( x ) = F ( x 1 , x 2 , . . . x n ) = P ( e : X 1 ( e ) ≤ x 1 , X 2 ≤ x 2 , . . . , X n ( e ) ≤ x n ) , x − ( x 1 , x 2 , . . . x n ) ∈ R n F(x)=F(x_1,x_2,...x_n)=P( e:X_1(e)\leq x_1,X_2 \leq x_2,...,X_n(e)\leq x_n), x-(x_1,x_2,...x_n) \in R^{n} F(x)=F(x1,x2,...xn)=P(e:X1(e)x1,X2x2,...,Xn(e)xn),x(x1,x2,...xn)Rn
X = ( X 1 , X 2 , . . . X n ) X=(X_1,X_2,...X_n) X=(X1,X2,...Xn)联合分布函数

随机变量的数字特征

随机变量的概率分布完全由其分布函数描述,但是如何确定分布函数却是相当麻烦的。在实际问题中,我们有时只需要知道随机变量的某些特征值就够了。
定义7:设随机变量X的分布函数为 F ( x ) F(x) F(x),若 ∫ − ∞ ∞ ∣ x ∣ d F ( x ) < ∞ \int_{- \infty}^{\infty}|x|dF(x)<\infty xdF(x)<,则称
E X = ∫ − ∞ ∞ x d F ( x ) EX=\int_{- \infty}^{\infty}xdF(x) EX=xdF(x)
为X的数字期望均值。上式右边的积分被称为Lebesgue-Stieltjes积分。
若X是离散型随机变量,分布列为
p k = P ( X = x k ) , k = 1 , 2 , . . . p_k=P(X=x_k),k=1,2,... pk=P(X=xk),k=1,2,...

E X = ∑ k = 1 ∞ x k p k EX=\sum_{k=1}^{\infty} x_kp_k EX=k=1xkpk
若X是连续型随机变量,概率密度为 f ( x ) f(x) f(x),则
E X = ∫ − ∞ ∞ x f ( x ) d x EX=\int_{- \infty}^{\infty}xf(x)dx EX=xf(x)dx
随机变量的数学期望是随机变量的取值依概率的平均。

定义8:设X是随机变量,若 E X 2 < ∞ EX^2<\infty EX2<,则称 D X = E [ ( X − E X ) 2 ] DX=E[(X-EX)^2] DX=E[(XEX)2]为X的方差。
随机变量的数学期望是随机变量的取值偏离均值的程度。

定义9:设X,Y是随机变量, E X 2 < ∞ EX^2<\infty EX2<, E Y 2 < ∞ EY^2<\infty EY2<,则称
B X Y = E [ ( X − E X ) ( Y − E Y ) ] B_{XY}=E[(X-EX)(Y-EY)] BXY=E[(XEX)(YEY)]
为X和Y的协方差,称
ρ X Y = B X Y D X D Y \rho_{XY}=\frac {B_{XY}}{\sqrt{DX}\sqrt{DY}} ρXY=DX DY BXY
ρ X Y \rho_{XY} ρXY为0则称X和Y不相关,相关系数表示X和Y之间的线性相关程度的大小。

几个需要注意的性质:
(1) E ( a X + b Y ) = a E X + b E Y E(aX+bY)=aEX+bEY E(aX+bY)=aEX+bEY,其中a,b是常数;
(2)若X和Y独立,则 E [ X Y ] = E X E Y E[XY]=EXEY E[XY]=EXEY;
(3)若X和Y独立,则 D ( a X + b Y ) = a 2 D X + b 2 D Y D(aX+bY)=a^{2}DX+b^{2}DY D(aX+bY)=a2DX+b2DY,其中a,b是常数

条件期望

设X和Y是离散型随机变量,对给定的y,若 P { Y = y } > 0 P\{Y=y\}>0 P{ Y=y}>0则称
P { X = x ∣ Y = y } = P { X = x , Y = y } P { Y = y } P\{X=x|Y=y\}=\frac{P\{X=x,Y=y\}}{P\{Y=y\}} P{ X=xY=y}=P{ Y=y}P{ X=x,Y=y}
为给定 Y = y Y=y Y=y时X的条件概率

给定 Y = y Y=y Y=y时,X的条件分布函数为:
F ( x ∣ y ) = P { x ≤ x ∣ Y = y } , x ∈ R F(x|y)=P\{x \leq x| Y = y\}, x \in R F(xy)=P{ xxY=y},xR

而给定 Y = y Y=y Y=y时,X的条件期望为:
E [ X ∣ Y = y ] = ∫ x d F ( x ∣ y ) = ∑ x x P { X = x ∣ Y = y } E[X|Y=y]= \int xdF(x|y)=\sum_{x}xP\{ X=x|Y=y\} E[XY=y]=xdF(xy)=xxP{ X=xY=y}

若X和Y是连续型随机变量,其联合概率密度为 f ( x , y ) f(x,y) f(x,y),则对一切使 f Y ( y ) > 0 f_Y(y)>0 fY(y)>0的y,给定 Y = y Y=y Y=y时,X的条件概率密度定义为:
f ( x ∣ y ) = f ( x , y ) f Y ( y ) f(x|y)=\frac{f(x,y)}{f_Y(y)} f(xy)=fY(y)f(x,y)

给定 Y = y Y=y Y=y时,X的条件分布函数
F ( x ∣ y ) = P { X ≤ x ∣ Y = y } = ∫ − ∞ x f ( u ∣ y ) d u F(x|y)=P\{X\leq x| Y=y\}=\int^{x}_{-\infty}f(u|y)du F(xy)=P{ XxY=y}=xf(uy)du

给定 Y = y Y=y Y=y时,X的条件期望定义为
E [ X ∣ Y = y ] = ∫ x d F ( x ∣ y ) = ∫ x f ( x ∣ y ) E[X|Y=y]= \int xdF(x|y)=\int x f(x|y) E[XY=y]=xdF(xy)=xf(xy)

由此可见,除了概率是关于事件{Y=y}的条件概率外,现在的定义与无条件的情况完全一致。

E[X|Y=y]是y的函数,y是Y的一个可能值。若在已知Y的条件下,全面的考虑X的均值,则需要以Y代替y,则E[X|Y=y]是随机变量Y的函数,也是随机变量,称为X在Y下的条件期望

性质
若随机变量X与Y期望存在,则
E X = E [ E ( X ∣ Y ) ] = ∫ E [ X ∣ Y = y ] d F Y ( y ) EX=E[E(X|Y)]=\int E[X|Y=y]dF_Y(y) EX=E[E(XY)]=E[XY=y]dFY(y)
如果Y是离散型随机变量,则该式可以表达为
E X = ∑ y E [ X ∣ Y = y ] P { Y = y } EX=\sum _{y}E[X|Y=y]P\{Y=y\} EX=yE[XY=y]P{ Y=y}
如果Y是连续型随机变量,具有概率密度 f ( y ) f(y) f(y)
E X = ∫ − ∞ ∞ E [ X ∣ Y = y ] f ( y ) d y EX=\int_{- \infty}^{\infty} E[X|Y=y]f(y)dy EX=E[XY=y]f(y)dy

猜你喜欢

转载自blog.csdn.net/daijingxin/article/details/123920094
今日推荐