概率论与数理统计,基础知识、公式、定理、概念(一)

一、概率论的基本概念

1、德摩根律A\bigcup B的非 = A非 \bigcapB非;A\bigcap B的非 = A非 \bigcupB非。

2、古典概型:试验的样本空间只包含有限个元素。试验中每个基本事件发生的可能性相同。

3、条件概率:

    (一)条件概率

        设A、B是两个事件,且P(A)>0,则 P(B|A) = P(AB) / P(A)。

        P(B1 U B2 | A) = P(B1|A)+P(B2|A)-P(B1B2|A)

    (二)乘法定理

        设P(A)>0,则 P(AB) = P(B|A)P(A),称为乘法公式。

        推广到多个事件:设P(AB)>0,则有,P(ABC) = P(C|AB)P(B|A)P(A)

    (三)全概率公式

        设试验E的样本空间为S,A为E的事件,B1,B2,B3......Bn为S的一个划分,且P(Bi)>0(i = 1,2......n),则

        P(A) = P(A|B1)P(B1)+P(A|B2)P(B2)+......+P(A|Bn)P(Bn)

    (四)贝叶斯公式

        在全概率公式中,比较常用的就是n=2时的形式,由此演化成

        全概率公式:P(A) = P(A|B)P(B) + P(A|B非)P(B非)

        贝叶斯公式::P(B|A) = P(AB) / P(A)

    (五)独立性

        设A、B为两个事件,若P(AB) = P(A)P(B),则称事件A、B相互独立。

4.互不相容和独立的关系

    不可能同时发生的两个事件,叫做互斥(互不相容)事件。

    如果发生第1种情况,对第2种情况没影响,那么这两种情况就相互独立。

    如果A和B互不相容 P(A U B)= P(A)+P(B) 
    如果A和B相互独立 P(AB) = P(A)P(B)

 (1)若A,B 相互独立,则 一定不互斥
 (2)若A,B互斥,则 一定不相互独立
 (3)若A,B不相互独立,则 可能互斥也可能不互斥
 (4)若A,B不互斥,则 可能独立也可能不独立

二、随机变量及其分布

1、随机变量:设随机试验的样本空间为S = {e}是定义在样本空间S上的实值单值函数,称X=X(e)为随机变量。

2、离散型随机变量及其分布律

    (一)(0-1)分布

        设随机变量X只可能取0和1两个值,他的分布律是P{X = k}=p^{k}(1-p)^{1-k},k=0,1 (0<p<1).则称X服从以P为参数的(0-1)分布或两点分布。

    (二)伯努利试验、二项分布

        设试验E只有两个可能结果:A及A非,则称E为伯努利试验,

        设P(A) = p (0<p<1),,此时P(A非)=1-p,将E独立重复地进行n次,则称这一串重复的独立试验为n重伯努利试验。

    (三)泊松分布

        设随机变量X所有可能取的值为0,1,2.....而取各个值的概率为P{X=k}=\lambda ^{k}e^{-\lambda } / k!,k=0,1,2......,其中\lambda>0是常数,则称X服从参数为\lambda的泊松分布,记X~π(\lambda).

3、随机变量的分布函数:设X是一个随机变量,x是任意实数,函数F(x)=P{X<=x},负无穷<x<正无穷,称为X的分布函数。

    分布函数F(x)的性质:

        1.F(x)是一个不减函数

        2.0<=F(x)<=1,且F(-\propto )=\lim_{x->-\propto }F(x)=0,F(\propto )=\lim_{x->\propto }F(x)=1

        3.F(x+0)=F(x),及F(x)是右连续的。

4.连续型随机变量及其概率密度

    (一)概念

        如果对于随机变量X的分布函数F(x),存在非负可积函数f(x),使对于任意实数x有: F(x)=\int_{-\bowtie }^{x}f(t)dt,则称X为连续型随机变量,f(x)称为X的概率密度函数,简称概率密度。

    (二)概率密度f(x)的性质

        1.f(x)>=0

        2.\int_{-\bowtie }^{+\bowtie }f(x)dx=1

        3.对于任意实数x1,x2(x1<=x2),P{x1<X<=X2} = F(x2)-F(x1) = \int_{x1 }^{x2}f(x)dx

        4.若f(x)在点x处连续,则有F'(x) = f(x).

    (三)均匀分布

        若连续型随机变量X具有概率密度 f(x) = \left\{\begin{matrix}\frac{1}{b-a},a<x<b & \\ 0,other & \end{matrix}\right.,则称X在区间(a,b)上服从均匀分布,记为X~U(a,b)

    (四)指数分布

        若连续型随机变量X的概率密度为f(x)={\left\{\begin{matrix}\frac{1}{\Theta }e^{-\frac{x}{\Theta }},x>0 & \\ 0,x<=0 & \end{matrix}\right.},其中\Theta>0为常数,则称X服从参数为\Theta的指数分布。

    (五)正态分布

        若连续型随机变量X的概率密度为f(x)=\frac{1}{\sqrt{2\pi }\sigma }e^{-\frac{(x-\mu )^{2}}{2\sigma ^{2}}},-\bowtie <x<\bowtie,其中\mu, \sigma (\sigma >0)为常数,则称X服从参数为\mu, \sigma的正态分布或高斯分布,记为X\sim N(\mu ,\sigma ^{2})

        性质:

        1.曲线关于x=\mu对称,这表明对于任意h>0有P\left \{ \mu -h<X<=\mu \right \}=P\left \{ \mu <X<=\mu +h \right \}

        2.当x=\mu时取到最大值f(\mu )\frac{1}{\sqrt{2\pi }\sigma }

          x离\mu越远,f(x)的值越小,如果固定 \mu,改变\sigma,则当\sigma越小时,图形变得越尖,因而X落在\mu附近的概率越大。特别,当\mu =0,\sigma =1时,称随机变量X服从标准正态分布。其概率密度和分布函数分别用\varphi (x),\Phi (x)

三、多维随机变量及其分布

1、定义

    (一)二维随机变量:设随机试验E的样本空间为S,如果对于每个e\in S,X=X(e),Y=Y(e)为S上的随机变量,由它们构成的一个向量(X,Y),叫做二维随机变量。

    (二)二维随机变量(X,Y)的分布函数(随机变量X和Y的联合分布函数):设(X,Y)是二维随机变量,任意(X,Y)\in (-\Join ,+\Join ),函数F(x,y)=P(X<=x,Y<=y)称为二维随机变量(X,Y)的分布函数。

    (三)二维离散型随机变量:如果二维随机变量(X,Y)的全部可能取到的值是有限对或可列无限对,则(X,Y)叫做二维离散型随机变量。

    (四)二维离散型随机变量的分布律:如果二维离散型随机变量(X,Y)的全部可能取到的值为(xi,yj)(i,j=1,2,3.....),称P(X=xi,Y=yj)=pij(i,j=1,2......)为二维离散型随机变量(X,Y)的分布律。

    (五)连续型的二维随机变量:对于二维随机变量(X,Y)的分布函数F(x,y),如果存在非负可积函数f(x,y)使对于任意x,y有F(x,y)=\int_{-\Join }^{y}\int_{-\Join }^{x}f(\mu ,\nu )d\mu d\nu,则称(X,Y)是连续型的二维随机变量。函数f(x,y)称为二维随机变量(X,Y)的概率密度,或称为随机变量X和Y的联合概率密度

    (六)边缘分布函数:二维随机变量(X,Y)作为一个整体,具有分布函数F(x,y),而X和Y都是随机变量,各自也有分布函数,将他们分别记为Fx(x),Fy(y),依次称为二维随机变量(X,Y)关于X和关于Y的边缘分布函数。

        Fx(x)=F(x,∞),就是说,只要在函数F(x,y)中令 y -> ∞ 就能得到Fx(x)。

    (七)边缘分布律:p_{i\cdot }^{ }=\sum_{j=1}^{\Join }p_{ij}^{ }=P\left \{ X=x_{i}^{ } \right \},i=1,2...

                         p_{\cdot j}^{ }=\sum_{i=1}^{\Join }p_{ij}^{ }=P\left \{ Y=y_{j}^{ } \right \},j=1,2...分别称p_{i\cdot }^{ }p_{\cdot j}^{ }为(X,Y)关于X和关于Y的边缘分布律。

    (八)边缘概率密度:对于连续型随机变量(X,Y),设它的概率密度为f(x,y),由F_{x}^{ }(x)=F(x,\Join )=\int_{-\Join }^{x}\left [ \int_{-\Join }^{+\Join } \right f(x,y)dy]dxf_{x}^{ }(x)=\int_{-\Join }^{+\Join }f(x,y)dy,同理得f_{y}^{ }(y)=\int_{-\Join }^{+\Join }f(x,y)dx,分别称f_{X}^{ }(x)f_{Y}^{ }(y)为(X,Y)关于X和关于Y的边缘概率密度。

    (九)相互独立的随机变量:设F(x,y)及f_{X}^{ }(x)f_{Y}^{ }(y)分别是二维随机变量(X,Y)的分布函数及边缘分布函数,若对于所有x,y,有P{X<=x,Y<=y}=P{X<=x}P{Y<=y},即F(x,y)=F_{X}^{ }(x)F_{Y}^{ }(y),则称随机变量X和Y是相互独立的。

    (十)卷积公式:设(X,Y)是二维连续型随机变量,它具有概率密度f(x,y),则 Z=X+Y 仍为连续型随机变量,其概率密度为:

             f_{X+Y}^{ }(z)=\int_{-\Join }^{+\Join }f(z-y,y)dy 

     或    f_{X+Y}^{ }(z)=\int_{-\Join }^{+\Join }f(x,z-x)dx

    又若X和Y相互独立,设(X,Y)关于X,Y的边缘密度为f_{X}^{ }(x)f_{Y}^{ }(y),则上述公式化简为:

             f_{X+Y}^{ }(z)=\int_{-\Join }^{+\Join }f_{X}^{ }(z-y)f_{Y}^{ }(y)dy

    和     f_{X+Y}^{ }(z)=\int_{-\Join }^{+\Join }f_{X}^{ }(x)f_{Y}^{ }(z-x)dx

    这两个公式称为f_{x}^{}f_{y}^{}的卷积公式,记为f_{x}^{ }*f_{y}^{ }

    (十一)Z=\frac{Y}{X}的分布,Z=XY的分布:设(X,Y)是二维连续型随机变量,它具有概率密度f(x,y),则 Z=\frac{Y}{X} ,Z=XY仍为连续型随机变量,其概率密度为:

             f_{Y/X}^{ }(z)=\int_{-\Join }^{+\Join }\left | x \right |f(x,xz)dx

             f_{XY}^{ }(z)=\int_{-\Join }^{+\Join }\frac{1}{\left |x \right |}f(x,\frac{z}{x})dx

    若X和Y相互独立,设(X,Y)关于X,Y的边缘密度为f_{X}^{ }(x)f_{Y}^{ }(y),则上述公式化简为:

             f_{Y/X}^{ }(z)=\int_{-\Join }^{+\Join }\left | x \right |f_{X}^{ }(x)f_{Y}^{ }(xz)dx

             f_{XY}^{ }(z)=\int_{-\Join }^{+\Join }\frac{1}{\left | x \right |}f_{X}^{ }(x)f_{Y}^{ }(\frac{z}{x})dx

    (十二)M=max{X,Y}及N=min{X,Y}的分布:

        设X,Y是两个相互独立的随机变量,它们的分布函数分别为F_{X}^{ }(x)F_{Y}^{ }(y)

        F_{max}^{ }(z)=F_{X}^{ }(z)F_{Y}^{ }(z)

        F_{min}^{ }(z)=1-\left [ 1-F_{X}^{ }(z) \right ]\left [ 1-F_{Y}^{ }(z) \right ]

2、分布函数F(x,y)的基本性质

    1.F(x,y)是变量x和y的不减函数。

    2.0<=F(x,y)<=1,

        且①对于任意固定的y,F(-无穷,y)=0,②对于任意固定的x,F(x,-无穷)=0,③F(- 无穷,+无穷)= 0,F(无穷,无穷)=1。

    3.F(x,y)关于x右连续,关于y也右连续。

    4.对于任意(x1,y1),(x2,y2),x1<x2,y1<y2,下述不等式成立

        F(x2,y2)-F(x2,y1)+F(x1,y1)-F(x1,y2)>=0

3.概率密度f(x,y)的性质

    1.f(x,y)>=0

    2.\int_{-\Join }^{+\Join }\int_{-\Join }^{+\Join }f(x,y)dxdy=F(\Join ,\Join )=1

    3.设G是xOy平面上的区域,点(X,Y)落在G内的概率为P\left \{ (X,Y)\in G) \right \}=\iint_{G}^{ }f(x,y)dxdy

    4.若在f(x,y)在点(x,y),连续,则有(∂的平方*F(x,y))/ ∂x∂y   =  f(x,y)

四、随机变量的数字特征

    1、数学期望

        设离散型随机变量X的分布律为P\begin{Bmatrix} X=x_{k} \end{Bmatrix}=p_{k},k=1,2,...,若级数\sum_{k=1}^{\Join }x_{k}p_{k}绝对收敛,则称级数\sum_{k=1}^{\Join }x_{k}p_{k}的和为随机变量X的数学期望,记为E(X),即E(X)=\sum_{k=1}^{\Join }x_{k}p_{k}

        设连续型随机变量X的概率密度为f(x),若积分\int_{-\Join }^{+\Join }xf(x)dx绝对收敛,则称积分\int_{-\Join }^{+\Join }xf(x)dx的值为随机变量X的数学期望,记为E(X),即E(x)=\int_{-\Join }^{+\Join }xf(x)dx。数学期望简称期望,又称为均值

    2.数学期望的重要性质

        (1)设C是常数,则有E(C)=C。

        (2)设X是一个随机变量,C是常数,则有E(CX)=CE(X)。

        (3)设X,Y是两个随机变量,则有E(X+Y)=E(X)+E(Y),这一性质可以推广到任意有限个随机变量之和的情况。

        (4)设X,Y是相互独立的随机变量,则有E(XY)=E(X)E(Y),这一性质可以推广到任意有限个相互独立的随机变量之积的情况。

    3、方差

        设X是一个随机变量,若E{ [ X-E(X) ] ² }存在,则称E{ [ X-E(X) ] ² }为X的方差,记为D(X)或Var(X),即D(X)=Var(X)=E{ [ X-E(X) ] ² },在应用上还引用量\sqrt{D(X)},记为\sigma (X),称为标准差或均方差

        随机变量X的方差表达了X的取值与其数学期望的偏离程度,若D(X)较小意味着X的取值比较集中在E(X)的附近,反之,若D(X)较大则表示X的取值较分散。

    4、方差的重要性质

        (1)设C是常数,则D(C)=0。

        (2)设X是随机变量,C是常数,则有D(CX)=C²D(X),D(X+C)=D(X)。

        (3)设X,Y是两个随机变量,则有D(X+Y)=D(X)+D(Y)+2E{ (X-E(X))(Y-E(Y)) }。

当X,Y相互独立时,则有D(X+Y)=D(X)+D(Y),这一性质可以推广到任意有限多个相互独立的随机变量之和的情况。

        (4)D(X)=0的充要条件是X以概率1取常数E(X),即P{X=E(X)}=1。

    5、协方差及相关系数

        量E{ (X-E(X))(Y-E(Y)) }称为随机变量X与Y的协方差,记为Cov(X,Y),即Cov(X,Y)=E{ (X-E(X))(Y-E(Y)) },而\rho _{XY}=\frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}称为随机变量X与Y的相关系数。由定义即知Cov(X,Y)=Cov(Y,X),Cov(X,X)=D(X),D(X+Y)=D(X)+D(Y)+2Cov(X,Y)。

    6、协方差的重要性质

        (1)Cov(aX,bY)=abCov(X,Y),a,b是常数。

        (2)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)

发布了22 篇原创文章 · 获赞 17 · 访问量 5861

猜你喜欢

转载自blog.csdn.net/weixin_42193813/article/details/90763834