概率论与数理统计知识点(二) 离散型随机变量及其分布


1. 随机变量

  • 设随机试验的样本空间为S={e}. X=X(e) 是定义在样本空间S上的实值单值函数。称X=X(e)为随机变量

2. 离散型随机变量

  • 定义: 全部可能取到的值为有限个或可列无限多个,这种随机变量称为离散型随机变量

    骰子的点数,打靶环数,某城市120急救电话一昼夜收到的呼叫次数,都是离散型随机变量

  • 设离散型随机变量X所有可能取的值为 x k ( k = 1 , 2 , ) x_k(k=1,2,\cdots) ,X取各个可能值的概率,即事件 X = x k {X=x_k} 的概率,为 P { X = x k } = P k , k = 1 , 2 , P\{X=x_k\}=P_k, k=1,2,\cdots

    我们称该式为离散型随机变量的分布律

    • 性质:
      • 1 o 1^o p k 0 , k = 1 , 2 , 3 , ; p_k \geq 0, \quad k=1,2,3,\cdots;
      • 2 o 2^o k = 1 p k = 1. \sum_{k=1}^{\infty}{p_k=1.}

3. 离散型随机变量常见分布

3.1 (0-1)分布

  • 设随机变量可能的取值只有0和1,它的分布律为 P { X = k } = p k ( 1 p ) k , k = 0 , 1 P\{X=k\} = p^k(1-p)^k, \quad k=0,1 ,记做X服从以p为参数的(0-1)分布或两点分布

    X 0 1
    p k p_k 1 p 1-p p p

    新生儿性别,抛硬币,产品质量是否合格 等可以用(0-1)分布的离散型随机变量来表示

3.2 二项分布

  • 设试验E只有两种可能结果:A及 A \overline A ,则称E为伯努利试验 。 设 P ( A ) = p P ( A ) = 1 p P(A) = p ,则P(\overline A) = 1 - p .

  • 将E 独立重复地进行n次, 则称这一连串独立的重复试验为n重伯努利试验

    例如,抛硬币,A表示正面,这就是伯努利试验,将硬币抛n次,就是n重伯努利试验。 掷骰子,A表示等到1点, A \overline A 表示得到的是非1点,也叫一次伯努利试验等

  • 以X表示n重伯努利试验中,事件A发生的次数,p表示事件A发生的概率,q=1-p 表示A不发生的概率(即 A \overline A 发生的概率) ,则有

    P { X = k } = ( k n ) p k q n k k = 0 , 1 , 2 , n P\{X=k\} = (_k^n)p^kq^{n-k} \quad k=0,1,2\cdots, n

    • k = 0 n P { X = k } = k = 0 n ( k n ) p k q n k = ( p + q ) n = 1 \sum_{k=0}^{n}{P\{X=k\}} = \sum_{k=0}^{n}{(_k^n)p^kq^{n-k}} = (p+q)^n=1
    • 二项式 ( a + b ) n = ( 0 n ) a n 0 b 0 + ( 1 n ) a n 1 b 1 + + ( n 1 n ) a n ( n 1 ) b n 1 + ( n n ) a n n b n = k = 0 n ( k n ) a n k b k (a+b)^n = (_0^n)a^{n-0}b^{0}+(_1^n)a^{n-1}b^{1}+\cdots+(_{n-1}^n)a^{n-(n-1)}b^{n-1}+(_n^n)a^{n-n}b^{n} = \sum_{k=0}^{n}{(_k^n)a^{n-k}b^{k}}

    我们发现 ( k n ) p k q n k (_{k}^{n})p^kq^{n-k} 刚好是 ( p + q ) n (p+q)^n 展开式中出现 p k p^k 的那一项,因此,我们称随机变量X服从以n,p为参数的二项分布,记做 X b ( n , p ) X\sim b(n,p)

3.3 泊松分布

  • 设随机变量X的可能取值为 0 , 1 , 2 , 0,1,2,\cdots 而各个取值的概率为 P { X = k } = λ k k ! e λ k = 0 , 1 , 2 , P\{X=k\}= \frac{\lambda^k}{k!}e^{-\lambda} \quad k=0,1,2,\cdots 其中 λ > 0 \lambda > 0 为常数,则称X服从以 λ \lambda 为参数的泊松分布,记做 X π ( λ ) X \sim \pi(\lambda)

    • k = 0 P { X = k } = k = 0 λ k k ! e λ = e λ k = 0 λ k k ! = e λ e λ = 1 \sum_{k=0}^{\infty}P\{X=k\}= \sum_{k=0}^{\infty}\frac{\lambda^k}{k!}e^{-\lambda}=e^{-\lambda}\sum_{k=0}^{\infty}\frac{\lambda^k}{k!} = e^{-\lambda} \cdot e^\lambda = 1

    • 其中 k = 0 λ k k ! = e λ \sum_{k=0}^{\infty}\frac{\lambda^k}{k!} = e^\lambda 证明如下,需要用到泰勒公式

    泰勒公式

    如果函数 f ( x ) f(x) x 0 x_0 的某个邻域 U ( x 0 ) U(x_0) 内具有(n+1)阶导数,那么对任一 x U ( x 0 ) x \in U(x_0) f ( x ) = f ( x 0 ) + f ( x 0 ) ( x x 0 ) + f ( x 0 ) 2 ! ( x x 0 ) 2 + + f ( n ) ( x 0 ) n ! ( x x 0 ) n + R n ( x ) f(x)=f(x_0)+f^{'}(x_0)(x-x_0)+\frac{f^{''}(x_0)}{2!}(x-x_0)^2+\cdots+\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n+R_{n}(x)

    f ( x ) = n = 0 N f ( n ) ( x 0 ) n ! ( x x 0 ) n + R n ( x ) f(x)=\sum_{n=0}^{N}\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n+R_{n}(x) x 0 = 0 x_0=0 时,有 f ( x ) = n = 0 N f ( n ) ( 0 ) n ! x n + R n ( x ) f(x)=\sum_{n=0}^{N}\frac{f^{(n)}(0)}{n!}x^n+R_{n}(x)

    此时有 e x = n = 0 N ( e x ) ( n ) ( 0 ) n ! x n + R n ( x ) ( e x ) ( n ) = e x ( e x ) ( n ) ( 0 ) = 1 e x = n = 0 N 1 n ! x n + R n ( x ) R n ( x ) x n e x n = 0 N 1 n ! x n e^x=\sum_{n=0}^{N}\frac{(e^x)^{(n)}(0)}{n!}x^n+R_{n}(x) \\ \because (e^x)^{(n)}=e^x \therefore (e^x)^{(n)}(0) = 1 \\ \therefore e^x= \sum_{n=0}^{N}\frac{1}{n!}x^n+R_{n}(x),R_{n}(x) 为关于x^n的高阶无穷小,则 e^x \approx \sum_{n=0}^{N}\frac{1}{n!}x^n

    • e λ = k = 0 λ k k ! \therefore 有 e^\lambda = \sum_{k=0}^{\infty}\frac{\lambda^k}{k!} 成立

    一本书一页中的印刷错误数,某医院在一天内的急诊病人数,某一个地区一个时间间隔内发生交通事故的次数等均服从泊松分布

  • 泊松定理 λ > 0 \lambda >0 是一个常数,n是任意正整数,设 n p n = λ np_n=\lambda ,则对于任一固定的非负整数k,有 lim n ( k n ) p n k ( 1 p n ) n k = λ k e λ k ! \lim_{n\rightarrow\infty}(_k^n)p_n^k(1-p_n)^{n-k}=\frac{\lambda^ke^{-\lambda}}{k!}

证明如下 :

λ = n p n p n = λ n lim n ( k n ) p n k ( 1 p n ) n k = lim n n ! k ! ( n k ) ! λ k n k ( 1 λ n ) n k = lim n λ k k ! ( n k + 1 ) ! n k ( 1 λ n ) n ( 1 λ n ) k = lim n λ k k ! [ 1 ( 1 1 n ) ( 1 2 n ) ( 1 k 1 n ) ] ( 1 λ n ) n ( 1 λ n ) k lim n [ 1 ( 1 1 n ) ( 1 2 n ) ( 1 k 1 n ) ] = 1 lim n ( 1 λ n ) n = e λ lim n ( 1 λ n ) k = 1 lim n ( k n ) p n k ( 1 p n ) n k = λ k e λ k ! \begin{aligned}\because \lambda = np_n \quad \therefore p_n &= \frac{\lambda}{n} \\ \lim_{n\rightarrow\infty}(_k^n)p_n^k(1-p_n)^{n-k} &= \lim_{n\rightarrow\infty} \frac{n!}{k!(n-k)!}\frac{\lambda^k}{n^k}(1-\frac{\lambda}{n})^{n-k} \\&= \lim_{n\rightarrow\infty}\frac{\lambda^k}{k!}\frac{(n-k+1)!}{n^k}(1-\frac{\lambda}{n})^{n}(1-\frac{\lambda}{n})^{-k} \\&=\lim_{n\rightarrow\infty}\frac{\lambda^k}{k!}[1\cdot(1-\frac{1}{n})(1-\frac{2}{n})\cdots(1-\frac{k-1}{n})](1-\frac{\lambda}{n})^{n}(1-\frac{\lambda}{n})^{-k} \\ \because &\lim_{n\rightarrow\infty}[1\cdot(1-\frac{1}{n})(1-\frac{2}{n})\cdots(1-\frac{k-1}{n})] = 1 \\ &\lim_{n\rightarrow\infty}(1-\frac{\lambda}{n})^{n} = e^{-\lambda}\\ &\lim_{n\rightarrow\infty}(1-\frac{\lambda}{n})^{-k} = 1\\ \therefore \lim_{n\rightarrow\infty}(_k^n)p_n^k(1-p_n)^{n-k} &= \frac{\lambda^ke^{-\lambda}}{k!}\end{aligned}

  • 该定理说明,当n很大,p很小时,二项分布可用泊松分布近似 即 ( k n ) p k ( 1 p ) n k λ k e λ k ! ( λ = n p ) (_k^n)p^k(1-p)^{n-k} \approx \frac{\lambda^ke^{-\lambda}}{k!} \quad (\lambda=np)

    一般地,当 n 100 , n p 10 n \geq 100,np \leq 10 时,即可用泊松分布来近似计算二项分布

3.4 几何分布

  • 在伯努利试验中,记每次试验中事件A发生的概率为p,试验进行到事件A出现时停止,此时所进行的试验次数为X,其分布率为 P { X = k } = ( 1 p ) k 1 p k = 1 , 2 , 3 , P\{X=k\}=(1-p)^{k-1}p \quad k = 1,2,3,\cdots , 则称X服从p为参数的几何分布,记作 X G ( p ) X \sim G(p)

    k = 1 P { X = k } = k = 1 ( 1 p ) k 1 p = p k = 1 ( 1 p ) k 1 = p 1 ( 1 p ) k 1 ( 1 p ) 1 ( 1 p ) = 1 ( 1 p ) k 0 p 1 k + k = 1 P { X = k } = 1 \begin{aligned}\sum_{k=1}^{\infty}P\{X=k\} &= \sum_{k=1}^{\infty}(1-p)^{k-1}p \\&= p\sum_{k=1}^{\infty}(1-p)^{k-1} \\ &= p \frac{1-(1-p)^{k-1}(1-p)}{1-(1-p)} \\ &= 1-(1-p)^k \\ &\because 0\leq p \leq1 \quad k \rightarrow +\infty \\ \therefore \sum_{k=1}^{\infty}P\{X=k\}&=1 \end{aligned}

  • 几何分布用来描述n次伯努利试验中,事件A 首次发生的概率

3.5 超几何分布

  • 在产品质量的不放回抽检中,若N件产品中有M件次品,抽检n件时所得次品数X=k,此时有 P { X = k } = ( k M ) ( n k N M ) ( n N ) k = 0 , 1 , , m i n { n , M } . P\{X=k\}=\frac{(_k^M)(_{n-k}^{N-M})}{(_n^N)} \quad k= 0,1,\cdots,min\{n,M\}.

    称X服从以n,N,M 为参数的超几何分布,记做 X H ( n , M , N ) X\sim H(n,M,N)

  • N + N\rightarrow +\infty 时,超几何分布可用二项分布近似计算,此时有 M N P \frac{M}{N}\rightarrow P

    证明如下:

    首先我们要明确要证明的等式是 当 N + N\rightarrow +\infty P { X = k } = ( k M ) ( n k N M ) ( n N ) = ( k n ) p k q n k P\{X=k\}=\frac{(_k^M)(_{n-k}^{N-M})}{(_n^N)} = (_k^n)p^kq^{n-k} ,即 lim n + ( k M ) ( n k N M ) ( n N ) = ( k n ) p k q n k \lim_{n\rightarrow+\infty}\frac{(_k^M)(_{n-k}^{N-M})}{(_n^N)} = (_k^n)p^kq^{n-k} .

    lim n + ( k M ) ( n k N M ) ( n N ) = lim n + M ! k ! ( M k ) ! ( N M ) ! ( n k ) ! ( N M n + k ) ! n ! ( N n ) ! N ! = lim n + n ! k ! ( n k ) ! M ( M 1 ) ( M k + 1 ) N k ( N M ) ! ( n k ) ! ( N M n + k ) ! N k N ( N 1 ) ( N n + 1 ) ( N k ) n ! k ! ( n k ) ! = ( k n ) , lim n + M ( M 1 ) ( M k + 1 ) N k = lim n + M N ( M N 1 N ) ( M N k N + 1 N ) = ( M N ) k , N k N ( N 1 ) ( N n + 1 ) = N k N ( N 1 ) ( N k + 1 ) ( N k ) ( N k 1 ) ( N n + 1 ) = 1 1 ( 1 1 N ) ( 1 2 N ) ( 1 k N + 1 N ) ( N k ) ( N k 1 ) ( N n + 1 ) lim n + N k N ( N 1 ) ( N n + 1 ) = lim n + 1 ( N k ) ( N k 1 ) ( N n + 1 ) , lim n + ( k M ) ( n k N M ) ( n N ) = lim n + ( k n ) ( M N ) k ( N M ) ( N M 1 ) ( N M n + k + 1 ) N n k N n k ( N k ) ( N k 1 ) ( N n + 1 ) ( N n k ) = lim n + ( k n ) ( M N ) k [ ( 1 M N ) ( 1 M N 1 N ) ( 1 M N n k 1 N ) ] [ 1 ( 1 k N ) ( 1 k + 1 N ) ( 1 n 1 N ) ] = ( k n ) ( M N ) k ( 1 M N ) n k \begin{aligned} \lim_{n\rightarrow+\infty}\frac{(_k^M)(_{n-k}^{N-M})}{(_n^N)} &= \lim_{n\rightarrow+\infty}\frac{M!}{k!(M-k)!}\frac{(N-M)!}{(n-k)!(N-M-n+k)!}\frac{n!(N-n)!}{N!} \\ &= \lim_{n\rightarrow+\infty} \frac{n!}{k!(n-k)!}\frac{M(M-1)\cdots(M-k+1)}{N^k}\frac{(N-M)!}{(n-k)!(N-M-n+k)!} \frac{N^k}{N(N-1)\cdots(N-n+1)} \quad (N^k 为构造出来的中间量) \\ &\frac{n!}{k!(n-k)!} = (_k^n) ,\\ & \lim_{n\rightarrow+\infty}\frac{M(M-1)\cdots(M-k+1)}{N^k} = \lim_{n\rightarrow+\infty}\frac{M}{N}(\frac{M}{N}-\frac{1}{N})\cdots(\frac{M}{N}-\frac{k}{N}+\frac{1}{N})=(\frac{M}{N})^k,\\ &\frac{N^k}{N(N-1)\cdots(N-n+1)}= \frac{N^k}{N(N-1)\cdots(N-k+1)(N-k)(N-k-1)\cdots(N-n+1)} = \frac{1}{1\cdot(1-\frac{1}{N})(1-\frac{2}{N})\cdots(1-\frac{k}{N}+\frac{1}{N})(N-k)(N-k-1)\cdots(N-n+1)} \\ &\therefore \lim_{n\rightarrow+\infty}\frac{N^k}{N(N-1)\cdots(N-n+1)}= \lim_{n\rightarrow+\infty}\frac{1}{(N-k)(N-k-1)\cdots(N-n+1)},\\ \therefore \lim_{n\rightarrow+\infty}\frac{(_k^M)(_{n-k}^{N-M})}{(_n^N)} &=\lim_{n\rightarrow+\infty}(_k^n)(\frac{M}{N})^k\frac{(N-M)(N-M-1)\cdots(N-M-n+k+1)}{N^{n-k}}\frac{N^{n-k}}{(N-k)(N-k-1)\cdots(N-n+1)} \quad (N^{n-k}为构造出来的中间量) \\ &=\lim_{n\rightarrow+\infty}(_k^n)(\frac{M}{N})^k[(1-\frac{M}{N})(1-\frac{M}{N}-\frac{1}{N})\cdots(1-\frac{M}{N}-\frac{n-k-1}{N})][\frac{1}{(1-\frac{k}{N})(1-\frac{k+1}{N})\cdots(1-\frac{n-1}{N})}] \\ &= (_k^n)(\frac{M}{N})^k(1-\frac{M}{N})^{n-k} \\ \therefore 命题得证 \end{aligned}

    • 需要注意的是,前面我们说到,计算二项分布时,可用泊松分布近似,因此在利用二项分布近似计算超几何分布时,可根据情况,对二项分布使用泊松进行分布进行近似计算

猜你喜欢

转载自blog.csdn.net/SpiritedAway1106/article/details/106871498