随机变量: 随机变量的定义
离散型随机变量
1 离散型随机变量的定义
若一个随机变量最多有可数的多个可能取值,则称这个随机变量为离散型的。例如,对于抛两枚骰子的试验,令随机变量为两枚骰子点数之和,则随机变量可取的值即为2到12的每一个可取整数值。对于一个离散型随机变量
,定义
的概率分布列(probability mass function,PMF,又叫概率分布律、概率质量函数)
为:
最多在可数个
上取正值,即,如果随机变量
的可取值为
,那么对于每一个
都有:
对于其他的
取值则有:
并且对于所有的
的可取值有:
2 离散型随机变量的分布函数
离散型随机变量的累积分布函数(分布函数)
可通过
进行计算,根据分布函数的定义可知:
若
是一个离散型随机变量,其可能的取值为
,其中
,则它的分布函数是一个阶梯函数,即在区间
上取常数值,且在
处有跳跃,跳跃值为
。
3 期望
概率论中一个非常重要的概念就是随机变量的期望,数学期望(或均值,亦简称期望)是试验中每次可能结果的概率乘以其结果的总和,是最基本的数学特征之一。它反映随机变量平均取值的大小。假设
是一个离散型随机变量,其概率分布列为
,那么
的期望或期望值记为
,定义如下:
的期望值就是
所有可能取值的一个加权平均,每个值的权重就是
取该值的概率。需要注意的是,期望值并不一定等同于常识中的“期望”——“期望值”也许与每一个结果都不相等。期望值是该变量输出值的平均数。期望值并不一定包含于变量的输出值集合里。
4 随机变量函数的期望
假设已知一个离散型随机变量
的分布列,现在要计算关于
的函数的期望,例如
的期望。
本身也是一个离散型随机变量,它就会有自己的分布列,根据
的分布列和函数
的规则就可以轻易得到
的分布列,然后再按照期望的定义便可计算出
。
现在换一种理解方式,当
时,
,可以很合理地认为
就是
的一个加权平均,其权重为
的概率,这样理解的话,就会有以下结论:如果
是一个离散型随机变量,其可能取值为
,相应的取值概率为
,那么对于任一实值函数
,都有:
根据这个结论还可以得到一个简单推论:
随机变量
的期望
,也称为
的均值(mean)或者一阶矩(first moment)。
称为
的
阶矩。
5 方差
给定一个随机变量
及其分布函数
,假如我们想要了解
的本质属性,定义合适的度量是及其有用的。期望是一个比较好的度量,它给出了
每个可能取值的加权平均,但是它无法提供关于取值相对于平均值的偏离或离散程度的信息。一种合理
取值离散程度的度量方法是考虑
与
的平均距离,如果
,则考虑
,但是在数学上处理这种度量是不方便的,更容易处理的度量通常考虑
与其均值距离的平方的期望,因此就有了方差的定义:如果随机变量
的期望为
,那么
的方差记为
,其定义为:
根据前几节的结论可以非常容易地推出方差的另一表达式:
在实际应用中,该式是计算方差最简便的方法。另外对于常数
和
,有如下恒等式:
该式的推导也十分简单,依旧根据已知的结论进行推导即可。
参考资料:
《概率论基础教程》Sheldon M.Ross
百度百科:数学期望