似然函数和最大似然估计

似然函数和最大似然估计


拿到一组样本时,在大致判断了它服从什么样的分布以后,最重要的步骤就是求得分布的最优参数,以下简称参数为 θ \theta θ。这里回顾以下最大似然估计法。

1 最大似然估计
最大似然估计,以我的理解,就是找到一个最优参数 θ \theta θ,使得观测到已知样本的可能性最大,是一种反推方法。

对于随机变量 X X X,观测到一组相互独立的n维样本 x 1 , x 2 . . . x n x_1,x_2...x_n x1,x2...xn。若 X X X在某一取值 x i x_i xi处的概率密度为 f X ( x i ∣ θ ) f_X(x_i|\theta) fX(xiθ),那么随机变量 X X X取值为这一组样本的概率密度为

f X ( x ∣ θ ) = f X ( x 1 , x 2 . . . x n ∣ θ ) = ∏ i = 1 n f ( x i ∣ θ ) \begin{aligned} f_X(x|\theta)=f_X(x_1,x_2...x_n|\theta)=\prod_{i=1}^{n}f(xi|\theta) \end{aligned} fX(xθ)=fX(x1,x2...xnθ)=i=1nf(xiθ)

似然估计函数: L ( θ ∣ x ) = f X ( x ∣ θ ) L(\theta|x)=f_X(x|\theta) L(θx)=fX(xθ)。在得到了 L ( θ ∣ x ) L(\theta|x) L(θx)后,我们想找出的最优参数(即最大似然参数) θ ^ M V \hat\theta_{MV} θ^MV就是那个能让 L ( θ ∣ x ) L(\theta|x) L(θx)取到最大值的参数,为什么是最大值我们稍后通过例子可以推断出。

θ ^ M V = arg ⁡ max ⁡ θ L ( θ ∣ x ) \begin{aligned} \hat\theta_{MV}=\mathop{\arg\max}_{\theta}L(\theta|x) \end{aligned} θ^MV=argmaxθL(θx)

如果一个函数一阶可导,二阶倒数<0,那么这一定是一个凸函数,函数的最大值就是在一阶倒数=0时候的取值。
{ ∂ L ( θ ∣ x ) ∂ θ = 0 ∂ 2 L ( θ ∣ x ) ∂ θ 2 < 0 \begin{aligned} \left\{ \begin{array}{lr} \frac{\partial L(\theta|x)}{\partial \theta} =0 &\\ &\\ \frac{\partial^2 L(\theta|x)}{\partial \theta^2}<0 \end{array} \right. \end{aligned} θL(θx)=0θ22L(θx)<0

2 举例

上面都是理论和结论,为了更好地理解最大似然估计,举一个例子。假设有一枚均匀的硬币,扔到正面和反面的概率都为0.5。现在扔了2次硬币,都是正面。从概率学的角度上讲,扔一枚硬币2次都是正面的概率为0.5*0.5=0.25.

第一次 第二次 概率
0.25
0.25
0.25
0.25

现在假设我们不知道硬币是否均匀,也不知道扔到正反面的概率分别为多少,令随机变量X为扔到正面的次数,假设扔到正面的概率为 θ \theta θ,那么扔到反面的概率为 1 − θ 1-\theta 1θ, 那么似然函数为:
L ( θ ∣ x ) = f X ( x ∣ θ ) = ∏ i = 1 n f ( x i ∣ θ ) = C n a P ( X = 正 面 ) a P ( X = 负 面 ) n − a = C n a θ a ( 1 − θ ) n − a \begin{aligned} L(\theta|x)=f_X(x|\theta)=\prod_{i=1}^{n}f(xi|\theta)=C_n^aP(X=正面)^aP(X=负面)^{n-a}=C_n^a\theta^a(1-\theta)^{n-a} \end{aligned} L(θx)=fX(xθ)=i=1nf(xiθ)=CnaP(X=)aP(X=)na=Cnaθa(1θ)na

θ \theta θ的取值在 0 , 1 0,1 0,1之间。当观测到扔2次硬币均为正面时,似然函数的值为 C 2 2 θ 2 ( 1 − θ ) 0 = θ 2 C_2^2\theta^2(1-\theta)^0=\theta^2 C22θ2(1θ)0=θ2。由于 L ( θ ∣ x ) = θ 2 L(\theta|x)=\theta^2 L(θx)=θ2是一个凹函数,使得似然函数最大的 θ ^ M V \hat\theta_{MV} θ^MV的值是1。也就是说,在观察到连续两次扔硬币都是正面朝上的情况下,我们认为硬币投掷时正面朝上的概率为1是最合理的。

合理并不代表正确,这仅是在当前观测条件下最好的预测。当样本数量较大时,例如扔1000次硬币,观察正反两面朝上的情况,求出的 θ ^ M V \hat\theta_{MV} θ^MV会越来越接近真实值1/2。

猜你喜欢

转载自blog.csdn.net/weixin_46148223/article/details/108783288