l1约束比l2约束更容易获得稀疏解

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/diyoosjtu/article/details/89436119

本文内容受到了知乎相关问题的启发,本人做了一些整理和补充。

l 1 l_1 l 2 l_2 约束

将损失函数 L ( w ) L(w) 看作参数 w w 的函数,则 l 1 l_1 约束的形式是:
(1) L = L ( w ) + λ w 1 L = L(w) + \lambda\left\Vert w\right\Vert_1 \tag{1}
l 2 l_2 约束的形式是:
(2) L = L ( w ) + 1 2 λ w 2 2 L = L(w) +\frac{1}{2} \lambda\left\Vert w\right\Vert_2^2 \tag{2}

解释一

设不添加约束时, L ( w ) L(w) 的图像如下图所示,使用梯度下降法找到的最优解是途中的绿色点。

在这里插入图片描述
添加式(2)所示的 l 2 l_2 约束之后,新的导数为:
(3) L = L ( w ) + λ w ( L ( 0 ) + L ( 0 ) w + o ( w ) ) + λ w = L ( 0 ) + λ w + o ( w ) \begin{aligned} L' &= L'(w) + \lambda w\\ &\approx (L(0) + L'(0)w + o(w))' + \lambda w\\ & = L'(0) + \lambda w + o'(w) \end{aligned} \tag{3}
如上图所示,原本的 w = 0 w=0 点不是最优解,说明 L ( 0 ) L'(0) 不等于0,那么式(3)中当 w = 0 w=0 时,新的导数与不加约束时的导数值是一样的,仍然不为0,说明添加 l 2 l_2 约束之后,不能把最优解拉到 w = 0 w=0 的位置。如下图所示,添加约束之后的曲线变为蓝线,最优解变成了黄色点, w w 绝对值减少了,但是不为0

在这里插入图片描述

添加式(1)所示的 l 1 l_1 约束之后,在 w w 无限逼近于0的位置,导数如下:
(4) { L = L ( w ) + λ ( L ( 0 ) + L ( 0 ) w + o ( w ) ) + λ = L ( 0 ) + λ + o ( w ) , w > 0 L = L ( w ) λ ( L ( 0 ) + L ( 0 ) w + o ( w ) ) λ = L ( 0 ) λ + o ( w ) , w < 0 \left\{\begin{aligned} L' &= L'(w) + \lambda \approx (L(0) + L'(0)w + o(w))' + \lambda = L'(0) + \lambda + o'(w), && w>0\\ L' &= L'(w) - \lambda \approx (L(0) + L'(0)w + o(w))' - \lambda = L'(0) - \lambda + o'(w), && w<0\\ \end{aligned}\right. \tag{4}

可知,只要 L ( 0 ) + λ > 0 L'(0)+\lambda>0 并且 L ( 0 ) λ < 0 L'(0)-\lambda<0 ,也即:
λ > L ( 0 ) \lambda > |L'(0)|
就可以使得 w = 0 w=0 L L 的一个极小值点,也就有可能是最优解。

如下图所示,添加约束之后的曲线是粉色线,最优解是红色点。

在这里插入图片描述

解释二

如下图所示,原问题是红色直线, L 1 L_1 约束的曲线是蓝色方框, l 2 l_2 约束的曲线是浅蓝色圆。

添加约束之后,新问题的最优解就是两条曲线相切的点。

可以发现, l 1 l_1 约束时,解会出现在端点处,得到了稀疏解。

l 2 l_2 约束时,圆与直线的切点是新的最优解,不是稀疏解。
在这里插入图片描述

解释三

在这里插入图片描述

参考链接如下:

l1 相比于 l2 为什么容易获得稀疏解? - 王赟 Maigo的回答 - 知乎
https://www.zhihu.com/question/37096933/answer/70426653

l1 相比于 l2 为什么容易获得稀疏解? - MadFrog的回答 - 知乎
https://www.zhihu.com/question/37096933/answer/70938890

l1 相比于 l2 为什么容易获得稀疏解? - 曹荣禹的回答 - 知乎
https://www.zhihu.com/question/37096933/answer/475278057

猜你喜欢

转载自blog.csdn.net/diyoosjtu/article/details/89436119