机器学习 day13（正则化，线性回归的正则化，逻辑回归的正则化）

1. 正则化的思想

如果特征的参数值更小，那么对模型有影响的特征就越少，模型就越简单，因此就不太容易过拟合
如上图所示，成本函数中有W₃和W₄，且他们的系数很大，要想让该成本函数达到最小值，就得使W₃和W₄接近0，从而消除它们对成本函数的影响，最后我们就得出一个接近二次函数（左边图片）的成本函数

2. 正则化的一般形式

通常，一个模型有很多特征，我们不知道哪个特征的参数重要，哪个特征的参数我们需要缩小或惩罚。所以，我们一般是缩小或惩罚所有特征的参数。
一般来说，我们可以给成本函数加上，Wj和b的正则项，其中b的正则项可加可不加
λ为正则参数，且λ > 0
给正则参数λ 除以 2m ，即与第一项采用相同缩放1/2m，可以当训练集发生改变时，原λ可能可以不变

3. 正则化的最终形式
正则化后的成本函数由平均误差项和正则化项组成，而最小化成本函数即最小化第一项（使预测值更好的拟合训练数据集），和最小化第二项（使特征的参数保持较小的值，防止过拟合）
λ则用来在最小化这两个项之间获得平衡，不能过大，也不能过小
当λ取0时，正则化项为0，即它并没有在最小化成本函数的过程中发挥作用，会导致函数过于复杂，模型过拟合
当λ取10¹⁰时，为了最小化成本函数，就要最小化正则化项，那么Wj必须非常接近0，即W的所有值都必须非常接近0，会导致函数平行于x轴，模型欠拟合

4. 线性回归的梯度下降算法的正则化

在这里插入图片描述

5. 逻辑回归的梯度下降算法的正则化
在这里插入图片描述