L1/L2正则化 - 代码天地

L1/L2正则化

其他 2020-04-24 17:02:48 阅读次数: 0

概述

在模型训练可能遇到训练集错误率较小，但是验证集和测试集中错误率较大的问题，出现这种情况的时候，说明模型可能出现了过拟合问题，为了解决过拟合首先会想到正则化，当然也可以增加训练数据集。

为什么正则化可以解决过拟合

L2正则化
首先定义损失函数

反向传播求得梯度为：

更新梯度：

从结果可知：
实际上相当于给权重矩阵W乘以了（1- lamba/m），倍的权重系数，该系数小于1 因此L2被称为权重衰减（ lamba称为正则化超参数）

正则化参数设置的足够大的情况下，为了使损失函数最小化，权重矩阵 W 就会被设置为接近于 0 的值，对于神经网络相当于消除了很多神经元的影响，这样比较大的神经网络就会变成一个较小的网络，使网络不在变得复杂，从而解决过拟合的问题
L1正则化

反向传播求得梯度为：

更新梯度：

从结果可知：
L1 权重最终减少的是一个常数，使得L1正则化最后得到 w 向量中可能将存在大量的 0，使模型变得稀疏化

发布了66 篇原创文章 · 获赞 1 · 访问量 7023

私信关注

猜你喜欢

转载自blog.csdn.net/qq_41128383/article/details/105333810

正则化（L1和L2正则）

L1、L2正则化

正则化项L1和L2

L1,L2正则化

L1与L2正则化总结

L1，L2正则化的区别

L1和L2正则化原理

L1 L2正则化

L1与L2正则化

L1和L2正则化

L1 & L2 正则化的理解

L1，L2正则化

机器学习 - 正则化L1 L2

理解L1与L2正则化

L1,L2正则化代码

MachineLearning—L1、L2正则化介绍

正则化L1、L2的理解

正则化L1和L2

L1和L2的正则化的理解

L1和L2正则化(regularization)

L1/L2正则化

L1、L2正则化总结

L1,L2正则化cookbook

L1、L2正则化来源推导

L1/L2正则化在Pytorch的实现

正则化L1和L2的区别？

L1,L2正则

L1、L2正则化以及smooth L1 loss

L1正则 L2正则

L1正则与L2正则的比较

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)