关于weight decay - 代码天地

关于weight decay

其他 2020-03-17 10:46:36 阅读次数: 0

weight decay的作用主要是令神经网络中的权重变小（趋于0），以防止过拟合
如 $y=\sum_{i}{w_ix_i}$ ，则因噪声的存在，可能会令其中某几个 $w$ 偏大，导致无法正确拟合正常输入
weight decay的公式为：

$C=C_0+\frac{\lambda}{2n}\sum_i{w_i^2}$

$\frac{\partial{C}}{\partial{w_k}}=\frac{\partial{C_0}}{\partial{w_k}}+\frac{\lambda w_k}{n}$

其中 $C_0$ 为原误差， $\lambda$ 为weight decay系数，也可以看做是惩罚值, $\frac{1}{2}$ 则用于求导时的简化

原始梯度下降 $w_{new}=w_{old}-\eta\Delta ,\Delta=\frac{\partial{C_0}}{\partial{w_k}}$

使用了weight decay之后， $\Delta$ 中多了一项 $\frac{\lambda w_k}{n}$ ，即对梯度下降时较大的权重，会赋予较大的惩罚值，使新的w趋于0

而在选取decay值上，目前尚没有比较普适的公式
How could I choose the value of weight decay for neural network regularization 中提到用平时调参时常用的两种策略：grid search 和 random search
其实都是类似穷举，首先需要有个验证集（不同于训练集），分别对验证集采取不同decay值(如0.5, 0.1, 0.01等等)进行测试，选取其中效果较好的decay，即作为训练集的decay

MaloFleur

发布了109 篇原创文章 · 获赞 108 · 访问量 21万+

私信关注

猜你喜欢

转载自blog.csdn.net/u013700358/article/details/96341489

关于weight decay

weight decay

关于weight_decay的设定

权重衰减（weight decay）

3.12_weight-decay

权重衰减weight decay实验

weight_decay等参数的作用

Weight Decay 权值衰减

learning rate 和weight decay

weight_decay(权重衰减)

dying relu 和weight decay

权重衰减（weight decay）与学习率衰减（learning rate decay）

weight decay 和正则化caffe

「Deep Learning」Note on Decoupled Weight Decay Regularization

【tf.keras】AdamW: Adam with Weight decay

权重衰减（weight decay）的理解及Tensorflow的实现

19正则化之weight_decay

权重衰减/权重衰退——weight_decay

decay

超参数momentum与weight-decay的作用超参数momentum与weight-decay的作用

【转载】权重衰减（weight decay）与学习率衰减（learning rate decay）

学习笔记一：learning rate,weight decay和momentum的理解

PyTorch学习笔记（25）正则化 weight_decay

深度学习超参数——momentum、learning rate和weight decay

权重衰减weight_decay参数从入门到精通

优化器原理——权重衰减（weight_decay）

深度学习超参数简单理解learning rate,weight decay和momentum

深度学习剖根问底：weight decay等参数的合理解释

深度学习超参数简单理解：learning rate,weight decay和momentum

深度学习概念、参数理解：iteration, batch_size, epoch, learning rate, weight_decay

今日推荐

周排行

word2Vec基础背景知识

Linux rsync实现断点续传

CNCF Dan Kohn：云原生将会在中国快速发展

知识图谱学习笔记(2)---为什么要知道知识图谱？什么是知识图谱？

table点击一行任意位置选中该行的radio按钮

(摘)springboot 配置文件

46464644

【String-easy】541. Reverse String II 反转的元素，有反转个数和间隔

微信小程序操作dom元素节点 wx.createSelectorQuery()

十年目のバレンタインデー　　　002

每日归档

更多

2024-07-19(0)

2024-07-18(0)

2024-07-17(0)

2024-07-16(0)

2024-07-15(0)

2024-07-14(0)

2024-07-13(0)

2024-07-12(0)

2024-07-11(0)

2024-07-10(0)