dropout的forward过程及backward反向传播过程 - 代码天地

dropout的forward过程及backward反向传播过程

企业开发 2023-09-18 20:23:00 阅读次数: 0

forward过程

假设以概率 $p$ 丢弃 $K$ 维输入向量 $x=[x_1, x_2, ,, x_K]$ 的某些值。
那么经过dropout之后的向量定义为 $d$ ，有
$x^{'} = d r o p o u t (x)$
这个过程相当于生成一个随机的 $K$ 维的mask，这个mask的生成过程如下：

$[r_1, r_2, ,,r_K]，其中0<r_i <1。 \\ mask = \left\{ \begin{aligned} 0 \ \ \ \ r_i < p \\ 1 \ \ \ \ r_i \ge p \end{aligned} \right.$
然后 $x$ 与 $m a s k$ 做对应元素点乘（这个操作记为 $@$ ）。也就是
$x^{'} = d r o p o u t (x) = x @ m a s k$
这样的设计的dropout会出现一些问题。在训练的时候，dropout工作， $x$ 经过dropout之后的期望为
$E [x] = p * 0 + (1 - p) * x = (1 - p) x$
在测试的时候，dropout是不工作的，此时 $x$ 的期望是 $x$ 。这样导致训练和测试的期望不一样，模型会不稳定。为了让训练时候 $x$ 的期望和测试时一直，一种做法是在训练时将dropout后的结果除以 $1 - p$ 。这时也就相当于将mask变为：
$[r_1, r_2, ,,r_K]，其中0<r_i <1。 \\ mask = \left\{ \begin{aligned} 0 \ \ \ \ r_i < p \\ {1 \over 1-p} \ \ \ \ r_i \ge p \end{aligned} \right.$

backward

假设模型forward之后的loss是 $l$ ，如何求反向传播时 $l$ 对 $x$ 的梯度？
$x = [x_1, x_2, ..., x_K] \\ x' = dropout(x) = x@mask \\ l = forward(x')$
那么 $\over dx} = {dl \over dx'}{dx' \over dx}$
其中
$\over dx} = \left\{ \begin{aligned} 0 \ \ \ \ r_i < p \\ {1 \over 1-p} \ \ \ \ r_i \ge p \end{aligned} \right.$

猜你喜欢

转载自blog.csdn.net/mch2869253130/article/details/119809360

dropout的forward过程及backward反向传播过程

CNN的反向传播过程

DNN的反向传播过程

CNN详解——反向传播过程

DNN反向传播推导过程

卷积网络反向传播过程

反向传播过程推导例子

反向传播的计算过程

back propogation反向传播公式推导及其反向传播过程

DNN反向传播具体推导过程（2）

反向传播算法（过程及公式推导）

CNN反向传播训练参数过程

5.1-反向传播算法过程梳理

caffe中backward(反向传播)的实现

dropout详解(随机掩码向量) & 反向传播

CNN中的梯度的求法和反向传播过程

深度学习中的梯度和反向传播过程

caffe loss以及正则项反向传播过程

深度学习基础：反向传播即BP算法的推导过程

对深度学习之反向传播训练过程的理解

softmax交叉熵损失函数反向传播求导过程分析

Cov2d反向传播梯度的计算过程

神经网络--反向传播详细推导过程

反向传播算法(Backpropagation)----Gradient Descent的推导过程

神经网络反向传播更新梯度的过程

反向传播算法推导过程（看一篇就够了）

深层神经网络的正向、反向传播的过程

单隐藏层网络的正向、反向传播过程

neural network forward and backward propagation（前向传播和后向传播）

Dropout 层的python实现（内含dropout函数及带dropout的前向反向传播函数）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)