深度学习笔记-dropout(随机失活) - 代码天地

深度学习笔记-dropout(随机失活)

其他 2019-02-26 10:59:20 阅读次数: 0

drop 是通过设定的概率在每一层上随机清除一定的unit，网络会变得简洁，因为少了一些点

  keep-prob = 0.8
  d3.np.random.rand(a3.shape[0],a3.shape[1]) < keep-prob ##hidden layer中80%的点会保留，20%的点会消除，最终会是元素为true和false的矩阵
  a3 = np.multiply(a3,d3)      #a3*d3, 做乘法时，会将d3的元素转成0，1
  ##下面这步骤为 Inverted dropout(反向随机失活)，dropout中最常用的种
  ##保证消除部分点后a3的期望值不变，如这里消除了20%的点，通过除以keep-prob来保证期望不变
  a3 /= keep-prob

正向测试阶段并不希望结果是随机的，并无必要使用，即使使用后对于每一次z=wx+b也都是线性的运算，并无实际的作用
每一层的keep-prob都可能不一样，如果某层的参数矩阵维度最大，为了消除过拟合，可能会设置keep-prob的值使得该层的unit消除的较多
dropout的过程：将一个总的样本分为多个小的样本。假定分成了10份。假如设置的消除概率为20%，则在训练时会消除20%的unit，保留80%，那么对第一批样本保留下来的80%的units进行训练，得到第一次的 $\hat{y}$ ,后梯度下降，得到新的一批W和b，再对第二批样本重新消除20%(因为这里说是消除，但只是不对其进行运算，单元本身还是在网络中)，第二批剩下的80%的units进行运算得到新的 $\hat{y}$ ,再梯度下降一次，直到找到全局最优解，即cost function的值达到最小值。训练完毕。在测试阶段，是对全部的units，包括先前的20%的units，训练时候只是不对这20%的units进行运算，但是其还保留在网络中，测试的时候不采取dropout，是对全部的100%个units进行运算。
drop的缺点是会消除一小点，导致代价cost函数J不再被明确定义，方法是先确定好cost funciton，使其为单调下降的，再使用dropout

猜你喜欢

转载自blog.csdn.net/disasters/article/details/84959929

深度学习笔记-dropout(随机失活)

Dropout(随机失活)正则化

python 深度学习（5）-- 随机失活 & 过采样

随机失活实现代码（code for dropout）

《机器学习(周志华)》笔记--神经网络（6）--其他常见神经网络：深度学习模型、深度学习的兴起（历史）、卷积神经网络(CNN)、局部连接、权值共享、卷积操作（convolution）、池化操作（pooling）、随机失活（dropout）、Lenet-5

Deep learning II - I Practical aspects of deep learning - Understanding dropout 理解随机失活正则化

Deep learning II - I Practical aspects of deep learning - Dropout regularization 随机失活正则化

深度学习笔记（八）：dropout

深度学习笔记5：正则化与dropout

【深度学习笔记】正则化与 Dropout

深度学习（dropout）

深度学习： Dropout

【深度学习】Dropout

深度学习之dropout

深度学习-Dropout详解

【科普】神经网络中的随机失活方法

MXNet动手学深度学习笔记：Gluon实现Dropout

MXNet动手学深度学习笔记：Dropout

吴恩达深度学习笔记(32)-Dropout正则化Dropout Regularization

深度之眼Pytorch打卡（十三）：Pytorch全连接神经网络部件——线性层、非线性激活层与Dropout层（即全连接层、常用激活函数与失活）

深度学习中Dropout浅析

深度学习中Dropout策略

深度学习基础——Dropout & Dropconnect

Udacity深度学习之Dropout

Dropout技术之随机神经元与随机深度

深度学习基础--各种Dropout--Dropout和DropConnect

pytorch学习笔记（十三）：Dropout

【深度学习笔记】随机梯度下降法

深度学习中Dropout原理解析

深度学习理解tensorflow之Dropout

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)