dropout和BN - 代码天地

dropout和BN

企业开发 2023-10-01 16:10:28 阅读次数: 0

解决过拟合的最好办法增大数据集
dropout：随机丢且一些神经元--》只有在训练数据是有效
1. 取平均的作用
2. 减少两个神经元之间复杂的共适应关系：因为dropout程序导致两个神经元不一定每次都在一个dropout网络中出现（随机森林）
关于nn.module里面内置的dropout 有三种方法：dropout，dropout
2d，dropout3d。一维数据就使用dropout，图片数据使用dropout2d，三维疏浚就使用dropout3d

dropout层一般都放在模型的厚后面
注意在测试时，dropout层时不会起作用的

model.train（）训练模式
model.eval（）预测模式
这两种模式主要影响dropout和BN层

######BN层##########
解决的事梯度消失和梯度爆炸问题
传统机器学习中的表准化也叫归一化
一般是将数据映射到指定范围，用于除去不同维度的数据的量纲以及量纲单位
#批标准化：不仅在讲数据输入模型之前对数据做标准化，在网络的每一次变换之后都应该考虑数据标准化。

好处：具有正则化的效果
提高模型的泛化能力
允许更高的学习速率从而加速收敛
BN层通常应用于卷积层或者Linear（全链接层）之后：
nn.BatchNorm1d（）--》linear层
nn.BatchNorm2d（） ---〉卷积层

实现过层：
1. 求每一个训练批次数据的均值
2. 求每一个训练批次的数据方差
3. 数据进行标准化
4. 训练参数Y，B
5. 输出y 通过Y，B的线性变换得到原来的数值，在训练的正向传播中不会改变当前输出

CNN中讲用在激活函数之前，但是用在激活函数之后可能会效果更好

猜你喜欢

转载自blog.csdn.net/qq_45675231/article/details/129899941

dropout和BN

深度学习：dropout和BN的实现

BN和Dropout同时使用的问题

【深度学习】BN和Dropout在训练和测试时的差别

BN和Dropout在训练和测试时的差别

深度学习 - 训练技巧 - 初始化、Dropout 和 BN

Dropout和BN为什么不能共同使用？

PaddlePaddle入门深度学习（五）：卷积神经网络基础之BN和Dropout

深度学习总结：用pytorch做dropout和Batch Normalization时需要注意的地方，用tensorflow做dropout和BN时需要注意的地方,

【转载】深度学习总结：用pytorch做dropout和Batch Normalization时需要注意的地方，用tensorflow做dropout和BN时需要注意的地方,

BN和Relu

LN和BN对比

BN和CmBN

Dropout 和 Inverted Dropout 代码中实现

bagging和dropout

Dropout和正则项

dropout和过拟合

理解Dropout和BatchNormalization

BatchNorm和Dropout的使用

Dropout和Droppath

Dropout 和 Drop Path

BN

IN与BN

Caffe BN+Scale层和Pytorch BN层的对比

Numpy实现BP神经网络（包含Dropout、BN等训练技巧）

神经网络训练加速、增加稀疏性操作（Dropout、GN、BN、LRN）

Dropout

Dropout和学习率衰减

regularization 和 dropout 关系推导

Dropout解释和应用实例

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)