选取训练神经网络时的Batch size - 代码天地

选取训练神经网络时的Batch size

其他 2020-04-24 04:06:06 阅读次数: 0

结论:

batch size 一般为2的幂次方,128为分位线,向下(乘以0.5)或向上(乘以2)测试效果,若向下效果继续,乘以0.5,直指结果不再变好,数值范围一般在:2到512.有论文说最好的实验表现都是在batch size处于2~32之间得到的
一阶优化算法:sgd,adam等,一般Batch size比较小.二阶优化算法:共轭梯度法,L-BFGS等需要二阶导数,太小,对二阶导数误差累积太大,所以需要只比较大,可以几千到两万
batch size 初衷是为了解决内存不够问题,但是却带来了跳出局部最优的增益,因为小批量数据对梯度带来了噪音,相对于完成梯度来说,每步更新的梯度下降了,但是总体来说,却避免了局部最优
大批量的batchsize 等价于小的学习率
小batch训练的稳定性较差。小batch确实有这个缺点，而且对设置学习速率有更高的要求，否则可能引起恶性的震荡无法收敛。但是小batch的优点仍然是显著的，DL书里建议使用逐步增加的batch size来兼并两者的优点。

参考文献

怎么选取训练神经网络时的batch size

深度学习的跃进来源于不同技术的组合：层、梯度更新方式、初始化方式、非线性、目标函数、正规项

发布了59 篇原创文章 · 获赞 11 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/u013385018/article/details/104817426

怎么选取训练神经网络时的Batch size?

选取训练神经网络时的Batch size

训练神经网络时如何确定batch size？

Batch size对神经网络训练的影响

神经网络训练中-Epoch、Batch Size和迭代

batch_size对于卷积神经网络训练的影响

【机器学习】浅谈 Batch Size 对训练神经网络的影响

神经网络中Batch Size的理解

Batchsize Size对神经网络训练的影响

神经网络训练中，Epoch、Batch Size和迭代傻傻分不清?

神经网络训练中Epoch、batch_size、iterator的关系

神经网络训练中,傻傻分不清Epoch、Batch Size和迭代

神经网络训练中，Epoch、Batch Size和迭代傻傻分不清

深度学习（9）神经网络训练中Epoch、Batch Size和iteration

人工智能系列（一）batch size对神经网络训练的影响

Batch Size设置过大时，对神经网络性能的影响情况

神经网络中batch_size的作用(翻译)

神经网络中的epoch、batch_size和iteration

神经网络调优 --- batch_size

训练神经网络模型过程中batch_size，steps_per_epoch，epochs意义

如何选取Batch Size大小

神经网络epoch、batch、batch size、step与iteration的具体含义介绍

Batch_Size对网络训练结果的影响

一句话理解神经网络里的batch_size，iterations，epoch

batch size设置技巧

batch_size的影响

batch_size的理解

Epoch和Batch Size

batch_size的含义

Batch_size的选择

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)