pytorch训练神经网络loss刚开始下降后来停止下降的原因 - 代码天地

pytorch训练神经网络loss刚开始下降后来停止下降的原因

编程语言 2018-09-13 10:08:47 阅读次数: 0

问题提出：用pytorch训练VGG16分类，loss从0.69下降到0.24就开始小幅度震荡，不管如何调整batch_size和learning_rate都无法解决。

原因：没有加载预训练模型

那么问题来了，官方给出的是1000类的ImageNet预训练模型 https://download.pytorch.org/models/vgg16-397923af.pth，而我要做的是20类数据集的分类，如何使用这一预训练的权重。

def vgg16(pretrained=False, **kwargs):
    """VGG 16-layer model (configuration "D")"""
    model = VGG(make_layers(cfg['D']), **kwargs)
    if pretrained:
        model.load_state_dict(torch.load('./vgg16-397923af.pth'))
        model.classifier = nn.Sequential(
            nn.Linear(512 * 7 * 7, 4096),
            nn.ReLU(inplace=True),
            nn.Dropout(),
            nn.Linear(4096, 4096),
            nn.ReLU(inplace=True),
            nn.Dropout(),
            nn.Linear(4096, you_class_num),
        )
    return model

其中VGG按照官方给出的构造方法构造class VGG即可。

先构造1000类的VGG模型，用于加载pth预训练模型，然后重新构造分类层，将最后一层全连接层设置为需要的类别数量即可。

猜你喜欢

转载自blog.csdn.net/u012759006/article/details/82588351

pytorch训练神经网络loss刚开始下降后来停止下降的原因

神经网络训练loss不下降原因集合

神经网络训练时loss不下降的问题

如何解决神经网络训练时loss不下降的问题

卷积神经网络loss不下降,神经网络loss多少算正常

训练loss不下降原因集合

训练loss 不下降原因分析

神经网络梯度下降算法的demo

神经网络中的梯度下降

梯度下降_神经网络中的运用

神经网络入门-梯度下降

深度神经网络与梯度下降法

BP神经网络模型及梯度下降法 BP神经网络模型及梯度下降法

手算梯度下降法，详解神经网络迭代训练过程

使用矩阵运算和梯度下降法实现神经网络的迭代训练

caffe总结（八）loss不下降的原因

神经网络入门——10.梯度下降

神经网络入门——13实现梯度下降

人工神经网络（五）梯度下降法

神经网络算法学习之梯度下降算法

神经网络梯度下降算法（gradient descent）笔记

神经网络例程-梯度下降法更新权值

神经网络优化算法：从梯度下降到Adam方法

3.10 神经网络的梯度下降法-推导

神经网络学习引入-优化（随机梯度下降）

神经网络系列之二 -- 反向传播与梯度下降

【神经网络学习笔记】梯度下降优化算法

神经网络之梯度下降法原理

梯度下降算法原理神经网络（Gradient Descent）

深入理解神经网络中的梯度下降

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)