深度学习的训练流程（前向传播，损失函数，优化器，反向传播更新w和b） - 代码天地

深度学习的训练流程（前向传播，损失函数，优化器，反向传播更新w和b）

其他 2021-03-22 19:54:15 阅读次数: 0

代价函数是凸函数
在这里插入图片描述
但是模型中加完非线性激活后，非线性层之间的多次复合变换，使得模型变的极为复杂，求出的预测值带入损失函数后，代价函数就不见得是凸函数了

我们要求出代价函数的全局极小值点，由于有理论指出：代价函数的大部分极小值点足够接近全局极小值点。所以我们求极小值点就可以
方法： 使用梯度下降算法（梯度指函数在该点处沿着该方向增长最快，那么我们沿着梯度的反方向，就可以使该函数在该点出下降最快）
在这里插入图片描述
为了使w和b最快达到最优值，从而最小化损失值（就是求出代价函数的极小值），我们使用优化器来更新w和b，不同优化器效果不同

在这里插入图片描述

训练的整体流程： 比如batchsize=3，三张图进入网络，一开始先使用初始化的w和b进行训练，前向传播经过每层后，得出每个像素的预测值，然后求出三张预测图的总像素的平均值，与三张标注图的总像素的平均值计算出损失值（损失函数的值），为了最小化损失函数的值，使用上面不同的优化器中的不同方法更新w和b（这些方法的公式的其中都会用到损失函数对w求偏导），更新一层w和b就放到该层，用来当下次进三张图时的w和b，一层一层往前更新（这就是反向传播的过程）。

猜你喜欢

转载自blog.csdn.net/qq_45234219/article/details/114903820

深度学习的训练流程（前向传播，损失函数，优化器，反向传播更新w和b）

深度学习torch之三（神经网络的前向传播和反向传播以及损失函数的基本操作）

深度学习中的前向传播和反向传播

tensorflow前向传播和损失函数

深度学习基础------前向传播与反向传播

深度学习原理与框架-神经网络结构与原理 1.得分函数 2.SVM损失函数 3.正则化惩罚项 4.softmax交叉熵损失函数 5. 最优化问题(前向传播) 6.batch_size(批量更新权重参数) 7.反向传播

深度学习：神经网络中的前向传播和反向传播算法推导

【深度学习】手撕神经网络前向传播和反向传播例子

深度学习神经网络中的前向传播和反向传播算法推导

《动手学深度学习 Pytorch版》 4.7 前向传播、反向传播和计算图

caffe 前向传播和反向传播

前向传播和反向传播

前向传播与反向传播

深度学习神经网络 MNIST手写数据辨识 1 前向传播和反向传播

动手深度学习的学习笔记01：广播机制，损失函数，softmax，丢弃，正向传播和反向传播

4.7 前向和反向传播-深度学习-Stanford吴恩达教授

Educoed--实现神经网络模型的前向传播、反向传播和训练

meanpool maxpool 前向和反向传播

前向传播和反向传播最好实例

前向传播和反向传播（推导示例）

前向传播和反向传播实战（Tensor）

神经网络的前向传播和反向传播推导

[Pytorch] 前向传播和反向传播示例

PyTorch学习笔记-损失函数与反向传播

轻松学习神经网络3：构建前向传播和反向传播预测结果

前向传播与反向传播（1）

前向传播与反向传播的原理与实现

[吃药深度学习随笔] 反向传播：训练模型参数令参数梯度下降使神经网络的损失函数最小

深度学习之前馈神经网络（前向传播和误差方向传播）

深度学习原理与框架-RNN网络架构-RNN网络 1.RNN的前向传播 2.RNN的反向传播

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)