机器学习西瓜书笔记：神经网络：BP算法公式推导

移动开发 2023-04-16 13:35:58 阅读次数: 0

1、变量符号含义

在这里插入图片描述
1、训练集 $\{(\vec{x}_1, \vec{y}_1), (\vec{x}_2, \vec{y}_2),..., (\vec{x}_m, \vec{y}_m)\}$ ，共m个样例

2、 $\vec{x}_i \in \mathbb{R}^d, \vec{y}_i \in \mathbb{R}^d$ ：输入样本由 $d$ 个属性描述，输出 $l$ 维( $l$ 个属性描述)实值向量 $\vec{y}_i$

3、对应图中的神经网络

d个输入神经元：输入特征向量由d个属性描述
l个输出神经元：输出特征向量由y个属性描述
q个隐层神经元：拟合数据集线性不可分时的模型

4、连接权都如图所示

5、激活函数：sigmoid
在这里插入图片描述

6、阈值：每个神经元都有自己的阈值

输出层第 $j$ 个神经元 $y_i$ 的阈值： $\theta_i$
隐层第 $h$ 个神经元 $b_h$ 的阈值： $\gamma_h$

7、第x个神经元的输入：FNN都是全连接，因此要求和

输出层第j个神经元的输入： $\beta_j$
隐层第h个神经元的输入： $\alpha_h$

2、损失函数：均方误差推导

1、训练样例 $(\vec{x}_k, \vec{y}_k)$

2、其经过神经网络的 $l$ 个输出记为 $\hat{\vec{y}}_k = (\hat{y_1}^k,\hat{y_2}^k, ...,\hat{y_l}^k )$ ，其中每个输出：
在这里插入图片描述
3、则对于这一个训练样例 $(\vec{x}_k, \vec{y}_k)$ ，网络的均方误差为：

在这里插入图片描述

3、算法：求参数w和θ，BP算法，基于随机梯度下降

3.1 随机梯度下降的理解

参考
在这里插入图片描述

梯度是有方向的：曲面上方向导数的最大值的方向就代表了梯度的方向

因此每次规定的步长 $\eta$ 固定，我们的参数就要朝着该参数对应函数梯度的方向（变化最快，如山最陡峭的方向）变化，才能让损失函数值最快地往极小值收敛。

理解：假设你初始在山顶，步长5m，朝着梯度最大（最陡峭的）方向，走5m（也就是当前点的梯度值*步长），能垂直距离下降4m，非最陡峭方向一次则垂直距离下降更少。

批量梯度下降：

对于权值 $\vec{\theta}$ 中的每个分量 $\theta_j$ （个数对应样本属性个数），每次 所有m个样本的第j个属性值都要参与更新 $\Delta值$ 。
更新完所有分量，算作一次批量梯度下降结束。一般我们会重复梯度下降多次

在这里插入图片描述
如图代码就是使用批量梯度下降，重复了iters次数，每一次所有样本参与对权值 $\vec{\theta}$ 中的每个分量 $\theta_j$ 进行更新。那个np.sum

随机梯度下降：

用样本中的一个随机选取的样本 $\vec{x}_i$ 来近似我所有的样本，来调整θ

对于权值 $\vec{\theta}$ 中的每个分量 $\theta_j$ （个数对应样本属性个数），每次 只有样本 $\vec{x}_i$ 的第j个属性值参与更新 $\Delta值$ 。
更新完所有属性分量，算作一次随机梯度下降结束。一般我们会重复梯度下降多次

在这里插入图片描述

3.2 公式推导

求偏导什么时候结果要求和：看连线
在这里插入图片描述

单独一条隐含层到输出层的连接权w只影响一个y，因此对其求偏导，无需求和。
但是输入层到隐含层的连接权v，即使是一条，也会影响所有的y。
看图中的连线即可知道。则其实从隐含层的神经元b开始，之后所有的参数，一个都会影响所有的y。故链式法则求偏导时要加上求和符号。

在这里插入图片描述

3.3 BP算法

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_42810939/article/details/124004238

机器学习西瓜书笔记：神经网络：BP算法公式推导

机器学习（西瓜书）学习笔记（四）---------神经网络

《机器学习(周志华)》笔记--神经网络（4）--误差逆传播算法(BP)：BP算法、BP算法推导

【机器学习算法推导】BP神经网络

神经网络——反向传播BP算法公式推导

BP神经网络原理公式推导

BP神经网络公式推导

深入浅出|深度学习算法之BP神经网络详细公式推导

机器学习算法--BP神经网络

【机器学习】 BP 神经网络算法的原理（数学公式+算法实现）

BP神经网络算法推导及代码实现笔记zz

机器学习（MACHINE LEARNING）【周志华版-”西瓜书“-笔记】 DAY5-神经网络

深度学习-神经网络 BP 算法推导过程

BP神经网络原理推导（学习笔记）

BP神经网络算法推导

神经网络和BP算法推导

【西瓜书笔记】——神经网络

西瓜书笔记之神经网络

神经网络之反向传播算法（BP）公式推导（超详细）

BP神经网络：误差反向传播公式的简单推导

BP神经网络后向传播公式推导

BP神经网络公式推导及实现(MNIST)

BP神经网络公式推导及实现 MNIST

BP神经网络误差反向传播公式简单推导

BP反向传播神经网络的公式推导

西瓜书《机器学习》阅读笔记6——Chapter3_公式(3.27)的推导过程

【机器学习】【数学推导】神经网络(NN)及误差逆传播(BP详细推导过程)

周志华《机器学习》西瓜书小白Python学习笔记（五） ———— 第五章神经网络

机器学习——神经网络累积BP算法

[DataAnalysis]机器学习算法——BP神经网络原理简介

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)