神经网络（三）—— BP算法基本推导

编程语言 2020-01-30 19:03:33 阅读次数: 0

BP算法

前情回顾

上回我们说到，单层的线性神经网络权值的迭代公式是：
$w:=w-\eta X^T(f(wX)-y)f'(wX)$
其中呢，这个 $(f(wX)-y)f'(wX)$ 我们称它为 $\delta$ ，于是
$w:=w-\eta X^T\delta$
不用必须是线性神经网络，其他激活函数也适用于这个公式，只不过线性的话就可以把f’(wX)这一项去掉。

对于多层的神经网络来说，每一层的权值怎么更新呢？

下面以二层的网络为例给出推导。

基本推导

二层网络

损失函数自然就是
$E=\frac12(O-Y)^2$
这个二层的网络是如何工作的？

我们把它看成两个单层的就好。

一开始我们初始化了两层的权值V和W。

假设我们的激活函数是f(x).

中间层的输出就可以计算:
$M = f(VX)$
然后我们把 M作为下一层的输入，就可以得到预测值O：
$O=f(WM)$
接下来将损失函数对W求导我们就能得到W的迭代方程:
$W:=W-\eta M^T\delta_2$
其中的 $\delta_2$ 就是 $(O-Y)*f'(WM)$ ,也同样可以写成 $\frac{\partial E}{\partial (WM)}$

这样一来我们就更新了 $W$ ,记作 $W_2$ 。

通过迭代W之后，我们知道现在的 $W_2$ 可以使得f(WM)更加接近Y。

同样的想法我们要改变V使得f(VX)更加接近M的‘真实值’，从而使得 $f(W_2M_2)$ 更接近Y。

同理：
$V:=V-\eta X^T\delta_1$
$\delta_1$ 可以写成 $\frac{\partial E}{\partial (VX)}$ ，根据链式求导法则
$\delta_1=\frac{\partial E}{\partial (VX)}=\frac{\partial E}{\partial (WM)}\cdot\frac{\partial (WM)}{\partial M}\cdot\frac{\partial M}{\partial (VX)}\\=\delta_2\cdot W_2\cdot f'(VX)\\$
求出 $\delta_1$ 后，V权值也能更新了。

这个公式当然还能更加一般化：
$\delta_i=\delta_{i+1}\cdot W_{i+1}\cdot f'(W_iO_i)$

发布了16 篇原创文章 · 获赞 0 · 访问量 391

私信关注

猜你喜欢

转载自blog.csdn.net/Paul_1i/article/details/104117550

神经网络（三）—— BP算法基本推导

BP神经网络算法推导

神经网络和BP算法推导

神经网络学习(三)——BP神经网络算法

神经网络的BP推导

前馈神经网络 BP算法推导

BP神经网络反向传播算法推导原理

多层神经网络BP算法原理及推导

【机器学习算法推导】BP神经网络

深度学习-神经网络 BP 算法推导过程

BP神经网络算法推导及代码实现笔记zz

神经网络——反向传播BP算法公式推导

神经网络-反向传播BP算法推导

卷积神经网络 CNN BP算法推导

神经网络详细解释（包含BP算法的推导）

神经网络之BP算法(图说神经网络+BP算法理论推导+例子运用+代码)

【神经网络】BP算法

神经网络BP算法

BP神经网络推导过程详解

BP神经网络原理公式推导

BP神经网络说明及推导

神经网络的BP推导过程

BP神经网络原理推导

BP神经网络公式推导

BP反向传播多层神经网络BP算法原理及推导

《机器学习(周志华)》笔记--神经网络（4）--误差逆传播算法(BP)：BP算法、BP算法推导

BP神经网络算法推导（包含输出层和隐层）

AI从入门到放弃：BP神经网络算法推导及代码实现笔记

BP神经网络(Back Propagation Neural Network)算法原理推导与Python实现详解

深入浅出|深度学习算法之BP神经网络详细公式推导

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)