学习笔记-利用Gradient Checking检查神经网络模型 - 代码天地

学习笔记-利用Gradient Checking检查神经网络模型

其他 2018-10-08 16:39:02 阅读次数: 0

利用Gradient Checking检查神经网络模型

在搭建完神经网络模型后怎样判断中间有没有bug呢？这就要用到Gradient Checking了。
一般前向传播网络的计算不容易出错，而在计算反向传播网络的过程中很容易出错。
学过微积分的都知道，某一点的导数可以用以下公式近似表示：

\partial J \partial θ = lim ε \to 0 J ( θ + ε ) - J ( θ - ε ) 2 ε

$\frac{\partial J}{\partial \theta} = \lim_{\varepsilon \to 0} \frac{J(\theta + \varepsilon) - J(\theta - \varepsilon)}{2 \varepsilon}$
这里写图片描述

这里写图片描述

因此我们只要比较近似值（gradapprox）与实际值（grad）之间的差异，如果差异足够小，就可以认为反向传播网络的计算过程没有问题。
计算差异的公式如下：

d i f f e r e n c e = ∣ ∣ g r a d - g r a d a p p r o x ∣ ∣ 2 ∣ ∣ g r a d ∣ ∣ 2 + ∣ ∣ g r a d a p p r o x ∣ ∣ 2

$difference = \frac {\mid\mid grad - gradapprox \mid\mid_2}{\mid\mid grad \mid\mid_2 + \mid\mid gradapprox \mid\mid_2}$
（在python里，上述公式的分子可以用np.linalg.norm(…)计算获得）

Gradient Checking的运行很好时，我们不必在训练的每次迭代过程都使用它，只要测试几次没有问题就可以不用管了。Gradient Checking实际是在证明反向传播算法计算的梯度与我们定义的梯度估计值很相近。

注：如无特殊说明，以上所有图片均截选自吴恩达在Coursera开设的神经网络系列课程的讲义。

猜你喜欢

转载自blog.csdn.net/maryyu8873/article/details/78512904

学习笔记-利用Gradient Checking检查神经网络模型

改善深层神经网络第一周-Gradient Checking（梯度检查）

神经网络学习之梯度检查

【神经网络学习笔记】卷积神经网络之搭建卷积神经网络模型

第四章第五节神经网络（梯度校验（Gradient Checking））

BP神经网络模型与学习算法

机器学习：神经网络的模型构建

神经网络与深度学习模型

深度学习神经网络中的梯度检查

卷积神经网络(CNN)学习笔记2：模型训练

机器学习笔记(四)BP神经网络模型

PyTorch学习笔记-神经网络模型搭建小实战

图神经网络（GNNs）模型学习笔记与总结

神经网络梯度下降算法（gradient descent）笔记

卷积神经网络之ResNet网络模型学习

机器学习与神经网络（一）：人工神经网络模型简介

深度学习&图像处理（神经网络、卷积神经网络、Googlenet 模型、inception架构7）

深度学习（3）之经典神经网络模型整理：神经网络、CNN、RNN、LSTM

【深度学习实验】卷积神经网络（六）：卷积神经网络模型（VGG）训练、评价

神经网络——学习笔记

学习笔记-神经网络

神经网络学习笔记

【神经网络】——学习笔记

【神经网络学习笔记】构建一个具有Logistic回归的神经网络模型

神经网络学习笔记9——循环神经网络中的LSTM与GRU模型理解及代码解析

【深度学习_1.3】搭建浅层神经网络模型

【深度学习_1.4】搭建多层神经网络模型

比赛用到的神经网络--需要学习的 DenseNet模型

【深度学习】经典卷积神经网络模型

机器学习(周志华)——神经网络模型(一)

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)