实现反向传播

数据库 2019-02-19 18:00:50 阅读次数: 0

现在我们知道输出层的误差是

δk=(yk−y_k)f′(a_k)

隐藏层误差是

[图片上传失败...(image-a4330a-1519137685856)]

现在我们只考虑一个简单神经网络，它只有一个隐藏层和一个输出节点。这是通过反向传播更新权重的算法概述：

把每一层权重更新的初始步长设置为 0

输入到隐藏层的权重更新是 Δwij=0

隐藏层到输出层的权重更新是 ΔWj=0

对训练数据当中的每一个点

让它正向通过网络，计算输出 y^

计算输出节点的误差梯度 δo=(y−y^)f′(z) 这里 z=∑jWjaj 是输出节点的输入。

误差传播到隐藏层 δjh=δoWjf′(hj)

更新权重步长：
ΔWj=ΔWj+δoaj
Δwij=Δwij+δjhai

更新权重, 其中 η 是学习率，m 是数据点的数量：
Wj=Wj+ηΔWj/m
wij=wij+ηΔwij/m
重复这个过程 e 代。

反向传播练习

现在你来实现一个通过反向传播训练的神经网络，数据集就是之前的研究生院录取数据。通过前面所学你现在有能力完成这个练习：

你的目标是：

实现一个正向传播
实现反向传播算法
更新权重

uare error on the training set
if e % (epochs / 10) == 0:
  hidden_output = sigmoid(np.dot(x, weights_input_hidden))
  out = sigmoid(np.dot(hidden_output,
        weights_hidden_output))
  loss = np.mean((out - targets) ** 2)

  if last_loss and last_loss < loss:
   print("Train loss: ", loss, " WARNING - Loss Increasing")
  else:
      print("Train loss: ", loss)
      last_loss = loss

# Calculate accuracy on tesimport numpy as np
from data_prep import features, targets, features_test, targets_test

np.random.seed(21)

def sigmoid(x):
"""
 Calculate sigmoid
 """
return 1 / (1 + np.exp(-x))

# Hyperparameters
n_hidden = 2 # number of hidden units
epochs = 900
learnrate = 0.005

n_records, n_features = features.shape
last_loss = None
# Initialize weights

猜你喜欢

转载自blog.csdn.net/weixin_34072159/article/details/87426859

实现反向传播

caffe的反向传播的实现

前向传播与反向传播的原理与实现

TensorFlow进阶--实现反向传播

TensorFlow实现MNIST反向传播

手撸反向传播算法+代码实现

python简单实现反向传播算法

反向传播（BP算法）python实现

python 代码实现反向传播算法

caffe中backward(反向传播)的实现

代码实现简单的前向、反向传播

TensorFlow：使用TensorFlow实现反向传播算法

softmax 反向传播代码 python 实现

反向传播

前项传播和反向传播

前向传播与反向传播

正向传播和反向传播

【深度学习】BP反向传播算法Python简单实现

TensorFlow实战系列3--实现反向传播

反向传播神经网络（BP网络）介绍及Java实现

机器学习-反向传播算法（BP）代码实现（matlab）

tensorflow 实现自定义梯度反向传播

深度学习|反向传播算法（BP）原理推导及代码实现

反向传播 (BP) 算法公式推导与python (numpy) 实现

池化层（pooling）的反向传播是怎么实现的

Python实现一个简单的反向传播算法

神经网络之反向传播算法实现

tensorflow 2.0 学习（七）反向传播代码逐步实现

深度学习之反向传播算法（BP）代码实现

机器学习13：神经网络的反向传播实现

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

如何在ORACLE CLOUD中创建和访问容器集群丨内附官方文档链接

大数据从何而来?不得不知的7个数据源供应平台

mybatis抽取基类BaseMapper

[IJKPLAYER]初识

TREE KERNELS IN SVM-LIGHT---在svm-light中树核的使用（翻译）

UVa 11825 - Hackers' Crackdown DP, 枚举子集substa = (substa - 1)&sta 难度: 2

微信页面通过LocalID预览图片,getlocallmgdata

敏捷测试中的Web测试优秀实践

Spring MVC中日期转换的错误

【转】你真的了解延时队列吗

每日归档

更多

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)