83. 深度循环神经网络及代码实现

企业开发 2023-07-02 00:32:57 阅读次数: 0

1. 回顾：循环神经网络

在这里插入图片描述

2. 更深

在这里插入图片描述

再看公式：

在这里插入图片描述

3. 总结

深度循环神经网络使用多个隐藏层来获得更多的非线性性

4. 代码简洁实现

实现多层循环神经网络所需的许多逻辑细节在高级API中都是现成的。简单起见，我们仅示范使用此类内置函数的实现方式。以长短期记忆网络模型为例，该代码与之前在 sec_lstm中使用的代码非常相似，实际上唯一的区别是我们指定了层的数量，而不是使用单一层这个默认值。像往常一样，我们从加载数据集开始。

import torch
from torch import nn
from d2l import torch as d2l

batch_size, num_steps = 32, 35
train_iter, vocab = d2l.load_data_time_machine(batch_size, num_steps)

像选择超参数这类架构决策也跟 sec_lstm中的决策非常相似。因为我们有不同的词元，所以输入和输出都选择相同数量，即vocab_size。隐藏单元的数量仍然是 256 。唯一的区别是，我们现在(通过num_layers的值来设定隐藏层数)。

vocab_size, num_hiddens, num_layers = len(vocab), 256, 2
num_inputs = vocab_size
device = d2l.try_gpu()
lstm_layer = nn.LSTM(num_inputs, num_hiddens, num_layers)
model = d2l.RNNModel(lstm_layer, len(vocab))
model = model.to(device)

4.1 训练与预测

由于使用了长短期记忆网络模型来实例化两个层，因此训练速度被大大降低了。

num_epochs, lr = 500, 2
d2l.train_ch8(model, train_iter, vocab, lr*1.0, num_epochs, device)

运行结果：

在这里插入图片描述

5. Q&A

Q1:深层RNN，是不是每层都需要一个初始hidden state？

A1:是的，每一层都带了自己的初始状态，都带了weight。

猜你喜欢

转载自blog.csdn.net/weixin_47505105/article/details/128726634

83. 深度循环神经网络及代码实现

[C++ 系列] 83. unordered_map模拟实现

【leetcode】Python实现-83.删除排序链表中的重复元素

【LeetCode】83. 删除排序链表中的重复元素 python实现

83. 对缺省参数的理解?

83.【JQuery.Ajax】

【图解 + 注释详细】【打卡第1天】leetcode算法HOT热题之Java实现：83. 删除排序链表中的重复元素

83. Remove Duplicates from Sorted List

83.移除链表重复项

LintCode 83. 落单的数II

【LeetCode】83. Sum Root to Leaf Numbers

Lintcode 83. 落单的数 II

AcWing 83. 股票的最大利润

83. Remove Duplicates from Sorted List*

【Lintcode】83. Single Number II

【java】83. 删除排序链表中的重复元素---使用一个while循环解决问题，思路简单化，时间复杂度O(N)

leetcode 83. Remove Duplicates from Sorted List

【LeetCode】83.删除排序链表中的重复元素

leetcode 83. 删除排序链表中的重复元素

【leetcode】83. 删除排序链表中的重复元素

83. 删除排序链表中的重复元素

LertCode - 83. 删除排序链表中的重复元素

LeetCode【83. 删除排序链表中的重复元素】

[LeetCode] 83. Remove Duplicates from Sorted List

leetcode 83. Remove Duplicates from Sorted List （easy）

领扣——83.删除链表重复元素

【leetcode】83.（Easy）Remove Duplicates from Sorted Array

Leetcode:83. 82. Remove Duplicates from Sorted List

#Leetcode# 83. Remove Duplicates from Sorted List

LeetCode刷题_83. Remove Duplicates from Sorted List

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)