tensorflow中tf.dynamic_rnn使用技巧 - 代码天地

tensorflow中tf.dynamic_rnn使用技巧

其他 2018-05-23 20:27:26 阅读次数: 3

转载：http://blog.csdn.net/lyg5623/article/details/73924506

用rnn处理变长文本时，使用dynamic_rnn可以跳过padding部分的计算，减少计算量。假设有两个文本，一个长度为10，另一个长度为5，那么需要对第二文本使用0-padding方法填充，得到的shape为(2, 10, dim)，其中dim是词向量维度。使用dynamic_rnn的代码如下：

outputs, last_states = tf.nn.dynamic_rnn( cell=cell, dtype=tf.float32, sequence_length=x_lengths, inputs=x)

其中cell是RNN节点，比如tf.contrib.rnn.BasicLSTMCel，x是0-padding以后的数据，x_lengths是每个文本的长度。计算第二个文本的时候，只计算前面5个值，后面的就直接跳过了，对应的output直接设为0，cell的状态保持第5步的值。

dynamic_rnn返回两个变量，第一个是每个step的输出值，第二个是最终的状态。那么问题来了，对于第二个文本，我想取的肯定是第5个output，最后一个output是无效的0对我来说没有意义。目前我知道的有3种做法。

第一种是从别人代码里面看到，链接在此。作者自己写了个index的operation，代码比较绕。

第二种是构建一个mask，长度对应的那位为1，其余的为0，比如第二个文本对应的mask为[0, 0, 0, 0, 1, 0, 0, 0, 0, 0]，然后将这个mask与outputs按时间维度进行sum，这样得到的刚好是第5个输出的值。

第三种做法最简单，这得从rnn的定义说起，rnn的输出其实就是状态中的h，因此last_states 中的h状态就是我们需要的output。也就是我们把last_states.h当作rnn的最终输出就行了。

猜你喜欢

转载自blog.csdn.net/qq_34638161/article/details/79078390

tensorflow中tf.dynamic_rnn使用技巧

tensorflow之tf.dynamic_rnn()的理解

tensorflow高阶教程:tf.dynamic_rnn

tensorflow中tf.dynamic_rnn使用，outputs和state理解

tf.dynamic_rnn

TensorFlow - tf.dynamic_rnn设置sequence_length

tensorflow中的tf.nn.bidirectional_dynamic_rnn

tensorflow中的tf.nn.dynamic_rnn详解

tensorflow笔记 tf.nn.dynamic_rnn 和 bidirectional_dynamic_rnn

tensorflow实现rnn之tf.nn.dynamic_rnn参数shape介绍

使用 tf.nn.dynamic_rnn 展开时间维度

tf.nn.dynamic_rnn

Tensorflow中tf.layers.dense()在RNN网络搭建中的使用

tensorflow学习之bidirectional_dynamic_rnn使用详解

tensorflow学习之dynamic_rnn使用详解

Tensorflow踩坑之tf.nn.bidirectional_dynamic_rnn（）报错 “ValueError: None values not supported.”

【TensorFlow】理解tf.nn.dynamic_rnn方法（附详细代码）

TensorFlow笔记：dynamic_rnn

tensorflow之dynamic_rnn

tensorflow 的dynamic_rnn方法

tensorflow dynamic rnn源码分析

深度学习总结：tensorflow和pytorch关于RNN的对比,tf.nn.dynamic_rnn,nn.LSTM

tf.nn.dynamic_rnn的详解

tf.nn.dynamic_rnn（推荐阅读）

关于tensorflow: stack_bidirectional_dynamic_rnn、bidirecitonal_dynamic_rnn函数中sequence_length的理解

tf中的RNN

tf.nn.bidirectional_dynamic_rnn 使用方法及其验证：

TensorFlow 中 RNN&LSTM 的使用

【转载】【TensorFlow】static_rnn 和dynamic_rnn的区别

【tensorflow】static_rnn与dynamic_rnn的区别

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)