深度学习(九)

循环神经网络

one-hot向量

指明了在词典中的位置,当前位置为1,其余位置全为0

结构

1、不仅使用当前输入,还使用原来的输入
这里写图片描述
2、多对一的结构:不再是每个时间步都有输出,而是最后一个时间步有输出
除此之外,还有一对多,多对多结构(输入输出长度不一致)
这里写图片描述
3、GRU:
解决了深度网络的依赖性,即长时间记住某个值,其公式如下:
c < t > = Γ u c ^ < t > + ( 1 Γ u ) c < t 1 >
这里写图片描述

LSTM

1、定义:
这里写图片描述这里写图片描述

双向RNN

不仅可以利用过去的信息,而且可以利用未来的信息,示意图如下:
这里写图片描述
缺点:需要语言的完整表达才能进行预测

深层RNN

这里写图片描述

猜你喜欢

转载自blog.csdn.net/yeyustudy/article/details/81455667