attention机制 - 代码天地

attention机制

其他 2018-05-21 13:51:43 阅读次数: 2

一、结构

由于输入与输出长度很多时候是不等长的，先回顾一下Seq2Seq的结构

这种结构在负担集中在c身上，在句子较长时比较不好。例如在机器翻译中，考虑到每个输出的词，都跟所有输入的词有关，但有的关系大，有的关系小，于是有下面的结构：

合起来的总结构就是：

二、为什么不直接对输入x使用attention机制？

注意到，上文求c的过程，描述并不完全准确。实际上h2、h3、h4包含的并不只有对应词的信息，也包含的有前面词的信息，因为它们是RNN的隐藏状态。所以，Attention机制其实是用在了h隐藏状态上，那为什么不直接应用在输入x上呢？

如果直接应用在输入的x上，那输入句子的RNN结构就没有了，那么输入句子的词序关系就学不到了。注意到Attention机制只是加权求和，并不包括各个变量的顺序关系。

虽然在输出阶段，依然使用了RNN结构，但是输出句子的词序关系，与输入句子的词序关系是不同的，例如中文翻译成英文，语法语序是不同的。所以Attention机制和RNN结构结合起来

猜你喜欢

转载自www.cnblogs.com/mimandehuanxue/p/9066717.html

attention机制

attention 机制

Attention机制（Bahdanau attention & Luong Attention）

attention

Attention机制学习（一）传统Attention机制

推荐系统与Attention机制——详解Attention机制

attention机制详解

RNN 的attention机制

Attention机制学习笔记

attention 机制入门

浅谈attention机制

Attention机制的文章总结

Attention 机制笔记

【机器学习】attention机制

浅谈 Attention 机制的理解

attention机制总结2

attention机制总结一

理解Attention机制

浅谈Attention机制的作用

Attention机制--concat方式

《Attention is all you need》--attention机制

Attention机制论文阅读——global attention和local attention

Attention的两种机制——global attention/local attention

深度学习中的Attention机制

理解Attention机制原理及模型

深度学习attention 机制了解

Attention机制学习（二）使用

pytorch笔记：09)Attention机制

机器视觉Attention机制的研究

初识Attention机制(NLP领域)

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)