DFGN-Dynamically Fused Graph Network for Multi-hop Reasoning 论文阅读

移动开发 2023-07-22 19:34:49 阅读次数: 0

文章目录

介绍
相关工作
- text-based QA
- 多跳QA推理
模型

介绍

将 DFGN 模型用于HotpotQA （TBQA类型的公开数据集）

QA任务注重从单一的篇章中找到证据和答案，但是有一些不需要推理，只要抽取就可以了。针对这个问题，有了一些需要多跳理解任务的数据集，如 WikiHop, Complex Web Question, HotpotQA

多跳理解任务面临的两大挑战：

需要从多个篇章中过滤噪声，抽取出有用的信息。
- 有文章提出从输入的篇章中建立实体图，通过实体图，用GNN来聚合信息
- 问题：静态的全局实体图，是隐式的推理
- 本文：根据query去构建动态的局部实体图，进行显式的推理
问题的答案可能并不存在于抽取得到的实体图的实体中
- 本文：两个方向的信息集成
  - doc2graph：把文档信息集成到实体图中
  - graph2doc：把实体图的信息集成回文档表示

本文的贡献：

提出 DFGN，解决基于文本（text-based）的多跳问答问题
提出了一种方法来解释与评估 reasoning chains，解释 DFGN 预测的 entity graph masks
在HotpotQA数据集上实验，验证了模型的有效性

相关工作

text-based QA

给予支持信息是否是结构化的，QA任务可以分为两类：

基于知识的，knowledge-based QA (KBQA)
基于文本的，text-based QA (TBQA)

基于推理的复杂度，可以分为两类：

单跳：SQuAD
多跳：HotpotQA

信息检索式（IR）的方法可以用于单跳QA，却很难用于多跳QA

多跳QA推理

GNN、GAN、GRN（Graph Recurrent Network）已经证明了QA任务中需要推理
Coref-GRN 利用 GRN

模型

请添加图片描述

模型由五个部分组成：
- a paragraph selection subnetwork，段落选择器
- a module for entity graph construction，entity graph生成器
- an encoding layer 编码模块
- a fusion block for multi-hop reasoning 多跳预测所用的 Fusion Block
- a final prediction layer 最后的预测层

段落选择器

hotpotQA 数据集中有 10 个段落

训练一个子网络来选择相关的段落，基于BERT模型做分类

输入一个query 和一个段落，输出一个 0-1 的相关度打分
对每个 Q&A 对来说，给有至少一个支持句子的段落赋值为1
在推理阶段，选择预测分值大于 $\eta$ 的段落，并且拼接为上下文 $C$

构建实体图

用 Stanford corenlp toolkit 去识别命名实体 $C$ ，抽取得到 $N$ 个实体
实体图，以实体为点，边的添加规则如下：
- 一对实体出现在 $C$ 中的同一个句子中（sentence- level links）
- 一对实体出现在 $C$ 中（context-level links）
- 一个中心实体与另外的实体在同一个段落中（paragraph-level links）
在QA数据集中，title就是实体

编码 Query 和 Context

把 $Q$ 和 $C$ 拼接，从BERT模型得到表示
- $Q=[q_1,\ldots,q_L]\in R^{L\times d_1}$
- $C^T=[c_1,\ldots,c_M]\in R^{M\times d_1}$
- $d_1$ 是 BERT 的隐藏层大小
- 实验发现：拼接后传入 BERT 比分别传入 BERT 效果要好
- 把表示通过 bi-attention 层，的到 query 和 context 之间的表示，效果比只用 BERT 编码效果要好

Fusion Block 推理

请添加图片描述

Doc2Graph

计算命名实体的嵌入
01矩阵 $M$ 表示一个实体的 text span（文本范围）
- $M_{i,j}=1$ 表示第 $i$ 个token 是第 $j$ 个实体的一部分
Tok2Ent
- token embedding传到一个 mean-max 池化层，计算得到 entity embedding

Dynamic Graph Attention

利用 GAT的方式计算两个实体间的注意力评分

Update Query

最近访问的 entity 会成为下一步的 start entity
利用 bi-attention network 去更新 query embeddings
$\mathbf{Q}^{(t)}=$ Bi-Attention $\left(\mathbf{Q}^{(t-1)}, \mathbf{E}^{(t)}\right)$

Graph2Doc

把实体信息复原回context中的token
用同一个 01 矩阵 $M$
- $M$ 中每一行表示一个token
- 用它从 $E_t$ 中选择一个实体嵌入 -> $M E$
用 LSTM 去生成下一层的 context 表示
- $\mathbf{C}^{(t)}=\operatorname{LSTM}\left(\left[\mathbf{C}^{(t-1)}, \mathbf{M} \mathbf{E}^{(t) \top}\right]\right)$

预测

与 hotpotQA 的结构相同
四个输出：
1. 支持句子
2. 回答的开始位置
3. 回答的结束位置
4. 回答的类型
用一个级联网络解决输出的依赖性
- 四个 LSTM $\mathcal{F}_i$ 一层层堆叠
- 最后一个 fusion bloack 的上下文表示输入到第一个LSTM中
- $\begin{aligned} \mathbf{O}_{\text {sup }} &=\mathcal{F}_0\left(\mathbf{C}^{(t)}\right) \\ \mathbf{O}_{\text {start }} &=\mathcal{F}_1\left(\left[\mathbf{C}^{(t)}, \mathbf{O}_{\text {sup }}\right]\right) \\ \mathbf{O}_{\text {end }} &=\mathcal{F}_2\left(\left[\mathbf{C}^{(t)}, \mathbf{O}_{\text {sup }}, \mathbf{O}_{\text {start }}\right]\right) \\ \mathbf{O}_{\text {type }} &=\mathcal{F}_3\left(\left[\mathbf{C}^{(t)}, \mathbf{O}_{\text {sup }}, \mathbf{O}_{\text {end }}\right]\right) \end{aligned}$
- 每一个输出的 logit $\mathbf{O}$ 计算交叉熵损失
- 把四个 loss 拼接起来，引入不同权重： $\mathcal{L}=\mathcal{L}_{\text {start }}+\mathcal{L}_{\text {end }}+\lambda_s \mathcal{L}_{\text {sup }}+\lambda_t \mathcal{L}_{\text {type }}$

猜你喜欢

转载自blog.csdn.net/iteapoy/article/details/128310109

DFGN-Dynamically Fused Graph Network for Multi-hop Reasoning 论文阅读

《论文阅读》Empathetic Response Generation through Graph-based Multi-hop Reasoning on Emotional Causality

Cognitive Graph for Multi-Hop Reading Comprehension at Scale(ACL2019) 阅读笔记与源码解析

Cognitive Graph for Multi-Hop Reading Comprehension at Scale

Question Directed Graph Attention Network for Numerical Reasoning over Text

论文阅读 - Graph-ToolFormer: To Empower LLMs with Graph Reasoning Ability via Prompt Augmented by ChatGP

【论文简述】Learning Optical Flow with Adaptive Graph Reasoning（AAAI 2022）

论文阅读 - Decoupling Graph Neural Network with ContrastiveLearning for Fraud Detection

【论文阅读】Multi-Modal Sarcasm Detection via Cross-Modal Graph Convolutional Network 嘲讽检测，多模态，跨模态，图神经网络

Out of the Box: Reasoning with Graph ConvolutionNets for Factual Visual Question Answering论文解读

Heterogeneous Graph Attention Network阅读笔记

GNN graph neural network 最早的论文

论文阅读之《GAPNet: Graph Attention-based Point Neural Network for Exploiting Local Feature of Point Cloud

【论文阅读】Vertically Federated Graph Neural Network for Privacy-Preserving Node Classification

论文阅读TLPGNN: A Lightweight Two-Level Parallelism Paradigm for Graph Neural Network Computation on GPU

【论文阅读】ConGNN:Context-consistent cross-graph neural network for group emotion recognition in the wild

DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning

笔记：《Reinforcement Knowledge Graph Reasoning for Explainable Recommendation》

A simple neural network module for relational reasoning

论文阅读 Pointer Network

Text Level Graph Neural Network for Text Classification阅读笔记

KGAT：Knowledge Graph Attention Network for Recommendation论文地址

AMiner推荐论文：Interpretable and Efficient Heterogeneous Graph Convolutional Network

论文精读:SimGNN: A Neural Network Approachto Fast Graph Similarity Computation

【论文下饭】Temporal Graph Network for Deep Learning on Dynamic Graphs

[论文笔记]Dual Graph Convolutional Network for Semantic Segmentation

论文阅读笔记—Reasoning on Knowledge Graphs with Debate Dynamics（AAAI，2020）

论文阅读：chain of thought Prompting elicits reasoning in large language models

论文阅读《2020ICML：Inductive Relation Prediction by Subgraph Reasoning》

Graph Attention Networks——《论文阅读》

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)