Biaffine使用基于图的方法解析依存句法,对句中每次词找到head以及其到head的依存标签,因此针对图的依存句法解析需解决两个问题:
不定类别分类,哪两个节点连接弧?
固定类别分类,弧的标签是什么?
本文使用 双仿射分类器 分别预测依存关系(arc)和依存标签(label),在英语PTB数据集中0.957 UAS, 0.941 UAS,使之成为graph-based依存句法解析的基准模型,文中也介绍模型一些超参数对模型效果的影响。
Biaffine模型的以下特点:
使用双仿射注意力机制,而不是使用传统基于MLP注意力机制的单仿射分类器,或双线性分类器;
第一次尝试使用MLP对LSTM的输出进行降维,再输入至仿射层;
论文:https://arxiv.org/pdf/1611.01734.pdf
论文模型结构:
中文解释:
- https://www.hankcs.com/nlp/parsing/deep-biaffine-attention-for-neural-dependency-parsing.html
- https://blog.csdn.net/sinat_34072381/article/details/106864586
源码: