【论文写作分析】之三《基于预训练语言模型的案件要素识别方法》

[1] 参考论文信息

  论文名称:《基于预训练语言模型的案件要素识别方法》

  发布期刊:《中文信息学报》

  期刊信息:CSCD
在这里插入图片描述
  论文写作分析摘要:本文非常典型。首先网络模型是直接用的一篇英论的;亮点仍然在于应用领域的新颖,即案件;其次本文的题目起得不错,要素识别(而不是多标签文本分类);论文的实验部分个人觉得写的非常好,三组对比实验,看起来很充实。

【注】:看完这篇论文,感觉我和论文之间就差一个新颖的领域(数据集)。

[2] 参考论文分解

  这篇论文前大部分都比较普通吧。下面是模型图:
在这里插入图片描述
  模型几乎是直接使用的《SGM: Sequence Generation Model for Multi-Label Classification》中的模型。

  比较好的是,论文开头,对新领域“案件”的要素识别介绍的挺好的。

【注】:论文 SGM: Sequence Generation Model for Multi-Label Classification 讲解博客地址

  实验部分,论文做了3组实验:

  1、论文模型与其他baseline的实验对比。
  2、生成式模型与阈值式模型的实验对比。
  3、Layer-attentive策略的作用 。

  我觉得最好的是论文对阈值式模型使用方法的介绍:

在这里插入图片描述
  提出类别阈值选择方法。而我之前一直是设一个阈值 a l p h a alpha alpha,模型的输出经过sigmoid之后,只要大于 a l p h a alpha alpha,就算文本有这个标签,这样肯定不对,但是一直没看到好的方法。

猜你喜欢

转载自blog.csdn.net/qq_43592352/article/details/123643020
今日推荐