基于Schema增强的中文实体关系抽取方法

摘要

针对中文实体关系抽取任务中的实体边界切分错误和实体关系重叠,以及不同数据集的关系种类不能很好地迁移的问题,提出一种基于Schema增强的实体关系抽取方法。首先,采用字词混合嵌入的方式融合字与词的语义信息,避免中文分词时边界切分出错所造成的歧义问题;其次,利用指针标注的方式解决关系重叠问题;最后,提取出每个数据集的Schema进行合并作为先验特征传入模型中,以解决实体冗余及关系种类迁移问题。在三大中文实体关系抽取数据集DuIE、FinRE、SanWen上进行实验,相较于先前的模型,该方法分别取得10%、18%、11%的F1提升,且表现出更高的稳定性。

0 引言

实体关系抽取是知识图谱构建、智能问答、信息检索等下游任务的核心技术之一,旨在从非结构化文本中抽取出结构化信息,即抽取出实体及其间关系,并以三元组的形式<头实体,关系,尾实体>展现,例如

猜你喜欢

转载自blog.csdn.net/weixin_70923796/article/details/131227588