提升事实核查效率:文档级声明提取与去上下文化(Document-level Claim Extraction and Decontextualisation for Fact-Checking)

1. 概述

        人工事实核查人员通常在一天开始时选择一条声明,作为当天需要核查的工作。声明提取(CE)是他们工作中重要的一部分,因为大量流通的声明使得选择要核查的内容极大地影响着核查人员的影响力。为了帮助他们选择值得核查的声明(即公众有兴趣了解其真实性的声明),已经提出了一些自动化方法。

        现有的声明提取方法主要关注于检测单个句子是否包含声明或确定声明的具体边界。然而,在实际场景中,声明往往需要从包含多个句子的文档中提取,而这些文档中并非所有声明都与文档的中心思想相关。对所有声明进行手动或自动化核查都是低效的。

        从句子级声明提取扩展到文档级声明提取具有挑战性。例如,现有的方法(如Claimbuster)虽然可以识别出原则上值得核查的句子,但这些句子不一定与文档的中心思想相关,可能会导致冗余和重复核查。

        为了应对这些问题,我们提出了一种新颖的文档级声明提取与去上下文化的方法,旨在从文档中提取能够脱离上下文而被理解的核心声明。具体而言,我们的方法包括以下步骤:将文档级声明提取任务重新定义为抽取式摘要任务,以识别和提取核心句子;然后对这些核心句子进行去上下文化,使其在脱离原文上下文时依然可以理解;最后,引入基于问答的框架,以解决提取句子中的模糊信息单元&#x

猜你喜欢

转载自blog.csdn.net/qq_52053775/article/details/143026571