数据处理|NLP数据增强方法整理(持续更新)

1.应用背景

数据增强方法常用于增加深度模型训练所需的数据数量,从而提高模型的准确率。在自然语言处理中的数据增强方法,一般通过对输入句子进行重构,从而生成一个新的具有相似语义但结构不同的句子,这种方法除了能够增加模型训练数据以外,还能够生成相似度计算模型所需的训练数据。

2.方法整理

名称 描述 link
句子反转 对于每一个给定的句子,通过对句子翻转来进行数据增强 -
随机丢弃 对于每一个给定的句子,随机的丢弃该句子中的若干字符 点击
反向翻译 对于每一个给定的句子,通过将原始句子从中文翻译成另外一种语言然后再翻译回中文来对该样本进行数据增强 点击

猜你喜欢

转载自blog.csdn.net/qq_28385535/article/details/106418635
今日推荐