【NLP】_02_NLP经典任务 - 代码天地

【NLP】_02_NLP经典任务

其他 2020-02-17 18:00:00 阅读次数: 0

文章目录

【一】NER（命名实体识别）
【二】Relation Extraction（关系提取）

【一】NER（命名实体识别）

ORG（组织），LOC（地点），PER（人物）
常用方法（原文链接：https://blog.csdn.net/weixin_37665090/article/details/89454829）

LSTM 的优点是能够通过双向的设置学习到观测序列（输入的单词）之间的依赖，在训练过程中，LSTM 能够根据目标（比如识别实体）自动提取观测序列的特征，但是缺点是无法学习到状态序列（输出的标注）之间的关系，要知道，在命名实体识别任务中，标注之间是有一定的关系的，比如 B类标注（表示某实体的开头）后面不会再接一个 B类标注，所以 LSTM 在解决 NER 这类序列标注任务时，虽然可以省去很繁杂的特征工程，但是也存在无法学习到标注上下文的缺点。
当用 Bi-LSTM 来做命名实体识别时，Bi-LSTM 的输出为实体标签的分数，且选择最高分数对应的标签。然而某些时候，Bi-LSTM 却不能得到真正正确的实体标签，这时候就需要加入 CRF 层。
CRF 由Lafferty 等人于2001 年提出，结合了 最大熵模型 和 隐马尔科夫模型 的特点，能对隐含状态建模，学习状态序列的特点，但它的缺点是需要手动提取序列特征。
所以一般的做法是，在 LSTM 后面再加一层CRF，以获得两者的优点。

【二】Relation Extraction（关系提取）

【2.1】 Bootstrap：由规则生成记录，再生成规则，以此类推直到收敛

【2.2】 Snowball：在 Bootstrap 的基础上，每个循环都增加了 评估过滤规则，和 评估过滤记录 的操作

重新定义规则，使用 <五元组>
五元组 构建向量后，通过聚类将规则减少

发布了37 篇原创文章 · 获赞 5 · 访问量 1911

私信关注

猜你喜欢

转载自blog.csdn.net/qq_34330456/article/details/104354693

【NLP】_02_NLP经典任务

NLP任务

NLP的经典书

【NLP-02】NNLM

NLP 02 RNN

NLP

【NLP】

NLP相关任务

NLP分词任务

NLP常见任务

NLP任务总结

NLP的几种任务

NLP 相关任务

nlp中的经典模型(三)

02-NLP-04-03

02-NLP-04-04

代码记录（中文NLP任务）

NLP基本任务

NLP中各任务介绍

NLP 中任务及相关概念

NLP任务数据集汇总

NLP任务之情感分类

NLP任务之情感分类

nlp 基本任务

NLP学习笔记02---NLP概述(NLP领域的关键技术和应用场景)

nlp中的经典深度学习模型(一)

nlp中的经典深度学习模型(二)

02-NLP-gensim中文处理案例

02-NLP-01-jieba中文处理

NLP学习笔记 02 句法和文法

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)