NLP模型笔记2022-17:实体识别、实体对齐、实体消歧、属性对齐【论文+源码】


在这里插入图片描述

一、实体识别

  1. 实体
    先说什么实体吧。在NLP中通常所说的实体指的是人名、地名、机构名,在新闻领域,我们希望了解突发事件的主体,比如人物、地点、机构等等。如果扩展的话,就是你所关心的词语,比如在商品标题中,我们会关心品牌词、物品词、物品属性词,通过这些词+情感极性词,可以更详细地了解顾客的购物意愿。

  2. 实体识别
    再说怎么让机器识别这些实体吧。从识别步骤来看分为两步,第一步识别出实体词边界,也就是实体的开始位置和结束位置;第二步识别出实体的类型,也就是前边所说的人名、地名、机构名等等具体的实体类型。从识别方法来看有两类,第一类基于正则规则,也就是实体词的构词规律和高频上下文词。比如手机的属性词有:“数字+GB”描述存储能力,“数字+寸”描述屏幕大小,“数字+万+像素”描述拍摄效果等等。这一类词完全可以通过正则表达式来匹配。当然,缺陷也很明显,比如相同规则匹配的属性词所描述的具体内容不同,比如“数字+GB”既可以描述内存,也可以描述

猜你喜欢

转载自blog.csdn.net/weixin_41194129/article/details/125282870