自然语言处理从入门到应用——词向量的评价方法

分类目录：《自然语言处理从入门到应用》总目录

对于不同的学习方法得到的词向量，通常可以根据其对词义相关性或者类比推理性的表达能力进行评价，这种方式属于内部任务评价方法（Intrinsic Evaluation）。在实际任务中，则需要根据下游任务的性能指标判断，也称为外部任务评价方法（Extrinsic Evaluation）。本文首先介绍两种常用的内部任务评价方法，然后以情感分类任务为例，介绍如何将预训练词向量应用于下游任务。

词义相关性

对词义相关性的度量是词向量的重要性质之一。可以根据词向量对词义相关性的表达能力衡量词向量的好坏。利用词向量低维、稠密、连续的特性，可以方便地度量任意两个词之间的相关性。例如，给定词 $w_a$ 与 $w_b$ ，它们在词向量空间内的余弦相似度就可以作为其词义相关性的度量：
$\text{sim}(w_a, w_b)=\cos(v_{w_a}, v_{w_b})=\frac{v_{w_a}\times v_{w_b}}{||v_{w_a}||\times ||v_{w_b}||}$

基于该相关性度量，即可实现K近邻（K-Nearest Neighbors，KNN）查询。

类比性

词的类比性（Word Analogy）是对于词向量的另一种常用的内部任务评价方法。对词向量在向量空间内的分布进行分析可以发现，对于语法或者语义关系相同的两个词对 $w_a, w_b]$ 与 $w_c, w_d]$ ，它们的词向量在一定程度上满足： $v_{w_a} - v_{w_b}\approx v_{w_c} - v_{w_d}$ 的几何性质。例如，在下图的示例中有以下类比关系：
$\begin{aligned} v_{\text{women}} - v_{\text{men}}& \approx v_{\text{queen}} - v_{\text{king}}\\ v_{\text{queens}} - v_{\text{queen}}&\approx v_{\text{kings}} - v_{\text{king}} \end{aligned}$
词的类比性
这两个例子分别从词义和词法两个角度展示了词向量的类比性。根据这一性质，可以进行词与词之间的关系推理，从而回答诸如“ $w_a$ 之于 $w_b$ ，相当于 $w_c$ 之于什么”的问题。对于下画线处的词，可以利用下式在词向量空间内进行搜索得到：
$w_d=\arg\min_w(\cos(v_w, v_{w_c} + v_{w_b} - v_{w_a}))$

一般来说，词向量在以上评价方法中的表现与训练数据的来源及规模、词向量的维度等因素密切相关。在实际应用中，需要根据词向量在具体任务中的表现来选择。

参考文献：
[1] 车万翔, 崔一鸣, 郭江. 自然语言处理：基于预训练模型的方法[M]. 电子工业出版社, 2021.
[2] 邵浩, 刘一烽. 预训练语言模型[M]. 电子工业出版社, 2021.
[3] 何晗. 自然语言处理入门[M]. 人民邮电出版社, 2019
[4] Sudharsan Ravichandiran. BERT基础教程：Transformer大模型实战[M]. 人民邮电出版社, 2023
[5] 吴茂贵, 王红星. 深入浅出Embedding：原理解析与应用实战[M]. 机械工业出版社, 2021.

自然语言处理从入门到应用——词向量的评价方法

词义相关性

类比性

猜你喜欢