one-hot向量形式

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/randompeople/article/details/83244766

one-hot向量

这个向量的表示为一项属性的特征向量,也就是同一时间只有一个激活点(不为0),这个向量只有一个特征是不为0的,其他都是0。特别稀疏,这个稀疏矩阵用来组成一个多特征的训练集样本,相当于样本是一个二维矩阵,行代表特征数,列表示为特征数的one-hot向量。

表示

one-hot向量表示为 t i = { 0 , 0 , 0 , . . . , 1 , . . . 0 } t_i=\{0,0,0,...,1,...0\} ,长度特征数目,具体的场景特征数目不一样。

实际场景

我们在自然语言领域,可以将文本分词,分词后的所有单词作为一个总体的特征数目,进行one-hot编码,其中每一个单词就是一个one-hot向量,然后文本中每个句子也同样分词,分词后将这些单词作为一个句子的表示方式,这样一个句子就是一个二维向量,向量的行数是这个句子包含的单词总数,如此还可以用one-hot向量组成表示为文章。

参考博客

数据处理之one-hot
RNN模型

猜你喜欢

转载自blog.csdn.net/randompeople/article/details/83244766