Word2vec是Google于2013年推出的获取词向量的开源工具包,包括一组用于word embedding的模型。
Word2vec的模型通常使用浅层(两层)神经网络训练词向量得到,以大规模语料库作为输入,然后生成一个向量空间(通常为几百维)。词典中的每个词都对应了向量空间中的一个唯一向量,且语料库中拥有共同上下文的词映射到向量空间中的距离会更近。
博客:Word2Vec-知其然知其所以然