版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/woshiliulei0/article/details/86597720
1.算法背景
1.1论文
Yoon Kim在论文(2014 EMNLP) Convolutional Neural Networks for Sentence Classification提出TextCNN。
将卷积神经网络CNN应用到文本分类任务,利用多个不同size的kernel来提取句子中的关键信息(类似于多窗口大小的ngram),从而能够更好地捕捉局部相关性。
2.算法过程
TextCNN主要过程分为四部,也可以说是四个层。
- Embedding(文本向量化):将文本中的每个词语转换成相同维度的词向量。
- Convolution(卷积层):通过不同卷积核的大小kernel_size = (1,2,3,4,5)做卷积运算。
- MaxPooling(池化层):
- FullConnection and Softmax(全连接层):全连接的 softmax 层,输出每个类别的概率。