【机器学习】特征工程 - 文本特征提取CountVectorizer

「作者主页」:士别三日wyx
「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者
「推荐专栏」:对网络安全感兴趣的小伙伴可以关注专栏《网络安全入门到精通》

「文本」进行特征提取时,一般会用「单词」作为特征,即特征词。

CountVectorizer会计算特征词出现的「次数」,帮我们发现哪个词是最「重要」的。

一、特征提取API

sklearn.feature_extraction 是用来提取特征的API。

sklearn.feature_ex

猜你喜欢

转载自blog.csdn.net/wangyuxiang946/article/details/131359606