机器学习入门框架scikit-learn

  有过编程经验的朋友都知道,想要学习一门技术最简单、最有效、最快速的方法就是programming。在机器学习领域,家喻户晓的,从零开始的学习框架可能非scikit-learn莫属了,本博客将通过一些列的文章来记录我学习实践scikit-learn的整个过程。ps:由于个人工作暂时并不涉及机器学习,而我本人也是刚刚开始不久,因此进度不会太快,有兴趣的同学可以一起学习实践,也欢迎大家交流。
  scikit-learn同其他许多开源软件一样,由开源社区成员自由维护,由于维护成本限制,相比其他机器学习框架,scikit-learn的策略相对比较保守。一是Scikit-learn从来不做除机器学习领域之外的其他扩展,二是Scikit-learn从来不采用未经广泛验证的算法。

Scikit-learn六大功能:

分类,回归,聚类,数据降维,模型选择和数据预处理

分类:

  scikit-learn分类算法主要包括:支持向量机(SVM),最近邻,逻辑回归,随机森林,决策树以及多层感知器(MLP)神经网络等等。

回归:

  scikit-learn回归算法主要包括:支持向量回归(SVR),脊回归,Lasso回归,弹性网络(Elastic Net),最小角回归(LARS ),贝叶斯回归。

聚类:

  scikit-learn聚类算法主要包括:K-均值聚类,谱聚类,均值偏移,分层聚类,DBSCAN聚类等。

数据降维:

  scikit-learn数据降维主要是通过主成分分析(PCA)、非负矩阵分解(NMF)或特征选择等降维技术来减少要考虑的随机变量的个数。

模型选择:

  模型选择是指对于给定参数和模型的比较、验证和选择,其主要目的是通过参数调整来提升精度。目前Scikit-learn实现的模块包括:格点搜索,交叉验证和各种针对预测误差评估的度量函数。

数据预处理:

  数据预处理是指数据的特征提取和归一化,是机器学习过程中的第一个也是最重要的一个环节。

  scikit-learn是入门利器,同时也是真正的利器,广泛应用于数据挖掘等领域,关于其功能的选择和使用,scikit-learn官方提供了如下参考:
这里写图片描述

欢迎大家关注微信公众号“翰墨知道”获取最新更新。
这里写图片描述

猜你喜欢

转载自blog.csdn.net/zombee0/article/details/79167094