机器学习基础之《分类算法(1)—sklearn转换器和估计器》

一、转换器

1、什么是转换器
之前做特征工程的步骤:
(1)第一步就是实例化了一个转换器类(Transformer)
(2)第二步就是调用fit_transform,进行数据的转换

2、我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式
fit_transform()
fit()
transform()

3、例子
我们以标准化为例:(x - mean) / std
要进行转化的特征x减去这一列的平均值mean再除以标准差
第一步会执行fit(),计算每一列的平均值、标准差
第二步会执行transform(),用第一步计算出的结果,带入公式,进行最终的转换

二、估计器

1、什么是估计器
在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API
所有的机器学习算法都被封装到估计器当中

2、用于分类的估计器
(1)sklearn.neighbors:k-邻近算法
(2)sklearn.naive_bayes:朴素贝叶斯
(3)sklearn.linear_model.LogisticRegression:逻辑回归
(4)sklearn.tree:决策树与随机森林

3、用于回归的估计器
(1)sklearn.linear_model.LinearRegression:线性回归
(2)sklearn.linear_model.Ridge:岭回归

4、用于无监督学习的估计器
(1)sklearn.cluster.KMeans:聚类

三、估计器工作流程

1、实例化一个estimator

2、调用estimator.fit(x_train, y_train)  计算
在fit方法中,将训练集的特征值和目标值传进来
调用完毕,意味着模型生成

3、模型评估
(1)直接比对真实值和预测值
说明:x_test测试集、y_predict预测的结果、y_test测试集中的目标值
y_predict = estimator.predict(x_test)
比对  y_test == y_predict

(2)计算准确率
说明:accuracy准确率
accuracy = estimator.score(x_test, y_test)

猜你喜欢

转载自blog.csdn.net/csj50/article/details/132302678