sklearn入门篇--了解digits及iris数据集

from sklearn import datasets#加载数据集
iris = datasets.load_iris()#植物分类的数据
digits = datasets.load_digits()#数字识别的数据

.data.target对应获得x和y值

digits.data#元数据集
digits.target#标签,每个数字的真实类别
digits.images[0]
#数据总是二维数组,形状(n_samples,n_features)

采用支持向量机分类器

from sklearn import svm
#在数字数据集的情况下,任务是给出图像来预测其表示的数字,共有10个可能类,在这些类上拟合一个估计其
#在sklearn中,分类的估计器是一个pyton对象,实现了fit(X,y),predict(T)方法
clf = svm.SVC(gamma=0.001,C=100.)#估计器实例命名为clf

#使用除了最后一张意外的所有图像,用[:-1]语法选择这个训练集
clf.fit(digits.data[:-1],digits.target[:-1])
clf.predict(digits.data[-1:])
# 模型持久化:可以通过python的内置持久化模块(pickle)将模型保存
X,y = iris.data,iris.target
clf.fit(X,y)
import pickle
s = pickle.dumps(clf)
clf2 = pickle.loads(s)
clf2.predict(X[0:1])

猜你喜欢

转载自blog.csdn.net/weixin_36926779/article/details/80171303