sklearn.cluster.KMeans中的参数介绍

 KMeans(n_clusters=8, init='k-means++', n_init=10, max_iter=300, tol=0.0001,   
         precompute_distances='auto', verbose=0, random_state=None,  
         copy_x=True, n_jobs=None, algorithm='auto')

1.n_clusters:分类簇的数量。

2.init:接收待定的string。kmeans++表示该初始化策略选择的初始均值向量之间都距离比较远,它的效果较好;random表示从数据中随机选择K个样本最为初始均值向量;或者提供一个数组,数组的形状为(n_cluster,n_features),该数组作为初始均值向量。

3.n_init:用不同的聚类中心初始化值运行算法的次数,最终解是在inertia意义下选出的最优结果;默认值为10。

4.max_iter:最大的迭代次数。

5.tol:表示算法收敛的阈值。

6.precompute_distance:接收Boolean或者auto。表示是否提前计算好样本之间的距离,auto表示如果nsamples*n>12 million,则不提前计算。

7.verbose:0表示不输出日志信息;1表示每隔一段时间打印一次日志信息。如果大于1,打印次数频繁。

8.random_state:表示随机数生成器的种子。

9.n_jobs:表示任务使用CPU数量;若值为 -1,则用所有的CPU进行运算。

猜你喜欢

转载自blog.csdn.net/hu_666666/article/details/128062523
今日推荐