层次聚类参数解释

sklearn里层次聚类的参数及解释:

  • n_clusters: 事先定义多少簇;如果distance_threshold不是none,则它必须被定义为none
  • affinity(亲和力算法):用来计算联系程度的算法,它默认是‘euclidean’(欧式距离),还可以定义为’l1’,‘l2’, ‘mantattan’(曼哈顿距离), 如果linkage=‘ward’,affinity必须为‘euclidean’
  • memory:用缓存来存储输出的结果,默认不缓存
  • connectivity:一个数组或可调用对象,用来指定连接矩阵
  • compute_full_tree:当训练了n_clusters后,训练过程停止,若compute_full_tree=True,则继续训练从而生成完整的数
  • linkage:用来指定链接算法
    – ‘ward’:单链接single-linkage, 采用dmin
    – ‘complete’: 全链接complete-linkage,采用dmax
    – ’average‘:均连接average-linkage算法,采用davg
  • distance_threshold: 超过一定的链接距离,则这个簇将不会被合并;如果它是非空,则n_clusters必须是none,且compute_full_tree必须是True
发布了69 篇原创文章 · 获赞 11 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/weixin_41636030/article/details/90412727