클러스터링 -dbscan

첫째, 알고리즘 원리

클러스터 거리와 밀도

  1.  모든 점은 시작 지점으로 선출 된 또는 카테고리에 포함 된 경우 다음 정지, 시작 지점을 선택
  2.  선택된 거리 점은 점의 집합으로 소정의 임계 값 미만인
  3.  포인트 번호가 특정 값보다 큰 경우에는 스텝 2, 그렇지 않으면 단계 1로 이동 한 다음 카테고리로 통합 한 후 단계 2로 진행하여이 카테고리의 중심점을 선택

 

둘, Code

1   scipy.spatial 수입 거리
 2  에서 sklearn.neighbors을 가져 NearestNeighbors
 3  에서 sklearn.cluster.dbscan_ 오기 DBSCAN
 4  에서 sklearn.cluster.dbscan_ 오기 dbscan
 5  오기 NP NumPy와 같은
 6  
7  에서 sklearn.cluster.tests.common 수입 generate_clustered_data
 8  
9 min_samples = 10
 10 EPS = 0.0309
 11  
12 X = generate_clustered_data (시드 = 1, = 1000 n_samples_per_cluster)
 13  
14 D = distance.squareform (distance.pdist (X))
 15 D = D / np.max (D)
 16 core_samples 라벨 dbscan = (D 메트릭 = " 사전 계산 " , EPS = EPS,
 17                                min_samples = min_samples )

 

셋째, 결과

클러스터링이 유형의 가능한 사진 kmeans로, DBSCAN 매우 좋은 사실이 없습니다 있습니다. 환상 DBSCAN 적합 클러스터, 클러스터 형상 또는 고밀도

추천

출처www.cnblogs.com/ylxn/p/11822889.html