첫째, 알고리즘 원리
클러스터 거리와 밀도
- 모든 점은 시작 지점으로 선출 된 또는 카테고리에 포함 된 경우 다음 정지, 시작 지점을 선택
- 선택된 거리 점은 점의 집합으로 소정의 임계 값 미만인
- 포인트 번호가 특정 값보다 큰 경우에는 스텝 2, 그렇지 않으면 단계 1로 이동 한 다음 카테고리로 통합 한 후 단계 2로 진행하여이 카테고리의 중심점을 선택
둘, Code
1 행 scipy.spatial 수입 거리 2 에서 sklearn.neighbors을 가져 NearestNeighbors 3 에서 sklearn.cluster.dbscan_ 오기 DBSCAN 4 에서 sklearn.cluster.dbscan_ 오기 dbscan 5 오기 NP NumPy와 같은 6 7 에서 sklearn.cluster.tests.common 수입 generate_clustered_data 8 9 min_samples = 10 10 EPS = 0.0309 11 12 X = generate_clustered_data (시드 = 1, = 1000 n_samples_per_cluster) 13 14 D = distance.squareform (distance.pdist (X)) 15 D = D / np.max (D) 16 core_samples 라벨 dbscan = (D 메트릭 = " 사전 계산 " , EPS = EPS, 17 min_samples = min_samples )
셋째, 결과
클러스터링이 유형의 가능한 사진 kmeans로, DBSCAN 매우 좋은 사실이 없습니다 있습니다. 환상 DBSCAN 적합 클러스터, 클러스터 형상 또는 고밀도