계층 적 클러스터링 알고리즘 DIANA

카테고리 계층 적 클러스터링

  1. 계층 적 클러스터링 집계 : 바닥에서, 클러스터로 결합 될 때까지 클러스터로 각 오브젝트 아래에서 위로, 동일한 클러스터 병합
  2. 계층 적 클러스터링 분류 : 하향식 (top-down), 클러스터까지 모든 점, 각 분할 클러스터를 포함하는 클러스터에서 시작, 단 하나의 지점을두고

클러스터 간의 응집력

단일 쇄 :
정의 : 최단 두 클러스터의 임의의 2 점 사이의 거리가 인접하는 두 개의 클러스터
화학식 : DIST ({M1, m2} , {m3, m4를}) = 분 (DIST {M1, m3} DIST {M1, M4 }, {DIST m2, m3}, {DIST m2, m4는})
특징 : 양호 아트 비 타원형 처리 클러스터 단일 가닥 만, 노이즈에 매우 민감 특이점.
전체 체인 :
정의 : 두 클러스터의 근접성 긴 두 클러스터의 임의의 2 점 사이의 거리이다
화학식 : DIST ({M1, M2가} , {m3는, M4는}) 최대 (DIST {M1을 = , m3} DIST {M1, M4}, {DIST m2, m3}, {DIST m2, M4는})
특징 : 양호 프로세싱 체인 기술 원형 클러스터를하지만, 노이즈 및 아웃 라이어에 덜 민감하다.
그룹 평균 :
정의 : 두 클러스터 근방 평균 두 클러스터의 임의의 2 점 사이의 거리
DIST ({M1, M2} 공식 , {m3, m4를}) = (DIST {M1, m3 DIST} + {M1, M4} + {DIST m2, m3} + {DIST m2, M4}) ÷ \ DIV 4

알고리즘의 아이디어 :

입력 : N 개체 클러스터의 K 종결 조건의 개수

출력 : K 클러스터는, 클러스터의 수가 소정의 종료 조건에 도달

  1. 모든 초기 클러스터로 객체
  2. 대해 (ⅰ = 1; K 개의 I ≠; 내가 ++) 시작합니까
  3. 선정 클러스터 C는 모든 클러스터에 최대 직경이
  4. 기존 정당에 남아있는 소수파로 점 P와 P에 가장 큰 평균 유사성과 다른 점 C 찾기
  5. 반복
  6. 기존의 당과 지점에서 가장 가까운 지점까지의 거리보다 크지 않은 점에 소수파 오래된 정당의 가장 가까운 지점을 찾으려면 추가 소수파
  7. 새로운 노드는 spilnter 그룹에 이전 파티를 할당되지 않을 때까지
  8. spilnter 그룹 오래된 파티와는 다른 클러스터 세트와 함께 새로운 클러스터의 클러스터를 선택한 두 개의 클러스터로 분할
  9. 종료
    계층 적 클러스터링 알고리즘은 일반적으로 덜 사용을 나누었다.
출시 여섯 개 원래 기사 · 원의 칭찬 0 · 조회수 63

추천

출처blog.csdn.net/weixin_43984457/article/details/105253136