카테고리 계층 적 클러스터링
- 계층 적 클러스터링 집계 : 바닥에서, 클러스터로 결합 될 때까지 클러스터로 각 오브젝트 아래에서 위로, 동일한 클러스터 병합
- 계층 적 클러스터링 분류 : 하향식 (top-down), 클러스터까지 모든 점, 각 분할 클러스터를 포함하는 클러스터에서 시작, 단 하나의 지점을두고
클러스터 간의 응집력
단일 쇄 :
정의 : 최단 두 클러스터의 임의의 2 점 사이의 거리가 인접하는 두 개의 클러스터
화학식 : DIST ({M1, m2} , {m3, m4를}) = 분 (DIST {M1, m3} DIST {M1, M4 }, {DIST m2, m3}, {DIST m2, m4는})
특징 : 양호 아트 비 타원형 처리 클러스터 단일 가닥 만, 노이즈에 매우 민감 특이점.
전체 체인 :
정의 : 두 클러스터의 근접성 긴 두 클러스터의 임의의 2 점 사이의 거리이다
화학식 : DIST ({M1, M2가} , {m3는, M4는}) 최대 (DIST {M1을 = , m3} DIST {M1, M4}, {DIST m2, m3}, {DIST m2, M4는})
특징 : 양호 프로세싱 체인 기술 원형 클러스터를하지만, 노이즈 및 아웃 라이어에 덜 민감하다.
그룹 평균 :
정의 : 두 클러스터 근방 평균 두 클러스터의 임의의 2 점 사이의 거리
DIST ({M1, M2} 공식 , {m3, m4를}) = (DIST {M1, m3 DIST} + {M1, M4} + {DIST m2, m3} + {DIST m2, M4})
4
알고리즘의 아이디어 :
입력 : N 개체 클러스터의 K 종결 조건의 개수
출력 : K 클러스터는, 클러스터의 수가 소정의 종료 조건에 도달
- 모든 초기 클러스터로 객체
- 대해 (ⅰ = 1; K 개의 I ≠; 내가 ++) 시작합니까
- 선정 클러스터 C는 모든 클러스터에 최대 직경이
- 기존 정당에 남아있는 소수파로 점 P와 P에 가장 큰 평균 유사성과 다른 점 C 찾기
- 반복
- 기존의 당과 지점에서 가장 가까운 지점까지의 거리보다 크지 않은 점에 소수파 오래된 정당의 가장 가까운 지점을 찾으려면 추가 소수파
- 새로운 노드는 spilnter 그룹에 이전 파티를 할당되지 않을 때까지
- spilnter 그룹 오래된 파티와는 다른 클러스터 세트와 함께 새로운 클러스터의 클러스터를 선택한 두 개의 클러스터로 분할
- 종료
계층 적 클러스터링 알고리즘은 일반적으로 덜 사용을 나누었다.