기계 학습 - 클러스터링 - 계층 적 클러스터링 알고리즘 노트

계층 적 클러스터링 방법

특정 조건이 충족 될 때까지 데이터 분해 레벨의 주어진 세트에 대해 계층 적 클러스터링하는 방법. 콘크리트로 나눌 수 있습니다 :

계층 적 클러스터링의 1) 통합 : AGNES 알고리즘

자체 상향식 (bottom-up) 전략, 클러스터 각 개체의 첫 번째 하고, 종료 조건이 만족 될 때까지, 클러스터의 성장 클러스터로 병합.

2) 계층 적 클러스터링 분할 : DIANA 알고리즘

 하향식 (top-down) 전략, 그 첫번째 창 점차 종료 상태에 도달 할 때까지, 더 작은 클러스터로 나누어 클러스터에있는 모든 오브젝트.

아그네스 DIANA 알고리즘

처음 1) AGNES (응집성 중첩) 알고리즘 클러스터로 각 오브젝트 특정 기준에 따라 단계적으로 그 클러스터를 조합 단계를 포함한다. 두 클러스터 사이의 거리가 두 개의 상이한 클러스터로부터 가장 최근의 데이터 포인트의 유사성으로부터 판단되고, 클러스터의 최종 수있는 모든 오브젝트에 도달 할 때까지 클러스터가 프로세스 반복을 병합.

2) DIANA (분열 분석) 알고리즘, 계층 적 클러스터링 그러한 최대 유클리드 거리 일부 원리 (), 클러스터 분류에 의하면, 클러스터에있는 모든 객체를 초기화 먼저 분할 속하는 상기 프로세스의 역이다. 두 클러스터의 클러스터의 사용자 특정 번호 사이의 거리가 소정의 임계 값을 초과 할 때까지.

거리에서 클러스터의 다른 정의 사이 AGNES

1) 최소 거리

  가까운 두 샘플의 두 세트, 용이 사슬 구조를 형성

2) 최대 거리

  두 샘플 전체의 두 세트, 비정상적인 값이 불안정있는 경우에서 먼

3) 평균 거리

  두 개의 샘플 사이에 설정하는 것은 스물 두에서 병동 및 샘플의 두 세트 사이의 제곱 스물 두의 평균 거리를 의미

 이 볼 수 특정 계층 적 클러스터링

추천

출처www.cnblogs.com/yang901112/p/11615541.html