"기계 학습"수박 책 장 IX 클러스터링

자율 학습 : 결과를 예견 할 수없는 경우 우리가 문제를 종료 할 수 있도록, "자율 학습은"훈련 샘플의 태그 정보는 목적이 고유의 특성과 규칙이 표시되지 않은 훈련 샘플을 학습하여 데이터를 공개하는 것입니다, 알 수없는 상기 데이터 분석을위한 기초를 제공한다.

9.1 클러스터의 임무

일반적인 자율 학습 과제 : 클러스터링, 밀도 추정, 이상 감지.

데이터 세트를 샘플하려고 클러스터링은 일반적으로 여러 개의 분리 된으로 나누어 져 집합 각 부분 집합이라고하며, "클러스터입니다."

클러스터링 알고리즘은 클러스터링 알고리즘 그것을 민족 그룹은 그룹 내의 일련의 데이터 포인트들로 분할되어 있기 때문에, 다른 클러스터보다 점에 가까운 데이터 포인트의 동일한 클러스터. 유사한 특성을 가진 스페이서 그룹은 클러스터에 할당.

구조화 된 데이터의 내부 분포를 발견하는 별도의 프로세스로 동시에 클러스터링, 또한 분류 및 다른 학습 과제 전구체로서 프로세스.

9.2 성능 메트릭

클러스터 성능 측정은 "효율성 지표", 성능 지표로 알려져 있으며 효과를 학습과 유사 감독.

우리는 낮은 높이 "클러스터 간 유사성"의 "클러스터 유사성"클러스터링을 바란다 "등처럼 붐 빕니다"클러스터링 어떤 종류의 불법 거주자 결과.

클러스터링 성능 측정 대략 두 가지 유형 : 하나입니다

추천

출처www.cnblogs.com/ttzz/p/11646660.html