数据挖掘十大经典算法之——KNN 算法

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sunyaowu315/article/details/88843909

数据挖掘十大经典算法系列,点击链接直接跳转

简介

分类思想比较简单,从训练样本中找出K 个与其最相近的样本,然后看这k 个样本中哪个类别的样本多,则待判定的值(或说抽样)就属于这个类别。

缺点:

1)K 值需要预先设定,而不能自适应

2)当样本不平衡时,如一个类的样本容量很大,而其他类样本容量很小时,有可能导致当输入一个新样本时,该样本的K 个邻居中大容量类的样本占多数。
该算法适用于对样本容量比较大的类域进行自动分类。

猜你喜欢

转载自blog.csdn.net/sunyaowu315/article/details/88843909