机器学习7/100天-K近邻算法

Day7 K近邻算法

github: 100DaysOfMLCode

What is K-NN

k近邻算法是常用的简单分类算法也可用于回归问题。
KNN是一个无参的(不需要对数据分布做任何假设)、基于实例的(没有明显的学习一个模型,只需要记住训练实例)用于监督学习的算法。

How does knn work

KNN三要素:训练数据集,距离,最近邻数量
计算输入数据实例与训练数据集中实例的距离,选取最近的k个实例,决定输入实例的标签。
通常距离有欧拉距离、汉明距离、曼哈顿距离、闵可夫斯基距离。

K值

K值太小噪声对结果影响过大,过拟合;
K值太大增加了计算复杂度,而且欠拟合。
通常依次尝试,选取最佳k值。

猜你喜欢

转载自blog.csdn.net/zombee0/article/details/85520765