1.朴素贝叶斯:
在使用时,有一个前提假设:各特征独立。在用贝叶斯公式之前,最好先看下全概率公式。用c表示类别,f表示特征。则贝叶斯课表示为:
在计算时,记得要拉普拉斯平滑,具体公式看西瓜书。还可以看看数据挖掘领域十大经典算法之—朴素贝叶斯算法和机器学习之朴素贝叶斯(NB)分类算法与Python实现。
2.KNN:
knn既可以用于分类,也可以用于回归。knn的基本步骤就是计算距离,排序,选择距离最小的K个点,找那K个点里找label次数最多的那个点即为所分的得类。推荐算法用的比较多。