机器学习-如何处理数据集中的缺失值

版权声明:本文为博主原创文章,未经作者允许请勿转载。 https://blog.csdn.net/heiheiya https://blog.csdn.net/heiheiya/article/details/83276804

有时候收集数据是非常困难的,如果因为部分缺失值而扔掉或者重新获取代价太大了。

可以采取下面的一些方法来解决这个问题:

  • 使用可用特征的均值来填补缺失值;
  • 使用特殊值来填补缺失值,如-1;
  • 忽略有缺失值的样本;
  • 使用相似样本的均值填补缺失值;
  • 使用另外的机器学习算法预测缺失值。

猜你喜欢

转载自blog.csdn.net/heiheiya/article/details/83276804
今日推荐