数据预处理学习(一)数据预处理

一.异常数据剔除

    1.拉以达准则

      (1)使用条件:测量次数充分大,数据组数较多的时候

      (2)限制:当测量次数<=10次时,该准则失效。

    2.马氏距离法

    3.主要参见学习博客:https://blog.csdn.net/pandacsu/article/details/71159463

二.空间数据离散化

   1.数据离散化定义:离散化,把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。

   2.数据离散化的限制条件:离散化仅适用于只关注元素之间的大小关系而不关注元素本身的值!

   3.数据离散化学习博客:

       (1)https://blog.csdn.net/gao506440410/article/details/81908208

       (2)https://blog.csdn.net/xzfreewind/article/details/77102835

   4.数据离散化论文案例:file:///D:/QQ资料所在地/QQ资料下载大全/建模优秀论文1/2017_B_1510568787839.pdf(不好意思哈~仅限本地电脑使用)

   5.数据离散化的优点:http://blog.sina.com.cn/s/blog_652090850100ynds.html

猜你喜欢

转载自blog.csdn.net/qq_41658955/article/details/81983491