1 数据处理

1.数据抽取有用特征值

  • 在鸾尾花的数据中,共有四个特征值,150条数据
  • 将X^T * X 形成4*4的对称矩阵
  • 求4个特征值,以及对应的四个正交特征向量
  • 取两个特征值最大的特征对应的特征向量,作为标准方向
  • 将剩余的两列特征值投影
    原理:其实特征值最大的就是离散程度最高的,用这两个做标注方向,特征值不至于损失太多

2.车辆数据描述

用0, 1, 2, 3表示特征值在参数前方加入参数还是挺麻烦的,于是用在这里插入图片描述独热编码

发布了17 篇原创文章 · 获赞 0 · 访问量 288

猜你喜欢

转载自blog.csdn.net/DropJing/article/details/104638265