1.机器学习基础

建模前把数据分成:

  1. 训练集(Training data)--------------------用来训练,构建模型
  2. 验证集(Validation data)------------------用来在模型训练阶段测试模型的好坏
  3. 测试集(Testing data)---------------------等模型训练好了以后,再用测试集来评估模型的好坏

机器学习的训练方式

  1. 监督学习 :训练带有标签的数据集
  2. 无监督学习:数据集无标签例如聚类
  3. 半监督学习:监督学习和无监督学习结合的一种学习方式。用于解决少量带标签的数据和大量没有标签的数据进行训练和分类的问题

常见应用

  1. 回归   (根据历史数据预测未来数据的走势)
  2. 分类   (图像识别 ,垃圾邮件分类,文本分类)分类基本都是带标签的监督学习
  3. 聚类   (聚类就是无标签的分类),属性相近的归为一类

回归:预测数据为连续型数值(房价)

分类:预测数据为类别型数据,并且类别已知(不是A类就是B类)

聚类:预测数据为类别型数据,但是类别未知,没有标签

猜你喜欢

转载自www.cnblogs.com/hanziran/p/11604592.html