机器学习一——分类

一:机器学习分类一(根据不同的用途)

1.监督学习:

(1)分类:label 是离散的

(2)回归:label(在这里说预测值更合适,比如房价,无人驾驶中方向盘转动的角度) 是连续的

在一些情况下,可以将连续的预测值量化,从而将回归问题转化为分类问题。

2.非监督学习:

(1)对数据进行降维:

特征提取:

特征压缩:PCA,将关联度(相似性)高的特征变为一个。

                如手写数字的识别,相邻的像素点灰度值近似,因此可用一个像素点代替周围的多个,从而减少特征数量,降低维度

数据降维的意义:数据可视化。如把高维降到二维,三维,方便作图,将数据的具体分布等展现出来,使人们更好的理解。

(2)异常检测

3.半监督学习

实际中,可能有些样本的标签值(也可以表示回归中的预测值)丢失,有些样本有标签,有些没有标签,则称之为半监督学习。

半监督学习的方法:一般先用非监督学习手段对数据做处理,之后使用监督学习的手段做模型的训练和预测。

二,机器学习分类二(根据是否能适应环境的变化)

1.批量学习:

(1)定义:批量学习是指用一批数据将模型训练完成后,训练数据就被丢弃。在实际环境中输入样本,预测样本,模型不再更新。

(2)如何和适应环境的变化?

    定时重新批量学习,但计算量大,某些业务可能需要频繁的重新批量学习。

2.在线学习;

(1)定义:


能及时反映新的数据变化,也适用于数据量大,无法完全批量学习的环境。

(2)新的(异常)数据带来不好的影响怎么办?

    加强对数据进行异常监控(用到非监督学习中的异常监测功能)

三。机器学习分类三(根据参数进行划分)

1.参数学习

如先假设:f(x)=ax+b,根据点的坐标(样本),训练,学习得到参数a,b的值

2,非参数学习(对这个还不是特别理解,后续更新

不对其进行过多的假设,但不代表没有参数。




猜你喜欢

转载自blog.csdn.net/zhao_crystal/article/details/80013523