机器学习入门(1)

在过去两年人工智能很火,以至于机器学习也跟着火起来了,其实机器学习是上世纪的事情了,以前由于存储及计算力的限制,机器学习并不是那么火爆,AI只是以规则上的学习为主。随着近年大数据的发展,数据成几何级增长,计算力和存储能力的提升,基于算法的计算,更是显现出他特有的优势,尤其在深度学习方面。

人工智能、机器学习、深度学习

人工智能:任何计算机代替人进行工作的行为,都可以称为人工智能,这个广义上的人工智能。会计经常用的计算器,我们用的电脑,都可以称为人工智能,只是还没有智能到可以完全代替人类的地步,我们通常用规则进行编程,也是在做人工智能的一部分。

机器学习:让机器根据现有的数据,学习一套适应特定场景的模型,帮助人类进行预测的行为,就是机器学习。他和普通的规则编程的区别就是 我们事先不知道规则,由机器去根据历史数据的特征和标签,学习到一定的规律,形成特定的算法模型,以此来预测新的数据。  例如:垃圾邮件分类、预测房价等等。

深度学习:图像识别

机器学习

机器学习分为有监督学习和无监督学习

有监督学习:基于有标签的样本数据进行学习。

无监督学习:基于无标签的样本数据进行学习。

有监督学习分为分类和回归。 分类 学习出来的模型是用来预测一系列离散值;回归是用来预测连续值。

分类算法:knn、svm、逻辑回归、决策树

线性算法:线性回归

无监督学习算法:聚类,简单来说就是根据无标签的数据进行聚类。

机器学习的流程:

准备数据--选择模型--训练模型调整参数--测试数据

其中,耗时耗力的步骤就是准备数据,加工特征。在实际生产工作中,数据准备占用了80%左右的时间,这一步主要根据业务口径加工特征。准备的数据要分为训练集、测试集、验证集;三个集合中,正反数据的比例要大致相同,不能有较大差异。

猜你喜欢

转载自blog.csdn.net/weixin_40036840/article/details/85198908