机器学习中的一些常见的概念

--------------------摘自《机器学习算法原理与编程实践》以及传智播客相关资料-------------------

机器学习中的对象:只含有一组特征的行向量(所有的特征组合在一起构成一组行向量,又称之为特征向量,不是线性代数中的特征向量,线代中的特征向量是列向量)

对象的维度:行向量的列数

机器学习中的矩阵:矩阵是具有相同特征和维度的对象的集合,表为一张二维数据表

一个对象代表着矩阵中的一行,一个特征表示为矩阵中的一列,每个特征都有数值型的取值

由特征列的取值范围所有与构成的举证空间应当具有完整性,能够反映出事物的空间或者形式变化

分类、聚类与回归是及其学习最基本的主题

在实际计算中,含有字符串的对象名称因为无法直接参与运算,一般情况下可以进行编码,将其编码为数字

一个对象应当被视为完整的个体,代表的是现实中有意义的事物,不能轻易进行拆解,其表现形式多种多样

 

分类模型与回归模型:

分类模型:目标值为离散型数据的模型,分类是监督学习的一个核心问题,在监督学习中,当输出变量取有限个离散值时,预测问题变成为分类问题。最基础的便是二分类问题,即判断是非,从两个类别中选择一个作为预测结果;分类在于根据其特性将数据“分门别类”,所以在许多领域都有广泛的应用

回归模型:目标值为连续型数据,回归用于预测输入变量和输出变量之间的关系。回归在多领域也有广泛的应用:房价预测,根据某地历史房价数据,进行一个预测;金融信息,每日股票走向等。

 

监督学习与无监督学习:

监督学习:(英语:Supervised learning),可以由输入数据中学到或建立一个模型,并依此模式推测新的结果。输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值(称为回归),或是输出是有限个离散值(称作分类)。

无监督学习(英语:Supervised learning),可以由输入数据中学到或建立一个模型,并依此模式推测新的结果。输入数据只是由输入特征值所组成

猜你喜欢

转载自blog.csdn.net/qq_15054345/article/details/87484171