机器学习实战之机器学习基础

什么是机器学习:

  • 把无序的数据转换为有用的信息
  • 利用计算机来揭示数据背后的真实含义

监督学习一般使用两种类型的目标变量(结果的两种表达形式):标称型和数值型

  • 标称型目标变量的结果只在有限目标集中取值,如真与假、动物分类的集合{爬行类,鱼类,哺乳类,两栖类},标称型主要用于分类;
  • 数值型变量则可以从无限的数值集合中取值,如0.1、1.0000、10、1000等。数值型主要用于回归分析
  • 自我感觉就是,用于分类问题的离散取值;用于回归分析的能够连续取值。

    分类和回归属于监督学习,因为监督学习算法必须知道预测的目标是什么。
    聚类属于无监督学习,数据没有类别信息,也不给定预测的目标值;
    寻找描述数据统计值的过程称之为密度估计(不好理解)。

开发机器学习应用程序的步骤:

  • 1、收集数据。网络爬从网站上抽取数据、设备发送过来的实时数据
  • 2、准备输入数据。得到数据之后,还必须确保数据格式符合要求
  • 3、分析输入数据。人工分析收集和准备的数据是否合理
  • 4、训练算法。将收集的格式化数据输入到算法中,从中抽取和学习知识和信息。若是无监督学习,由于不存在目标变量值,不需要训练算法这一步
  • 5、测试算法。如果不满意算法的输出结果,可以回到第四步改正并加以测试。问题常常会和数据的收集和准备有关,这时要回到第 1 步重新开始
  • 6、使用算法。

    numpy中的 ndarray和 matrix的区别

  • https://blog.csdn.net/vincentlipan/article/details/20717163
  • matrix(矩阵必须是2维的),ndarray 可以是多维的(1D,2D,3D…nD).matrix是ndarray的一个小分支,拥有ndarray的所有特性。
  • numpy中的matrix的优势是简单的乘法运算,矩阵 A*B是指矩阵乘积,
    numpy中的ndarray的运算作用在每个元素上,实现矩阵相乘np.dot(A,B)

  • 实现两者之间的转换:np.asmatrix 和 np.asarray

猜你喜欢

转载自blog.csdn.net/xyz2107605729/article/details/79763875
今日推荐