基本介绍+数据集及其拆分

机器学习 (Machine Learning)
定义:
是对研究问题进行模型假设,利用计算机从训练数据中学习得到模型参数。并最终对数据进行预测和分析的一门学科。

二分类问题的基本解决思路:

(1)建立假设模型(可理解为函数)。即建立一条直线,表达式为y=f(x)=W1x + W0。
则通过确定模型参数W1与W0的取值,就可以确定函数的具体位置。
(2)训练模型。利用已明确分类结果的样本数据集(称为训练集)进行训练,即函数参数的求解过程。得到参数W1与W0的最终取值,则得到最终的训练模型。
(3)进行分类判别。利用训练好的模型对待分类的数据进行分类判别,得出其属于哪一类。

多类分类问题可分为二类分类问题进行解决。除了直线也可用曲线进行分类,效果更好。在高维空间中可用曲面进行分类,但过程类似。

深度学习(Deep Learning)
定义:
一种实现机器学习的技术,是机器学习的重要分支。
源于人工神经网络的研究,深度学习的模型结构是一种含多隐藏层的神经网络。
通过组合低层特征形成更加抽象的高层特征。

通过一个例子了解机器学习中,简单线性分类器与深度学习的区别:

简单分类器是通过加权计算的方式,w1,w2,w3,w4为各分量x的权重。
通过线性模型y=f(w1x1+w2x2+w3x3+w4x4),若括号里的结果大于等于阈值,则输出1,反之则输出0。
同样的问题如果用深度学习方法,通常是在线性模型中间加入中间层。其中参数U表示从输入层结点到中间层结点之间连线的权重。
公式与线性分类器相似,但是这样的特点是经过中间层,可有效的组合底层特征形成高层特征,减少了特征值数量。
深度学习中往往包含多个中间层(隐藏层),且网络结构更复杂一些。

机器学习VS深度学习
机器学习需要人工选取特征
深度学习会自动学习有用特征
————————————————
版权声明:本文为CSDN博主「童璐0」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_44704609/article/details/104374600

发布了8 篇原创文章 · 获赞 0 · 访问量 157

猜你喜欢

转载自blog.csdn.net/snow54678/article/details/104410571