《机器学习基石》第9节课学习笔记 - 代码天地

《机器学习基石》第9节课学习笔记

其他 2019-05-25 13:01:24 阅读次数: 0

第9节课 Linear Regression

本节课本学习了机器学习最常见的一种算法：Linear Regression（线性回归）。这是学习《机器学习基石》中学到的第二种算法，第一种是PLA算法。所以本节课特别重要，希望通过本节课学习对线性回归有自己初步的了解。

一、线性回归问题

在之前的Linear Classification课程中，讲了信用卡发放的例子，利用机器学习来决定是否给用户发放信用卡。本节课仍然引入信用卡的例子，来解决给用户发放信用卡额度的问题，这就是一个线性回归（Linear Regression）问题。

令用户特征集为d维的X，加上常数项，维度为d+1与权重 $w$

根据上图，在一维或者多维空间里，线性回归的目标是找到一条直线（对应一维）、一个平面（对应二维）或者更高维的超平面，使样本集中的点更接近它，也就是残留误差Residuals最小化。

一般最常用的错误测量方式是基于最小二乘法，其目标是计算误差的最小平方和对应的权重w，即上节课介绍的squared error：

二、线性回归算法

样本数据误差 $E_{i n}$

首先，运用矩阵转换的思想，将 $E_{i n}$

$E_{i n}$

然后，对于此类线性回归问题， $E_{i n} (w)$

$E_{i n} (w)$

根据梯度的思想，对Ew进行矩阵话求偏导处理：

令偏导为零，最终可以计算出权重向量w为：

三、泛化问题

现在，可能有这样一个疑问，就是这种求解权重向量的方法是机器学习吗？或者说这种方法满足我们之前推导VC Bound，即是否泛化能力强 $E_{i n} \approx E_{o u t}$

$E_{i n} \approx E_{o u t}$

有两种观点：1、这不属于机器学习范畴。因为这种closed-form解的形式跟一般的机器学习算法不一样，而且在计算最小化误差的过程中没有用到迭代。2、这属于机器学习范畴。因为从结果上看，Ein和Eout都实现了最小化，而且实际上在计算逆矩阵的过程中，也用到了迭代。

其实，只从结果来看，这种方法的确实现了机器学习的目的。下面通过介绍一种更简单的方法，证明linear regression问题是可以通过线下最小二乘法方法计算得到好的Ein和Eout的。

首先，我们根据平均误差的思想，把 $E_{i n} (w_{L I N})$

下面从几何图形的角度来介绍帽子矩阵H的物理意义。

图中，y是N维空间的一个向量，粉色区域表示输入矩阵X乘以不同权值向量w所构成的空间，根据所有w的取值，预测输出都被限定在粉色的空间中。向量 $\hat{y}$

机器学习的目的是在粉色空间中找到一个y^，使它最接近真实的y，那么我们只要将y在粉色空间上作垂直投影即可，投影得到的 $\hat{y}$

从图中可以看出，y^是y的投影，已知 $\hat{y} = H y$

这里trace(I-H)称为I-H的迹，值为N-(d+1)。这条性质很重要，一个矩阵的 trace等于该矩阵的所有特征值(Eigenvalues)之和。下面给出简单证明：

介绍下该I-H这种转换的物理意义：原来有一个有N个自由度的向量y，投影到一个有d+1维的空间x（代表一列的自由度，即单一输入样本的参数，如图中粉色区域），而余数剩余的自由度最大只有N-(d+1)种。

在存在noise的情况下，上图变为：

图中，粉色空间的红色箭头是目标函数f(x)，虚线箭头是noise，可见，真实样本输出y由f(x)和noise相加得到。由上面推导，已知向量y经过I-H转换为 $y - \hat{y}$

即：

同样，对 $E_{o u t}$

我们把 ${\bar{E}}_{i n}$

${\bar{E}}_{i n}$

当N足够大时， ${\bar{E}}_{i n}$

四、Linear Regression方法解决Linear Classification问题

之前介绍的Linear Classification问题使用的Error Measure方法用的是0/1 error，那么Linear Regression的squared error是否能够应用到Linear Classification问题？

下图展示了两种错误的关系，一般情况下，squared error曲线在0/1 error曲线之上。即

根据之前的VC理论，Eout的上界满足：

从图中可以看出，

代替

，Eout仍然有上界，只不过是上界变得宽松了。也就是说用线性回归方法仍然可以解决线性分类问题，效果不会太差。二元分类问题得到了一个更宽松的上界，但是也是一种更有效率的求解方式。

猜你喜欢

转载自www.cnblogs.com/lxx0/p/lxx_learning-notes-9.html

《机器学习基石》第9节课学习笔记

《机器学习基石》第1节课学习笔记

《机器学习基石》第10节课学习笔记

《机器学习基石》第12节课学习笔记

《机器学习基石》第2节课学习笔记

《机器学习基石》第3节课学习笔记

《机器学习基石》第4节课学习笔记

《机器学习基石》第8节课学习笔记

《机器学习基石》第15节课学习笔记

《机器学习基石》第5节课学习笔记

《机器学习基石》第11节课学习笔记

《机器学习基石》第13节课学习笔记

《机器学习基石》第16节课学习笔记（未完成）

林轩田机器学习基石笔记（第9节）——Pocket AIgorithm（口袋算法）

机器学习笔记第9课

林轩田机器学习基石笔记（第10-13节）——机器学习的分类

机器学习基石——第三节课（笔记）

机器学习基石第十六讲笔记

机器学习基石第十二讲笔记

机器学习基石第十三讲笔记

机器学习基石第十五讲笔记

机器学习基石第十一讲笔记

机器学习基石第十讲笔记

机器学习基石第十六周笔记

林軒田机器学习基石笔记（第6节）

林轩田机器学习基石笔记（第8节）——PLA循环停止条件的探讨

林轩田机器学习基石笔记（第7节）——PLA算法

林轩田机器学习基石笔记（第4节）

林轩田机器学习基石笔记（第1节）

机器学习基石（笔记）

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)