机器学习（第三周）逻辑回归&正则化

其他 2018-06-11 02:07:17 阅读次数: 2

1、二元分类

要尝试分类，一种方法是使用线性回归，并将所有大于0.5的预测值映射为1，将小于0.5的所有预测值映射为0

二元分类问题，其中y只能取两个值0和1

Sigmoid Function（逻辑回归函数）

hθ(x)=g(θTx)；z=θTx，g为sigmoid函数

因为只能取两个值0和1

hθ(x)=P(y=1|x;θ)=1−P(y=0|x;θ)P(y=0|x;θ)+P(y=1|x;θ)=1

决策边界

当

等价于

g(z) (e.g. $\theta^T X$ ) 就是逻辑回归的决策边界

简化的逻辑回归的代价函数

代价函数如下：

因为y等于1或0；

代价函数也可以表示成

完整形式如下：

通过向量和矩阵表达：

简化的逻辑回归梯度下降

梯度下降的一般表达式

微积分计算得到

向量输出

2、更高级的代价函数算法

梯度下降法并不是唯一的算法，共轭梯度法、BFGS (变尺度法) 和 L-BFGS (限制变尺度法)更加高级优化算法来优化代价函数，能够更快的使代价函数收敛，更适合大型的机器学习（有很多的特征变量）

这三种算法的特点：

举例

需要编写函数

3、一对多分类

多元分类问题可以转化为多个二元分类问题

如下图

一个样本最终的预测分类为在所有分类器中概率最大的类别

4、正则化解决过度拟合问题

hθ(x)=P(y=1|x;θ)=1−P(y=0|x;θ)P(y=0|x;θ)+P(y=1|x;θ)=1

欠拟合或高偏倚是当我们的假设函数h的形式很难与数据的趋势作图时。它通常是由一个特征太简单或功能太少造成的

过度拟合或高度方差是由适合现有数据的假设函数引起的，但不能很好地预测新数据。它通常是由一个复杂的函数造成的，它会产生大量与数据无关的不必要的曲线和角度

举例如下图

解决过度拟合

1.减少特征的数量。 - 手动选择要保留的功能。 - 模型选择算法

2.规范化。 - 保留所有功能，但减少参数的大小/值。 - 当我们有很多功能时很有效，每个功能都有助于预测

正则化

在正则线性回归中，我们选择最小化θ，代价函数如下：

其中正则项是：

λ 要做的就是控制在两个不同的目标中的平衡关系

第一个目标就是我们想要训练，使假设更好地拟合训练数据。我们希望假设能够很好的适应训练集。

第二个目标是我们想要保持参数值较小。（通过正则化项）

λ过大，这种假设有过于强烈的"偏见" 或者过高的偏差 (bais)，θ1到θn都接近于0，对于数据来说这只是一条水平线

λ过小，对于目标函数约束不足，正则项的接近于0，正则项接近于0，没有达到避免过拟合的约束目的

在正则化线性回归中的应用

梯度下降法

针对变量进行正则化，所以θ0不没有进行正规化

正则化式子转化成如下形式，1-α*λ/m值区间位于（0,1），每次迭代更新θj就一定程度上减小

正规化方程

正规化方程计算方程如下：

如果x'x不存在，x'x+λL就变成可逆的矩阵

正则化在逻辑回归中的应用

未进行正规化的方程的代价函数是：

通过正则项即可实现正则化

使用梯度下降法计算正则化之后的θ计算如下：

需要定义方程如下：

猜你喜欢

转载自blog.csdn.net/liyanchang567/article/details/80637416

机器学习（第三周）逻辑回归&正则化

Stanford机器学习第三周：逻辑回归与正则化

吴恩达机器学习笔记--第三周-1.分类与逻辑回归

吴恩达机器学习第三周笔记-逻辑回归

机器学习第三周（下）

第三周（Logistic回归 + Regularization）-【机器学习-Coursera Machine Learning-吴恩达】

机器学习技法第三周学习笔记

机器学习(12) 线性回归、逻辑回归的正则化算法

第三周学习

学习第三周

笔记：机器学习——吴恩达第三周

机器学习基石第三周笔记

吴恩达机器学习第三周

机器学习第三周-数据预处理（I）

机器人团队第三周学习总结

跟着Andrew Ng挑战Machine Learning（第三周）Part 1：逻辑回归简介

跟着Andrew Ng挑战Machine Learning（第三周）Part 2：逻辑回归的代价函数

机器学习 day13（正则化，线性回归的正则化，逻辑回归的正则化）

吴恩达机器学习 - 逻辑回归的正则化

吴恩达机器学习 - 逻辑回归的正则化吴恩达机器学习 - 逻辑回归的正则化

机器学习第三周打卡：归一化+KD树+特征预处理

机器学习 | 吴恩达机器学习第三周学习笔记

第三周超参数调试、Batch正则化和程序框架（Hyperparameter tuning）

机器学习 | 吴恩达机器学习第三周编程作业(Python版)

学习前端第三周

Python学习之路_第三周

java学习第三周

第三周学习进度总结

暑假学习第三周

第三周学习总结

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)