梯度下降法、正则化与逻辑回归 - 代码天地

梯度下降法、正则化与逻辑回归

其他 2018-10-08 23:20:18 阅读次数: 0

梯度下降法、正则化与逻辑回归

1.梯度下降法

在介绍梯度下降法之前，先介绍下泰勒公式，泰勒公式的基本形式如下：

令x=w^t⁺¹，w^t+1代表第t+1次参数向量的值；令x₀=w^t，代表第t次参数向量的值；其中w共有k个参数，w=[w₁,w_2,…,w_k]；令x-x₀=△w，取一阶泰勒公式，则：

由于是梯度下降，所以f(w^t+1)<=f(w^t)，所以

令函数f为损失函数J，则

故第t+1次参数向量的值等于第t次参数向量的值减去损失函数偏导乘以学习率α。

2.正则化

为了防止过拟合，一般采用正则化，正则化一般分为L1正则化和L2正则化，分别为：

分别对w_i求偏导，得

最后，

L1正则化：

L2正则化：

从以上公式可以发现L1正则化相对于L2正则化更容易产生数据稀疏性，并且两则都可以防止过拟合。

3.逻辑回归

逻辑回归是建立在线性回归的基础上，一般采用sigmoid函数来拟合，即

其中，w^Tx=w₁x₁+w₂x₂+…+w_nx_n，x为样本特征，w为样本对应的系数，在已知样本特征x和最终分类结果y（1或者0）的前提下，求系数w使得损失函数最小。

假设有m个样本，则相应的极大似然函数为

两边取对数化简得损失函数J(w)，求使损失函数最小的参数：

经化简：

其中，x_ij是第i个样本x_i的第j个特征，故

如果m是全量样本，则为批量梯度下降法(BGD)，如果m是部分样本，则为小批量梯度下降法(MBGD)，如果m是一个样本（每次迭代从所有样本中随机选择一个样本代替所有样本），则为随机梯度下降法(SGD)。所以，逻辑回归的m个样本对第j个特征的梯度为：

如果是一个样本，则

注：

1.sigmoid函数：有如下性质：

(1).

(2).

2.指数损失函数：

猜你喜欢

转载自www.cnblogs.com/yqs-cedarmo/p/9757799.html

梯度下降法、正则化与逻辑回归

逻辑回归---梯度下降法

逻辑回归梯度下降法详解

逻辑回归中的梯度下降法

使用改进的随机梯度下降法的逻辑回归

梯度下降法实现逻辑回归(python 代码)

逻辑回归梯度下降

逻辑回归及梯度下降

Python - 梯度下降法实现线性回归

梯度下降法解决线性回归

线性回归及其梯度下降法（小结）

回归与梯度下降法及实现原理

梯度下降法求解线性回归问题

python 线性回归梯度下降法

用梯度下降法实现线性回归

线性回归（梯度下降法）- 02

梯度下降法实现对数几率回归

梯度下降法实现Logistic回归

梯度下降法求解线性回归

笔记-logistic回归中的梯度下降法

【机器学习】线性回归的梯度下降法

基于梯度下降法的线性回归

简单线性回归（梯度下降法）

梯度下降法线性回归模拟

多元线性回归的梯度下降法

逻辑回归与梯度下降详解

逻辑回归和梯度下降

梯度下降求解逻辑回归

逻辑回归的梯度下降计算

逻辑回归与梯度下降复习

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)