线性回归与逻辑回归 (logistic regression and linear regression)

物联网 2022-08-14 04:31:58 阅读次数: 0

线性回归一般用于数据预测，预测结果一般为实数。
逻辑回归一般用于分类预测，预测结果一般为某类可能的概率。

在这里插入图片描述

线性回归

Step 1: Model

定义模型
在这里插入图片描述

Step 2: Goodness of Function

定义 Loss 函数，用于判断模型好坏，此处选取的 MSE
在这里插入图片描述
通过最小化 Loss 函数，来得到更好的模型

Step 3: Gradient Descent

通过梯度下降来优化参数
在这里插入图片描述
两个参数的梯度下降求法

可视化

Linear regression 是没有局部最优解的

分别对 $w$ 和 $b$ 求偏导
在这里插入图片描述

How’s the results?

在这里插入图片描述

Model Selection

引入多次项，定义更复杂的 Model
在这里插入图片描述
当模型越复杂可能会出现 Overfitting 的情况

Back to step 1: Redesign the Model

重新定义模型，考虑物种对结果的影响
在这里插入图片描述

考虑其他 feature 对结果的影响，重新定义Model
在这里插入图片描述

Back top step 2: Regularization

对 Loss function 加入正则化来解决 Overfitting 问题

在这里插入图片描述

Regularization

正则化：期待参数越小的 function，越平滑，output 对输入的变化是比较不敏感的，可以对噪点不敏感。

在这里插入图片描述
λ 越大说明越考虑 $w$ 本身大小，而越不考虑本身的 Loss 大小，所以在 training data 上的表现越来越差。

为什么不考虑 $b$ ，因为我们需要的是一个平滑的 function，而 $b$ 的大小不会改变 function 的平滑程度。

逻辑回归

理想中定义分类任务的模型函数

在这里插入图片描述

通过高斯分布来解决

假设数据属于高斯分布（也可以假设属于其他分布，此处有主观意识影响），然后通过高斯模型来解决问题。

Generative Model

在这里插入图片描述

最大化 Likelihood

在这里插入图片描述

求出 μ 和 ∑
在这里插入图片描述

用了所有feature ，结果还是坏掉了

在这里插入图片描述

考虑给两个Model 公用 covariance matrix，这样就只需要较少的 parameters（不容易 overfitting）

在这里插入图片描述

求出 μ 和 ∑

在这里插入图片描述
发现公用 ∑ 后，此时的 boundary 是线性的，正确率提高了很多。

Three Steps

所以总结为以下 3 步：
在这里插入图片描述

Naive Bayes Classifier

假设所有的 feture 是 independent，其概率就可以表示为下面的形式，这种模型属于 Naive Bayes Classifier

在这里插入图片描述

Posterior Probility

分析 Posterior Probability

在这里插入图片描述

通过公式推导发现：其最终也可以写成 $σ (w * x + b)$

Step 1: Function Set

推出来的 σ 就是 sigmoid 函数，其图像表示如下：

在这里插入图片描述
用图可表示为如下形式：

在这里插入图片描述

Step 2: Goodness of a Function

在这里插入图片描述

最大化 Likelihood 就是最小化 $- l n L (w, b)$ ，展开如下形式：

在这里插入图片描述

这种 Loss 函数就是 cross entropy 代表的含义是两个 distribution 有多接近，越小越接近

在这里插入图片描述

Step 3: Find the best function

在这里插入图片描述

在这里插入图片描述

$w$ 的 update 取决于三件事：

learning rate
$x_i$ 来自于 data
$\hat{y} - f(x^n)$ ，代表 f 的 output 与理想的目标值 $\hat{y}$ 差距有多大，离目标越远，update 的量越大

在这里插入图片描述

为什么逻辑回归不能采用 MSE 作为 Loss 函数？

在这里插入图片描述

在这里插入图片描述

当 $\hat{y} = 1$ 时，假如预测结果为 $f (x) = 0$ ，此时明明离目标值很远，但是此时的梯度值为 $0$ ！
当 $\hat{y} = 0$ 时，假如预测结果为 $f (x) = 1$ ，此时明明离目标值很远，但是此时的梯度值为 $0$ ！

Cross Entropy vs Square Error

在这里插入图片描述

如果逻辑回归问题用 square error 时，可能出现在远处梯度就为 0 的情况，而不能更新。

Discriminative vs Generative

Discriminative Model 就是直接定义函数，然后优化函数的 Model，让机器自己找 distribution。
Generative Model 是先假设一个 distribution，然后再求出参数值 (μ 和 ∑) 带入 Model。

在这里插入图片描述

准确率有所不同

在这里插入图片描述

Generative Model 做了一些假设

举例：

此例子下用 Generative Model 得到 data1 的几率小于 0.5（因为 Navie Bayes Model 假设两个 feature 独立）
在这里插入图片描述

在 training data 少的时候，Generative Model 可能表现更好，不容易被噪点影响。

在这里插入图片描述

Multi-class Classification

多分类可以用如下模型解决
softmax 也可以通过 Gaussain Model 推导出来

在这里插入图片描述

多分类问题 Loss 函数也可以用 Cross Entropy 定义

在这里插入图片描述

Limitation of Logistic Regression

下面这种情况逻辑回归解决起来很难。

在这里插入图片描述

在这里插入图片描述

所以我们可以考虑对特征 (feature) 进行转换，然后再用逻辑回归解决

在这里插入图片描述
可以将 logistic regression models 多个 cascading 起来，让机器自己找 feature transformation

在这里插入图片描述

机器找出来的情况如下：

在这里插入图片描述

可以把这些 Logistic Regression 叠在一起，某一个 Logistic Regression 可以是其他 Logistic Regression 的 output。

在这里插入图片描述

可以给这个 Model 一个新名字：Neural Network (Deep learning)

猜你喜欢

转载自blog.csdn.net/qq_46456049/article/details/126175836

线性回归与逻辑回归 (logistic regression and linear regression)

linear regression & logistic regression

手推线性回归与逻辑回归（两个LR，linear regression；logistic regression）

从线性回归（Linear regression）到逻辑回归（logistic regression）再到Softmax

再读线性回归 Linear Regression (逻辑回归)

线性回归（Linear Regression）

线性回归（linear regression)

线性回归linear regression

逻辑回归 Logistic Regression

逻辑回归（Logistic Regression）

Logistic Regression 逻辑回归

逻辑回归 — Logistic Regression

逻辑回归Logistic Regression

逻辑回归(Logistic Regression)

Logistic Regression（逻辑回归）

Logistic Regression(逻辑回归)

逻辑回归-Logistic Regression

逻辑回归（ Logistic regression）

Linear and Logistic Regression in TensorFlow

线性回归 Linear Regression (1)

再读线性回归 Linear Regression

线性回归模型（Linear regression）

逻辑回归(logistic regression)推导

逻辑回归（Logistic Regression）模型

Logistic regression逻辑回归笔记

逻辑回归(Logistic Regression, LR)

逻辑回归（Logistic Regression, LR）

逻辑回归（Logistic Regression）推导

[笔记]逻辑回归Logistic Regression

逻辑回归 Logistic Regression 算法

今日推荐

deepseek热度已过？

MOOC习题:“GPS数据处理”题目个人解析(C语言)

DeepSeek接入微信公众号小白保姆教程

图+语义：RDF语义处理组件Neosemantics功能列表

大语言模型Prompt工程之使用GPT4生成图数据库Cypher

大语言模型Prompt工程之使用GPT3.5生成图数据库Cypher

GPT-3.5 生成 Fabric Cypher

生成 Cypher 能力：GPT3.5 VS ChatGLM

LangChain 2 ONgDB：大模型+知识图谱实现领域知识问答

生成 Cypher 能力：MOSS VS ChatGLM

Neo4j/ONgDB 图数据库快速处理 Excel 文件

LangChain-Agents 入门指南

周排行

blog公告

Lucene：基本增删改查（Java方式）

1、类库

android环信集成单聊功能

删除数据库表数据SQL语句

rhel6.3安装Percona XtraDB Cluster 5.7时错误的解决方法

天梯赛-堆栈（线段树）

ES6原生Class

20120607

张正友标定算法原理详解

每日归档

更多

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)

2025-04-02(0)