为什么要对数据进行「归一化」？ - 代码天地

为什么要对数据进行「归一化」？

企业开发 2023-09-17 01:50:46 阅读次数: 0

看别人做数据分析/训练模型的时候，总会看到在数据预处理阶段有一步「数据归一化」，scikit-learn代码如下：

from sklearn import preprocessing
x = ... # x为样本数据
min_max_scaler = preprocessing.MinMaxScaler()
x_new = min_max_scaler.fit_transform(x)

那么，为什么需要这样做呢？主要原因是为了数值稳定。

下面用多层感知机（MLP）来举例。

反向传播算法（BP）往往是神经网络能够“学”到知识的手段，在单层感知机中，有如下等式：

其中，w是权重，x是输入，b是偏置，σ(·)是sigmoid函数。

在形如图1的MLP中，有如下等式：

其中，上标[L-1]指第L-1层，其实挺好理解：用第L-1层的信息计算第L层。

根据反向传播推导：（用第一个隐藏层->输入x的反传过程举例）

可以看出，每一次更新都有一项wi·gi'，这就意味着：随着网络的加深，由于链式法则需要连乘wi·gi'，而每一个wi·gi'都比较大（大于1），从而出现梯度爆炸。

未进行归一化，权重变大：（红线粗细反应权重大小）

进行归一化，权重变小：

另外，权重增量dw和输入x有关系，x越大，那么dw越大，这就意味着：在梯度下降过程中，较大x的更新速度要大于较小x，从而需要更多的迭代才能找到最优解。如果把所有x归一化到相同的数值区间后，优化目标的等值图会变得更圆（下图右），从而每个x的更新速度变得更一致，更容易找到最优解：

小结：归一化实际上就是使数据的量纲保持一致，使得模型更容易训练。
————————————————
版权声明：本文为CSDN博主「Dreamcatcher风」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/Wind_2028/article/details/123341678

猜你喜欢

转载自blog.csdn.net/modi000/article/details/132318296

为什么要对数据进行「归一化」？

为什么要对数据归一化？

为什么一些机器学习模型需要对数据进行归一化？

机器学习中为什么需要对数据进行归一化？

【机器学习】为什么机器学习模型需要对数据进行归一化？

机器学习笔记：为什么要对数据进行归一化处理？

1.为什么需要对数值类型的特征做归一化？

1.1为什么需要对数值类型的特征做归一化？

为什么要对数值类型的特征做归一化，树形算法为啥不需要归一化？

为何要对数据做归一化？

每天五分钟机器学习:为什么要对样本数值类型的特征进行归一化？

为什么对数值类型的特征归一化？

为何对数据进行“中心化、归一化”处理

对数据的归一化

为什么需要对数据转换，和转换的方法

为什么要数据归一化和归一化方法为什么要数据归一化和归一化方法

为什么要进行数据归一化处理？

使用sklearn进行对数据标准化、归一化以及将数据还原

python基础编程：使用sklearn进行对数据标准化、归一化以及将数据还原的方法

为什么图像预处理要用ImageNet的均值mean和方差std进行归一化？

转载：为什么要对URI进行编码

为什么要对url进行encode

为什么要对URI进行编码？

为什么要对DLL进行签名

处理数据时不进行归一化会有什么影响？归一化的作用是什么？什么时候需要归一化？有哪些归一化的方法？

为什么要做特征归一化/标准化？

为什么要做特征的归一化/标准化？

为什么需要批归一化层

R神经网络代码（对数据有归一化和反归一化）

利用sklearn对数据预处理：标准化，归一化，正则化

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)