Scikit-learn 数据预处理之标准化StandardScaler

其他 2021-01-30 01:24:59 阅读次数: 0

Scikit-learn 数据预处理之标准化StandardScaler

1 声明

本文的数据来自网络，部分代码也有所参照，这里做了注释和延伸，旨在技术交流，如有冒犯之处请联系博主及时处理。

2 StandardScaler简介

StandardScaler当数据(x)按均值(μ)中心化后，再按标准差(σ)缩放，数据就会服从为均值为0，方差为1的标准正态分布，该过程叫数据标准化(Standardization，又称Z-score normalization)。

应用场景：在分类、聚类、通过距离计算相似性时、使用PCA技术进行降维时。

3 StandardScaler

计算方法:

import pandas as pd
from sklearn.preprocessing import StandardScaler
data = pd.DataFrame(
    {
        'a':[1,2,3],
        'b':[5,6,6],
        'c':[9,100,2]
    }
)

#标准化(StandardScaler)，对列进行特征转换。
scale_x = StandardScaler()
scale_data = scale_x.fit_transform(data)
print(scale_data)
print("均值:",round(scale_data.mean()))
print("标准差:",round(scale_data.std()))

注：数据的矩阵形式如下：

计算过程示例版：

扫描二维码关注公众号，回复： 12408422 查看本文章

猜你喜欢

转载自blog.csdn.net/shenliang1985/article/details/112524970

Scikit-learn 数据预处理之标准化StandardScaler

Python scikit-learn，数据的预处理，标准化，StandardScaler

数据标准化——scikit-learn

python之scikit-learn

scikit-learn数据预处理

数据预处理（Python scikit-learn）

数据预处理 Scikit-learn Preprocessing

scikit-learn与数据预处理

Scikit-learn Preprocessing 预处理

使用scikit-learn进行预处理

机械学习 - scikit-learn - 数据预处理归一化与标准化- 2

Scikit-learn数据预处理之范数缩放NormalizerScaler

Scikit-Learn实战之——交叉验证

scikit-learn之线性回归

scikit-learn 之岭回归

Python之（scikit-learn）机器学习

机器学习之scikit-learn库

scikit-learn内置数据集

机器学习 scikit-learn 数据集

SciKit-Learn 加载数据集

数据的特征工程之Scikit-learn

【Scikit-Learn 中文文档】处理文本数据 - scikit-learn 教程 | ApacheCN

python 使用scikit-learn对数据进行预处理

[机器学习]Scikit-Learn学习笔记03——Scikit-Learn数据模型

【Scikit-learn】【模型预处理-2-数据整理】数据标准化调整：把数据调整为标准正态分布

python 图像预处理 Scikit-learn Preprocessing 预处理

scikit-learn中的归一化、标准化处理

Scikit-learn 数据预处理之归一化MinMaxScaler

Scikit-learn数据预处理分类变量编码之标签二值化

机器学习 scikit-learn 特征预处理

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

集成学习——LightGBM原理理解

java复制pdf并且往pdf文件中添加内容

DRF的解析器和渲染器 DRF的解析器和渲染器

pytest以函数形式的测试用例

CSS3 边框

C语言编程经典案例，三种方法求水仙花数（附完整代码）

算法题（313）

css如何让背景透明，文字不透明

linux下网络程序遭遇SIGPIPE的解决（转）

用xposed Hook框架Hook 安卓apk的按钮Id

每日归档

更多

2025-04-13(999)

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)