利用sklearn对数据预处理：标准化，归一化，正则化 - 代码天地

利用sklearn对数据预处理：标准化，归一化，正则化

其他 2019-10-14 21:24:33 阅读次数: 0

一、标准化Standardization（z-score方法）：

利用公式：( x-mean(x) ) / std(x) 对具有S相同属性的数据（即一列）做标准化处理，使数据服从零均值标准差的高斯分布。这种方法一般要求原数据的分布近似高斯分布。

涉及距离度量、协方差计算时可以应用这种方法。将有量纲数据化为无量纲数据，使数据能在同一数量级上进行比较。

from sklearn import preprocessing
import pandas as pd
import numpy as np
mean=[4,3]
cov=[[2.0,5.],[1.,1.]]
x=np.random.multivariate_normal(mean,cov,7)
data=pd.DataFrame(x)

scaler = preprocessing.StandardScaler().fit(data.T) #对行做标准化处理
data_T_scale = scaler.transform(data.T)
data_scale = data_T_scale.transpose()

二、归一化Normalization（min-max scaling）

利用公式：( x-min ) / ( max-min ) 将原数据等比例缩放到[0,1]范围内。

涉及距离度量、协方差计算时不能应用这种方法，因为这种线性等比例缩放无法消除量纲对方差、协方差的影响。

min_max_scaler = preprocessing.MinMaxScaler()
data_T_minmax = min_max_scaler.fit_transform(data.T)
data_minmax = data_T_minmax.T

三、正则化

扫描二维码关注公众号，回复： 7466073 查看本文章

利用公式：x / || x ||_p ，其中|| x ||_p= ( x₁^p+...+x_n^p )^1/p.

处理结果是使同属性的样本的p范数为1.

normalizer = preprocessing.Normalizer(copy=True, norm='l2').fit(data.T)
data_T_normalize=normalizer.transform(data.T)

猜你喜欢

转载自www.cnblogs.com/pandas-blue/p/11673976.html

利用sklearn对数据预处理：标准化，归一化，正则化

使用sklearn进行数据预处理 —— 归一化/标准化/正则化

使用sklearn数据预处理 —— 归一化/标准化/正则化

使用sklearn实现数据预处理 —— 归一化/标准化/正则化

关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化

【转】关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化

Python数据预处理—归一化，标准化，正则化

数据预处理——标准化、归一化、正则化

Python数据预处理 - 归一化与标准化

数据预处理——归一化标准化

机器学习笔记3：数据预处理的规范化，归一化，标准化，正则化

【机器学习】 - 数据预处理之数据归一化(标准化)与实战分析，正则化

使用sklearn进行对数据标准化、归一化以及将数据还原

数据预处理之中心化（零均值化）与标准化（归一化）

一、数据预处理——数据归一化 & 数据标准化

Python数据预处理-数据标准化（归一化）及数据特征转换

Matlab中的数据预处理-归一化（mapminmax）与标准化（mapstd）

数据预处理-归一化与z-score标准化

【实战】数据预处理练习----标准化/归一化/独热化

数据预处理--输入归一化/标准化/放缩

机器学习数据预处理-标准化/归一化方法

Python实现数据预处理--特征标准化与归一化

机器学习之数据预处理——归一化，标准化

【机器学习】数据预处理 - 归一化和标准化

python基础编程：使用sklearn进行对数据标准化、归一化以及将数据还原的方法

Sklearn——对数据标准化(Normalization)

数据标准化（归一化）处理

数据处理：归一化与标准化

数据标准化/归一化

数据归一化（标准化）

今日推荐

周排行

例题2-6 数据统计II（多组数据的统计）

类百度富文本编辑器文件上传。

Activity setContentView主要流程

增长的核心之减少用户阻力的三大原则

分布式服务框架原理与实践

C语言-预处理、结构体

UVA11300 Spreading the Wealth【思维】

linux内核支持usb转串口，内存设备

iOS开发笔记之跳转QQ聊天页、跳转微信、应用内拨打电话

Java面试通关要点汇总集，互联网面试官如何面试

每日归档

更多

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)

2024-07-26(0)

2024-07-25(0)

2024-07-24(0)

2024-07-23(0)

2024-07-22(0)

2024-07-21(0)