Scikit-learn 数据预处理之鲁棒缩放RobustScaler

                             Scikit-learn 数据预处理之鲁棒缩放RobustScaler

1 声明

本文的数据来自网络,部分代码也有所参照,这里做了注释和延伸,旨在技术交流,如有冒犯之处请联系博主及时处理。

2 RobustScaler简介

RobustScaler通过中位数和四分位距来缩放。使用于对异常值比较敏感的情况。

应用场景: 离群值较多的数据时。

3 RobustScaler

import pandas as pd
from sklearn.preprocessing import RobustScaler
data = pd.DataFrame(
    {
        'a':[1,2,3],
        'b':[5,6,6],
        'c':[9,100,2]
    }
)
print(data.values)

robustlizer = RobustScaler(quantile_range=(25.0, 75.0))
robustlizer_data=robustlizer.fit_transform(data)
print(robustlizer_data)

 

计算方法:

 

注:这里以第三列的特征为例。

这里的数据矩阵形式如下:

猜你喜欢

转载自blog.csdn.net/shenliang1985/article/details/112525250