sklearn.preprocessing.scale简介
转载自: sklearn preprocessing (预处理).
函数:sklearn.preprocessing.scale(X, axis=0, with_mean=True, with_std=True, copy=True)
作用:数据标准化
公式:(X-X_mean)/X_std 计算时对每个属性/每列分别进行。
原理:将数据按其属性(按列进行)减去其均值,然后除以其方差。最后得到的结果是,对每个属性/每列来说所有数据都聚集在0附近,方差值为1。
参数名称 | 参数意义 | 默认值 |
---|---|---|
X | 待处理的数组 | 默认 |
axis | 处理哪个维度,0表示处理横向的数据(行), 1表示处理纵向的数据(列) | 0 |
with_mean | true是表示使均值为0 | True |
with_std | true表示使标准差为1 | True |
代码片
from sklearn import preprocessing
import numpy as np
if __name__ == '__main__':
X = np.array([[1., -1., 2.], [2., 0., 0.], [0., 1., -1.]])
X_scaled = preprocessing.scale(X, axis=0)
print(X_scaled)
# scaled之后的数据零均值,单位方差
print(X_scaled.mean(axis=0)) # column mean: array([ 0., 0., 0.])
print(X_scaled.std(axis=0)) # column standard deviation: array([ 1., 1., 1.])