sklearn中的StandardScaler

sklearn

面向机器学习的python开源框架。
sklearn官方网站
sklearn中文网


sklearn.preprocessing.StandardScaler

  通过去除均值并缩放到单位方差来标准化特征。
  公式如下:
    $z = \frac{x-\mu}{\sigma}$
   其中,$\mu$是训练样本的平均值,$\sigma$是训练样本的标准差。

from sklearn.preprocessing import StandardScaler
StandardScaler(copy=True, with_mean=True, with_std=True)


  • 参数:
      copy: 布尔值,默认为True.
        如果为False,则就地缩放,不生成新对象。
      with_mean: 布尔值,默认为True.
        如果为True, 则在缩放之前尝试将数据居中。
      with_std: 布尔值,默认为True.
        如果为True, 则将数据缩放到单位方差。

  • 属性:
      scale_: ndarray or None
        每个特征的数据相对缩放。
      mean_: ndarray or None
        训练集中每个特征的平均值。
      var_: ndarray of None
        训练集中每个特征的方差。
      n_samples_seen_: int or array
        为每个特征处理的样本数。没有缺失值的话为整数,否则为数组。

  • 方法
      fit(self, X, y=None)
        计算均值和std用于以后的缩放。
      fit_transform(self, X, y=None, **fit_params)
        计算均值和std,然后对其进行转换。
        参数:
          X: numpy数组,训练集。
          y: numpy数组,目标值。
          **fit_params: dict, 其他拟合参数。
        返回值:
          numpy数组,转换后的数组。
      get_params(self, deep=True)*
        获取此估计量的参数。
      inverse_transform(self, X, copy=None)
        将数据按比例缩放到原始形式
      partial_fit(self, X, y=None)
        在线计算X上的平均值和std, 以便以后缩放。
      set_params(self, **params)
        设置此估算器的参数。
      transform(self, X, copy=None)
        通过居中和缩放来执行标准化。

猜你喜欢

转载自www.cnblogs.com/pal-duan/p/12697924.html