python机器学习-chapter3_1

•数据预处理的几种方法:

StandardScaler:确保每个特征的平均值为0,方差为1,使得所有特征在同一量级。但不能保证特征任何特定的最大值和最小值。

RobustScaler:与StandardScaler类似,确保每个特征的统计属性在同一范围,但使用中位数和四分位数。会忽略数据中的异常值。

MinMaxScaler:移动数据,使得所有特征刚好在0到1之间。

Normalizer:对每个数据点进行放缩,使得特征向量的欧式长度等于1.即将数据投射在半径为1的圆上,对与更高维的数据,是投射在球面上。适用于数据的方向或角度是重要的,而特征向量的长度无关紧要。

猜你喜欢

转载自www.cnblogs.com/bozi/p/12369272.html
今日推荐