大数据分析中,数据处理之数据归一化

数据处理之数据归一化

为了方便数据处理,通常将数据映射到0~1范围之内,可以使处理过程更加便捷、快速。把有量纲表达式变换为无量纲表达式,成为纯量。该方法实现对原始数据的等比例缩放。通过利用变量取值的最大值和最小值(或者最大值)将原始数据转换为界于某一特定范围的数据,从而消除量纲和数量级影响,改变变量在分析中的权重来解决不同度量的问题。
主要算法有:线性转换、对数函数转换、0 均值标准化(Z-score方法)
下面介绍三大算法的主要公式!!

三大归一化数据处理算法

线性转换

线性比例变换,计算公式如下:
在这里插入图片描述
此处x*表示处理之后的数据,x表示原始数据(下同)

对数函数转换

在这里插入图片描述
上式中,max 表示样本数据中的最大值。

0 均值标准化(Z-score方法)

在这里插入图片描述
上式中,xi表示样本数据,mean(x)表示样本数据平均值,σ表示样本数据的标准差。

猜你喜欢

转载自blog.csdn.net/qq_38101190/article/details/82954168