《人人都会数据分析》笔记:数据的集中趋势描述

数据的集中趋势描述:

寻找反映事物特征的数据集合的代表值或中心值。

算数平均值:最常用的数据集中趋势指标

(1)算数平均值:数据集合中所有数值的加和除以数值个数。

         不足:当数据集合中出现异常值(极大值或极小值)时,算数平均值不适用。

例如:国家公布的人均年收入数据,一些极端的高收入人群拉高了算数平均值。

(2)几何平均值:

当数据之间不是加减关系而是乘除关系时使用。例如:银行的平均存款年利率、工厂每条生产线

上的平均产品合格率。

众数:数据集合中出现频率最高的数

适用:定类数据、以及数据可视化能划分为两组或以上时。

中位数:适用于在数据集合存在异常值的情况。

(有极大值,向右偏移;极小值,向左偏移)

猜你喜欢

转载自blog.csdn.net/weixin_44649331/article/details/89210329