描述数据的“三个维度”

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/D07Qs2KxkH0KkSxEx/article/details/79161230

640?wx_fmt=png&wxfrom=5&wx_lazy=1

以下文章内容,来自草堂君的新书《人人都会数据分析-从生活实例学统计》。因为新书中增添和细化了很多知识点,所以草堂君会逐步将这些内容补充到统计基础导航页中来,帮助大家建立数据分析思维。限于篇幅,只截取书中部分内容


在社会生产和生活的各个领域,时时刻刻都在产生数据,这些数据类型不一,数量庞大。在各种偶然因素的影响下,这些数据看起来往往是杂乱无章、无迹可寻的。但是,如果有意识地对这些无序的数据进行整理和分类,并且从不同的维度进行描述,就可以从中发现影响数据变化的必然因素,这种因素就是不同领域的内在变化趋势。通过对这种趋势的研究,不仅可以了解事物的本质特征,更能掌握事物发展变化的规律,变被动为主动。


掌握数据的分类方法并对数据进行正确分类后(回顾文章:热炒的“数据”,你了解“它”吗?),下一步就是对不同类型的数据集合进行描述,得到整体数据的特征描述指标。通过特征描述指标,纵使摆在面前的数据集合体量巨大,杂乱无章,分析者也能对数据整体有清晰的了解。这就好比面对敌军的千军万马,只要对敌军的指挥官有精准的了解,就能够大概知道对面的整支军队是什么战斗力。指挥官是一支军队的灵魂,特征描述指标也就是数据整体的灵魂。


数据分析的对象主要是结构化数据,这些数据可能是连续型数据,也可能是离散型数据;可能是定类和定序数据,也可能是定距和定比数据。虽然数据的类型有很多,但是所有的结构化数据都可以从三个维度进行描述,这三个维度就是数据的集中趋势描述,数据的离散程度描述和数据的分布形态描述。如图2-6所示,在每个数据描述维度,分别包含数量不定的几个数据特征描述指标,有的指标适用于所有的数据类型,有的指标只适用于一种数据类型。

640?wx_fmt=png

接下来会对数据描述的三个维度进行详细介绍。包括数据的集中趋势描述、数据的离散程度描述和数据的分布形态描述。


温馨提示:

  • 数据分析课程私人定制,一对一辅导,添加微信(possitive2)咨询!

  • 生活统计学QQ群:134373751,用于分享文章提到的各种案例资料、软件、数据文件等。

  • 生活统计学微信交流群,用于各自行业的数据研究项目及其成果交流分享;由于人数大于100人,请添加微信possitive2,拉您入群。

  • 数据分析咨询,请点击首页下方“互动咨询”板块,获取咨询流程!

猜你喜欢

转载自blog.csdn.net/D07Qs2KxkH0KkSxEx/article/details/79161230