易初大数据-2019-10-10

                     1.2  常见统计分析软件简介

Matlab和Python等语言也常常成为许多统计分析工作者喜爱的数据分析软件。

                    1.3  spss统计分析软件的历史

分布于通信、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领悟和行业。

                   1.5  spss统计分析软件的特点

1.操作简单  2.无需编程  3.功能强大  4.方便的数据接口  5.灵活的功能模块组合  6.与其他程序的无缝结合

                     1.9  spss的界面

1.数据编辑窗口  2.结果管理窗口  3.结果编辑窗口

                     1.1  统计分析的基本概念

统计学是研究收集数据、整理数据、总结和分析数据中所蕴含的信息,并且据此得到结论以解决特定问题或辅助决策的一门科学。

统计学研究的对象是数据,数据的一个重要特征是他的变动性,并且寻找和理解引起数据变化的原因。

统计学研究的对象的全体所组成的集合称为总体。

总体中有代表性的一个子集合进行研究,该子集称为样本

统计学上常常通过一些数值指标来描述总体的特征,这些指标称为总体的参数。

统计学可以分为描述性统计和推断性统计。描述性统计主要进行数据的整理和汇总。

推断性统计是关于把从样本数据中得到的结论推广到总体,并衡量结果应用与总体数据的可靠性的方法集合。

统计分析是指应用统计学的概念和方法对数据进行分析和汇总,得出结论,从而辅助决策的过程。统计学为统计分析提供理论依据和方法论。

                    统计分析的步骤

1.认识研究的问题,明确研究目标。

2.收集和研究目标有关的数据。

3.对数据进行描述性统计分析。

4.进行推断统计

5.应用分析结果进行决策。

                 数据的类型

个体的特征成为变量。每个个体的特征的具体取值即为该变量的观测值,既数据。

定量变量又分为离散变量和连续变量。离散变量的所有可能的取值是有限的。

连续变量理论上任何两个取值之间都有无限个可能的取值。

根据变量的类型,统计数据也有相应浮梁驰渡。定性变量对应的数据的度量水平为分类数据,根据取值是否具有内在的大小关系,分类数据又分为名义数据和有序数据。定量变量对应的数据的度量水平为尺度数据,尺度数据又可以细分为区间数据和定比数据。

数据的度量水平决定了数据中所蕴含信息的数量,并决定了对数据进行分析时可以采用的汇总和统计分析方法。

名义数据。当数据被用来标记或者命名个体的特征时,数据就是名义数据。

有序数据又称为定序数据。如果一个名义数据可以进行有意义的排序,则该名义数据为有序数据。

横截面数据是指在 同一个时间点或者接近同一时间点收集的不同对象的数据。

时间序列数据是指同一对象在不同的时间点连续观察所收集的数据。

面板数据又称为纵向数据,或者称为时间序列-横截面数据。

                        数据的来源

1.观测数据

2.实验数据

猜你喜欢

转载自www.cnblogs.com/lizongsheng/p/11650235.html