1.2 常见统计分析软件简介
Matlab和Python等语言也常常成为许多统计分析工作者喜爱的数据分析软件。
1.3 spss统计分析软件的历史
分布于通信、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领悟和行业。
1.5 spss统计分析软件的特点
1.操作简单 2.无需编程 3.功能强大 4.方便的数据接口 5.灵活的功能模块组合 6.与其他程序的无缝结合
1.9 spss的界面
1.数据编辑窗口 2.结果管理窗口 3.结果编辑窗口
1.1 统计分析的基本概念
统计学是研究收集数据、整理数据、总结和分析数据中所蕴含的信息,并且据此得到结论以解决特定问题或辅助决策的一门科学。
统计学研究的对象是数据,数据的一个重要特征是他的变动性,并且寻找和理解引起数据变化的原因。
统计学研究的对象的全体所组成的集合称为总体。
总体中有代表性的一个子集合进行研究,该子集称为样本
。
统计学上常常通过一些数值指标来描述总体的特征,这些指标称为总体的参数。
统计学可以分为描述性统计和推断性统计。描述性统计主要进行数据的整理和汇总。
推断性统计是关于把从样本数据中得到的结论推广到总体,并衡量结果应用与总体数据的可靠性的方法集合。
统计分析是指应用统计学的概念和方法对数据进行分析和汇总,得出结论,从而辅助决策的过程。统计学为统计分析提供理论依据和方法论。
统计分析的步骤
1.认识研究的问题,明确研究目标。
2.收集和研究目标有关的数据。
3.对数据进行描述性统计分析。
4.进行推断统计
5.应用分析结果进行决策。
数据的类型
个体的特征成为变量。每个个体的特征的具体取值即为该变量的观测值,既数据。
定量变量又分为离散变量和连续变量。离散变量的所有可能的取值是有限的。
连续变量理论上任何两个取值之间都有无限个可能的取值。
根据变量的类型,统计数据也有相应浮梁驰渡。定性变量对应的数据的度量水平为分类数据,根据取值是否具有内在的大小关系,分类数据又分为名义数据和有序数据。定量变量对应的数据的度量水平为尺度数据,尺度数据又可以细分为区间数据和定比数据。
数据的度量水平决定了数据中所蕴含信息的数量,并决定了对数据进行分析时可以采用的汇总和统计分析方法。
名义数据。当数据被用来标记或者命名个体的特征时,数据就是名义数据。
有序数据又称为定序数据。如果一个名义数据可以进行有意义的排序,则该名义数据为有序数据。
横截面数据是指在 同一个时间点或者接近同一时间点收集的不同对象的数据。
时间序列数据是指同一对象在不同的时间点连续观察所收集的数据。
面板数据又称为纵向数据,或者称为时间序列-横截面数据。
数据的来源
1.观测数据
2.实验数据