一、统计的含义
(一)什么是统计学
定义:统计学是用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。
(二)统计分析数据的方法
可分为描述统计和推断统计,两大类。
1、推断统计
是研究如何通过样本数据推断总体特征的统计学方法,内容包括参数估计和假设性检验。
2、描述统计
是研究数据搜集、处理和描述的统计学方法。内容包括如何获取研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合、概括与更新,得出所关心的数据特征。
(三)统计的应用
统计是适用于所有学科领域的通用数据分析方法,是一种通用的数据分析语言。
二、数据类型
(一)变量与数据
1、变量
从一次观察到下一次观察会出现不同的的结果,如,温度、教育程度、股市证券、职业、收入等。
2、数据
把观察到的结果记录下来就是数据。
(二)数据类型
1、定性变量(数据)
是从现象的属性来表现现象的特征。如,天气形势、职业、教育程度、产品型号、血型等。定性变量的观察结果称为定性数据。
特点:只能反映现象的属性特点,而不能说明具体量的大小和差异,只有分类特征,没有量的特征。
定性变量可分为分类变量和顺序变量。
(1)分类变量
是指反映现象分类特征的变量。如,职业、血型、性别等。分类变量的观察结果就是分类数据。
特点:
- 没有数值特征,不能对其数据进行数学计算;
- 只能用来区分事物,而不能用来表明事物之间的大小、优劣关系。
(2)顺序变量
是指类别具有一定的顺序,个人觉得是一种特殊的分类变量。如,受教育程度、产品等级、治疗效果等。顺序变量的观察结果就是顺序数据。
特点:
- 不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。
- 顺序数据的数据之间虽然可以比较大小,却无法计算相互之间大小、优劣、高低的距离。
2、定量变量(数据)
也称为数值变量,可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出具体大小和差异。如温度、收入、分数等。定量变量的观察结果称为定量数据。
特点:都是以数值的形式出现,有些数值型数据只可以计算数据之间的绝对差(绝对距离),而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差(相对距离)。
3、观测数据和实验数据
根据获取数据的方法不同,可分为观测数据和实验数据。
(1)观测数据
是对客观事物进行实地观测所取得的的数据,在数据取得的过程中一般没有人为的控制和条件约束。在社会经济问题研究中,观测是取得数据最主要的方法。
(2)实验数据
一般是在科学实验环境下取得的数据。自然科学研究中所用的数据多为实验数据。
三、数据来源与搜集数据的方法
(一)数据的来源
统计数据资料的来源主要有两种:
- 通过直接的调查或实验获得的原始数据,这是统计数据的直接来源,一般称之为原始或第一手统计数据。
- 别人调查的数据,并将这些数据进行加工和汇总后公布的数据,这是统计数据的间接来源,通常称之为次级数据或第二手间接的统计数据。
注:一切间接的统计数据都是从原始的、第一手统计数据过度而来的。
1、数据的直接来源——原始数据
搜集数据最基本的形式就是进行统计调查或进行实验活动。统计调查或进行实验就是统计数据的直接来源。
(1)统计调查
是指根据统计研究预定的目的、要求和任务,运用科学的方法,有计划、有组织的向客观实际搜集资料的过程。
通过统计调查得到的数据,一般叫做观测数据。
(2)实验法
通过实验法得到的数据就是实验数据。
在实验中往往需要将研究对象分为两个组,一个实验组,一个对照组。对实验组的输入变量加以控制或改变,对照组则不加控制。根据两组的输出结果,可以看到输入变量对输出的影响。
运用实验法的注意事项:
- 实验组和对照组的产生应当是随机的,研究对象的不同单位应当被随机的分配到实验组或对照组,而不应是经过有意识的挑选。
- 实验组和对照组应当是匹配的,也就是研究对象的背景资料应当是大体相同的,至少不要差异太大。
2、数据的间接来源——次级数据
次级数据(第二手数据)是指由他人搜集和整理得到的统计数据。
次级数据包括:
- 公开出版的统计数据,主要来自官方的统计部门和政府、组织、学校、科研机构。如:《中国统计年鉴》、《人口普查资料汇编》、《北京市统计年鉴》、《世界发展报告》等。
- 尚未公开发表的统计数据,如各企业的经营报表数据,专业调查咨询机构未公开发布的调查结果数据。
注意:如果公开引用未公开发表的数据需要征得数据所有者的同意,同时为自己发的数据负责。
(二)搜集数据的方法
包括,普查、抽样调查、统计报表、重点调查、典型调查
1、普查
(1)定义
普查是专门组织的一次性的全面调查,用来调查属于一定时点上或一定时期内的==社会现象总量。==比如:人口普查、农业普查、经济普查等。
(2)适用范围
适用于搜集某些不能或不适宜定期的全面统计报表搜集的统计资料。以摸清重大的国情、国力。
(3)特点
普查是一种全面调查,也是一次性的专门调查。
(4)优点
资料包括的范围全面、详尽、系统。
(5)缺点
普查的工作量大、耗资也多,时间周期较长,一般不宜经常举行。
2、抽样调查
(1)定义
是一种非全面调查,它是按照随机原则从总体中抽取一部分单位作为样本进行观察研究,以抽样样本的指标去推算总体指标的一种调查。
(2)特点:
- 样本单位按随机原则抽取,排除了主观因素对样本对选取样本单位的影响。
- 能够根据部分调查的实际资料对调查对象的总体数量特征进行推断,从而达到对调查总体的认识。
- 在抽样调查中会存在抽样误差,但是这个误差可以事先计算并加以控制。
(3)优点
既能节省人力、财力、物力,又可以提高资料的时效性,而且能取到比较正确的全面统计资料。
抽样调查是一种非全面的、一次性或经常性的专门调查,这种调查方法在市场经济条件下,使用非常广泛。
(4)抽样方法
主要有两种:概率抽样和非概率抽样
① 概率抽样
概率抽样是根据一个已知的概率随机选取被调查者。
常用的概率抽样形式包括:简单随机抽样、分层抽样、整群抽样、系统抽样。
A、简单随机抽样
简单随机抽样是完全随机地选择样本,是最基本的形式。
B、分层抽样
分层抽样是首先将总体分成不同的“层(或组)”,然后在每一层内进行抽样。
C、整群抽样
整群抽样是将一组被调查者视为一个抽样单位,每次抽取时抽出来的是一组(群),而不是一个个体单位。
D、系统抽样
系统抽样又称为等距抽样,是在总体的名录框中每隔一定距离抽取一个被调查者。
② 非概率抽样
非概率抽样是没有完全按照随机原则选取样本单位。
非概率抽样不能保证抽出来的部分单位(样本单位)对总体单位的代表性,不能够由样本的特征准确地推断总体的特征,但是由于该种方法简单、经济,所以也是人们常用的方法。
3、统计报表
(1)定义
统计报表是按照国家统一规定的调查要求与文件(指标、表格形式、计算方法等)自下而上的提供统计资料的一种调查方式。
国家利用统计报表定期地得到全社会的国民经济与社会发展情况的基本统计资料,是国家取得调查资料的方法之一。
(2)分类
① 按照报送范围,统计报表分为全面报表和非全面报表。
- 全面报表要求调查对象中的每一个单位均要填报。
- 非全面报表则只要求一部分调查单位填报。
② 按照报送周期,统计报表可分为月报、季报、年报。
- 月报内容简单,时效性强
- 年报则内容比较全面。
(3)统计报表的内容
① 表式
表式由国家统计部门根据研究的任务与目的而专门设计制定的统计报表表格,用于搜集统计资料。它是统计报表制度的主体。
② 填表说明
填表说明是对统计报表的统计范围、指标等作出的规定。
对于大型、国有企业来说,利用统计报表搜集数据,具有时间快、成本低的优点,但对于大量的小型、非国有经济单位来说,则难以全面采用统计报表调查。
4、重点调查
(1)定义
重点调查是在调查对象中选择一部分重点单位进行的一种非全面调查。
这些重点单位虽然数目不多,但它们具有所研究现象的总量在总体总量中占据绝大部分的特点。
(2)适用范围
当调查的任务只要求掌握事物的基本概况与基本的发展趋势,而不要求掌握全面的准确资料,而且在总体中确实存在着重点单位时,进行重点调查是比较适宜的。
(3)优点
重点调查可以节省人力、财力,而且及时。
5、典型调查
(1)定义
典型调查是一种非全面的专门调查,它是根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。
(2)作用
- 补充全面调查的不足
- 在一定的条件下可以验证全面调查数据的真实性
(3)优点
灵活机动、通过少数典型即可取得深入、详实的统计资料。
(4)缺点
由于受“有意识的选取若干有代表性”的限制,在很大程度上受人们主观认识上的影响。
典型调查必须同其他调查结合起来使用,才能避免出现片面性。
各类统计调查方法的特点对比
调查范围 | 调查时间 | 收集资料方法 | |
---|---|---|---|
普查 | 全面 | 一次 | 采访、报告或空间遥感 |
抽样调查 | 非全面 | 经常或一次 | 直接观察或采访 |
统计报表 | 全面或非全面 | 经常 | 报告 |
重点调查 | 非全面 | 经常或一次 | 报告 |
典型调查 | 非全面 | 一次 | 采访 |