样本容量的确定

样本容量:

样本中个体的数目或组成抽样总体的单位数。

必要样本容量

亦称必要样本单位数,是指满足调查目的要求的情况下,至少需要选择的样本单位数。

一、估计总体均值时样本容量的确定

1.重复抽样

一旦确定了置信水平(1-α),Zα/2的值就确定了,对于给定的的值和总体标准差σ,就可以确定任一希望的允许误差所需要的样本容量。令E代表所希望达到的允许误差,即:


由此可以推到出确定样本容量的公式如下:


2.重复抽样


样本容量 n 与总体方差成正比
绝对误差成 反比,
概率度成正比。

例:拥有MBA学位的研究生年薪的标准差大约为4000 元,假定想要估计年薪95%的置信区间,希望允许误差为10000 元,应抽取多大的样本容量?


二、估计总体比例时样本容量的确定

1.重复抽样

一旦确定了置信水平(1-α),Zα/2的值就确定了。由于总体比例的值是固定的,所以允许误差由样本容量来确定,样本容量越大允许误差就越小。估计的精度就越好。因此,对于给定的π,就可以确定任一希望的允许误差所需要的样本容量。令E代表所希望达到的允许误差,即:

由此可以推导出重复抽样和无限总体抽样条件确定样本容量的公式如下:

2.重复抽样

d 的取值一般小于 0.1
π 未知,以样本比例 p 替代
π p 都未知时,可取 0.5 ,这是一种谨慎估计

某社区想通过抽样调查了解居民参加体育活动的比率,如果把误差范围设定在5%,问如果以95%的置信水平进行参数估计,需要多大的样本?


影响样本容量n的因素

a) 总体个单位之间的差异
b) 概率保证程度
c) 允许误差的大小
d) 抽样方式
e) 抽样的组织形式


确定样本容量的注意事项

一、在实际中采用不重复抽样,但常用重复抽样下的公式代替;

二、若和p未知,其处理方式是:

        1.用过去近期的数据代替,

        2.用样本数据代替,

        3.p=0.5或最接近0.5的值;

三、对同一总体,若求出的NxNp不等,这时取较大的作为必要样本容量,

        以同时满足做两种调查的需要;

四、在实际工作中,常使用重复抽样下的简单随机抽样公式。

猜你喜欢

转载自blog.csdn.net/Rosa_zz/article/details/79562794