1、PPS 抽样在我国工业总产值估计中的应用摘 要:以 2010 年我国 31 个省市自治区的规模以上工业企业总产值统计数据为基础,运用 PPS 抽样、分层抽样和简单随机抽样等 3 种抽样方法,抽取了 9 个地区作为研究样本,估计了 2011 年我国工业总产值、平均工业总产值以及抽样方差,并计算了 95.45%概率保证程度下的置信区间,同时,比较了 PPS 抽样与分层抽样和简单随机抽样的效果。结论表明,在我国工业总产值的抽样估计中,由于各地区的工业总产值差异较大,PPS 抽样的效果优于分层抽样,同时也优于简单随机抽样。 关键词:抽样方法;效果比较;工业总产值 中图分类号:F2 文献标识码:A 文章
2、编号:1672-3198(2013)24-0022-03 1 抽样方法简介 1.1 PPS 抽样及其估计量 1.1.1 PPS 抽样概述 PPS 抽样法(Probability Proportionate to Size Sampling)又称按规模大小成比例的概率抽样或按容量概率抽样(PPS)法。它是多项抽样的一种,多项抽样是一种不等概抽样,设 Z1,Z2,Zn 是一组概率,按这组概率对总体中的 N 个单元进行放回抽样,每次抽中第 i 个单元的概率为 Zi,独立地进行这样的抽样 n 次,则这种不等概抽样为多项抽样。尤其在每个有说明其大小或规模的度量 Mi,则 Zi 可取 Zi=MiM0,这时
3、,每个单元在每次抽选中入样的概率与其单元规模的大小成比例。这种抽样方法被称为 PPS 抽样。 1.1.2 PPS 抽样的实施方法 PPS 抽样的实施方法主要有累积总和法、拉希里方法、规模累积等距抽选的方法、分裂法。本文拟采用规模累积等距抽选的方法。规模累积等距抽选方法的基本原理是:设总体单元数为 N,其规模度量分别为M1,M2,Mn,假定 Mi 都是整数,且有ni=1Mi=M0,这样总共有 M0个代码,每个总体单元都有一个代码的范围,其中第 i 个单元相应地有Mi 个代码。若欲抽取的样本容量为 n,则先求得等距抽样的间隔 K=M0n,然后在 1K 之间随机等概率抽取一个数,假设为 r,则 r
4、所在的单元代码区间相应的单元即为被抽中的单元。以后每隔 K 个度量值,即:r+K,r+2K,r+3K,r+(n-1)K 等数字所在的单元代码区间的相应单元,即为被抽中的单元。这种抽样方法的特点是当所有单元的度量 Mi2K时,则第 i 个单元肯定会被重复抽中。这种方法抽取样本比较容易,每个单元的被抽中概率与 Mi 的大小成比例。 1.1.3 Hensen-Hurvitz 估计量 (1)总体总量的估计 1943 年,汉森和赫维茨对 PPS 抽样提出了估计总体总量的估计量为: 3 PPS 抽样与分层抽样、简单随机抽样的效果比较 3.1 总体均值的估计效果比较 将上述 3 种抽样方法估计的总体均值结果
5、进行汇总,如表 3 所示。 从表 3 可知,在不考虑抽样调查费用的情况下,利用 PPS 抽样方法估计的总体均值为 27170.16,比分层抽样和简单随机抽样的总体均值更接近于我国各地区的实际平均工业总产值 27234.48,且 PPS 抽样估计的抽样平均误差是三者中最小的,而简单随机抽样估计的抽样平均误差是最大的。窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息,在样本容量和置信水平相同的情况下(样本容量都是 9 个地区,置信水平都为 95.45%) ,利用 PPS 抽样方法计算得到的置信区间最窄。因此,在我国工业总产值的估计中,对于总体均值的估计,PPS 抽样的效果优于分层抽样,更优
6、于简单随机抽样。 3.2 总体总量的估计效果比较 同理,将上述 3 种抽样方法估计的总体总量结果进行汇总,如表 4所示。 从表 4 可知,在不考虑抽样调查费用的情况下,利用 PPS 抽样方法估计的总体总量为 842274.80,比分层抽样和简单随机抽样的总体均值更接近于我国的实际工业总产值 844268.78,且 PPS 抽样估计的抽样平均误差是三者中最小的,而简单随机抽样估计的抽样平均误差是最大的,同时,在其他条件相同的情况下,利用 PPS 抽样方法计算得到的置信区间是最窄。因此,在我国工业总产值的估计中,对于总体总量的估计,PPS抽样的效果优于分层抽样,更优于简单随机抽样。 4 结论 利用
7、 PPS 抽样方法、分层抽样方法和简单随机抽样方法,对 2011 年我国 31 个省市自治区规模以上工业企业总产值进行估计,同时,比较 3种抽样方法的估计效果,可以看出,在不考虑抽样调查费用的情况下,无论是总体均值还是总体总量的估计,PPS 抽样的效果优于分层抽样,更优于简单随机抽样。所以,对于总体单元标志值之间差异非常大的总体进行抽样估计时,运用 PPS 抽样可以得到更好的估计效果。 参考文献 1倪佳勋.抽样调查M.桂林:广西师范大学出版社,2002. 2张玉.PPS 抽样在我国出口贸易预测中的应用J.经济研究导刊,2011, (2). 3李培军.不等概率抽样估计的原理与应用J.辽宁师范大学学报(自然科学版) ,2004, (12). 4李雪波.基于 PPS 抽样方法的我国建筑业利润总额实证研究J.经济视角,2009, (12). 5李序颖.PPS 抽样一种有效的水路运输量抽样方法J.数理统计与管理,1995, (3). 6张勇,曾玉平,汪飞星.中国农产量调查中几种可行的 PPS 系统抽样J.统计与信息论坛,2005, (3).