1、1兰州市居民阅读指数抽样调查方案的设计摘要:国民阅读对提高国民综合文化素质有着重要的作用。大力促进城市文化已经成为各地政府提升本地城市气质的必经之路。文章提出了一套用于调查兰州市居民阅读指数的抽样调查方案。首先构建了兰州市居民的抽样框,然后用 PPS 法对抽样框进行抽样,最后确定了样本量,并给出了具体的实施步骤,供实际调查进行调查。 关键词:兰州市居民;阅读指数;抽样调查;PPS;样本量 中图分类号:C813 文献标识码:A 文章编号:1674-1723(2013)03-0203-02 一、引言 书籍是人类精神文明成果的一种保存形式,而阅读是享用这些成果并把它们据为己有的过程,无论什么时代,其
2、重要性一直在人类文明发展进程中占据着重要的位置。 对个人而言,阅读不仅可以调节高度紧张的身心,消除工作疲劳,还可以获得新的审美感受和生存启示,使自己的精神境界和思想得到提升。对城市而言,阅读时一种公共文化生活,是一个城市的内在气质。城市文化生活习惯的优化,不仅可以改善社会环境,还可以促使城市更加包容,更加涵养。 二、兰州市居民阅读指数抽样的整体说明 (一)调查目的 2为了了解兰州市居民的阅读现状,我们从兰州市居民的阅读广度,阅读深度及阅读影响因素出发,考察了兰州市居民的阅读量、阅读频率、阅读意识、阅读类型、阅读活动参与状况以及阅读后的行为、评价和认知,最后综合构建为居民阅读指数并以此来对居民的
3、阅读现状进行量化。(二)调查总体及抽样框 本次调查的目的是了解兰州市居民的阅读现状,考虑到年龄太小的孩子阅读缺乏一定的独立性和主动性。中学阶段的孩子课业负担比较沉重,没有空余时间去阅读除学习资料外其他的阅读读物,需要对上述群体进行单独调查。鉴于另外调查的费用和时间,我们将目标总体界定为“18 至 70 周岁之间的兰州市居民” 。 本次调查的抽样框根据甘肃省统计年鉴及兰州市街道划分资料编制。 (三)抽样的总思路 本文设计的兰州市居民阅读指数抽样调查的整体方案如下:首先构建城市街道的抽样框(见附件一) 。然后进行多阶段抽样。第一阶段:用PPS 法抽取城市街道(包括街道和乡镇) ;第二阶段:用等距抽
4、样方法抽取住户;第三阶段:以 KISH 表随机选取的家庭成员为最终样本。整体方案的流程图如图 1 所示。 图 1 三、抽样设计与估计方法研究 (一)样本的抽取 3第一阶段:PSS 法抽取样本街道。出于对费用和便于操作的考虑,我们对样本街区固定抽取 n1 个样本,n1=n/N,其中 n 为总样本量;N 为需要抽取的街道数量,在这里我们抽取兰州市 50%的街道,即 55 个街道。具体操作如下: 1.按照 n/M=p()(n1/B() )计算兰州市 109 个街道的累计百分比,其中 M 是兰州市总户数,p()是第 个街道被抽中的概率,B()是第 个街道的户数。 2.对每个街道确定与它相对应的代码范围
5、,该代码范围与其累计百分比相对应。 3.抽取一个服从0,1均匀分布的随机数,该随机数相应的代码范围中的单元即为入样街道。 4.重复 55 次,直到抽得 55 个单元为止。 说明:如果第 个街道抽中一次,该街道的样本量 n1,如被抽中两次,该街道的样本量为 2n1 。 第二阶段:等距抽样抽取样本家庭,具体步骤如下: 1.计算抽样间距 k=B()/ n1。 2.将 B()个单元按照某周顺序依次编号 1,2b。 3.从 1k 个单元编号中随机抽出一个单元编号,假设为 r。 4.每隔 k 个单元编号抽出一个单元编号,直到抽出 n1 个单元。 说明:如果 k 不为整数,对 r+ik(i=1,2n)取整,
6、将取整后数值所对应的单元编号作为样本单元。 第三阶段:以 KISH 表随机选取的家庭成员为最终样本,kish 表见附4件。 1.随机分派抽样表。 2.填写住户成员情况。 3.根据抽样表抽取被访问者。 (二)样本的估计 本次研究采用的抽样方法为多阶段分层不等概率抽样,用到了包括PSS 抽样,等距抽样,KISH 表抽样。由于各阶段抽样方法不一样,进行最终统计推断是十分复杂。为了简化参数的估计计算过程,我们将抽样过程化为两个阶段:初级抽样单元(PSU) ,即抽取到的街道,二级抽样单元(SSU) ,即抽取到的最终样本-个人。 根据方差分析原理,对总体进行分层后,总体方差可以分解为两部分,一部分是层间方
7、差,一部分是层内方差。初级抽样单位 PSU 之间的方差为层间方差;二级抽样单位 SSU 之间的方差为层内方差。两个层的方差估计过程如下: 第一阶段,街道的选取,采用的是 PPS 抽样。PPS 抽样的估计,可直接应用汉森赫维茨估计量的公式进行计算。具体计算过程如下: 记 Yij 为总体的第 i 个群中第 j 个次级单元的观测值(i=1,2N;j=1,2MI ) ,其中 Mi 是群的大小。Yij 为样本中第 i 个群中第 j 个次级单元的观测值(i=1,2n;j=1,2mI ) ,其中 mI 是群的大小。 总体总量 Y 的估计量为 总体总量估计量的方差估计量 2 5其中 , (Mi 是分层抽样中群
8、的大小,M0 是总体中所有群大小之和) 第二阶段,从抽到的街道中抽选访问的个体。这个过程分成了二个阶段,从街道抽取住户采用等距抽样,从户中抽取最终访问的样本采用Kish 表抽样。在这一阶段中虽然采用了两种抽样方法的结合,但这两种方法组合的抽样原理基本可以认为与分层随机抽样一致。因此在这一阶段,我们采用分层随机抽样的统计推断方法来对总体进行估计。 在抽中的 PSU 所含的全部 M i 个 SSU 中抽取 m i 个,总体方差的估计公式为: 其中为第 i 个 PSU 中的 SSU 之间的方差。 本文中总体的方差为以上两个方差之和,即 2+2 四、样本量的确定与分配 (一)初始样本量 按简单随机抽样
9、时,在置信水平为 95%下,我们假定抽样误差为 4.0%。样本量计算公式如下: 其中 n 代表所需样本量,Z 代表置信水平下 Z 统计量,95%置信水平下 Z 统计量为 1.96;P 代表相对误差;V 代表变异系数,通常保守的估计值为 0.5 左右。 根据上述公式计算出,所需样本量为 600。 (二) 对总体大小进行调整 由于上式忽略了总体校正因子,所有对上式用如下公式进行调整。 由统计资料可知,兰州市拥有住户 8727784 户,由此我们发现调整6后,我们的样本量依然约等于 600。 (三)依据抽样设计和无回答率对样本进行调整 由于我们的抽样设计不是简单随机抽样,我们用设计效应对其进行调整,
10、这里我们假定设计效应(deff)为 2;为了达到调查抽样估计值要求的精度,我们需要根据预计的回答率调整样本量的大小,根据预计的回答率确定一个较大的样本才可能达到精度要求,本文假定回答率(t)为 50%。这样最终的样本计算公式为 根据上式,我们可以确定,我们最终需要 2400 个样本。 注:抽样误差,设计效应以及回答率可通过预调查来计算其准确数值。 (四)样本分配 在该方案中,由于我们的方法为固定街道样本量,所以总样本量在抽中的街道中按抽中的次数平均分配,如抽中一次,该街道的样本量为44;如被抽中两次,该街道的样本量为 88。 作者简介:吴洁琼(1989-) ,女,内蒙古人,就读于兰州商学院,硕士,研究方向:抽样调查;崔冠男(1988-) ,女,辽宁人,就读于兰州商学院,硕士,研究方向:抽样调查;庄秀权(1986-) ,男,黑龙江人,就读于兰州商学院,硕士,研究方向:国民经济核算。