1、返回5.1 不等概抽样一、概念与特点前面所学的简单随机抽样,总体中的每个单元具有同样的入样概率,它是等概率抽样。与等概率抽样对应的另一类方法是不等概抽样,也就是在抽样前赋予总体每个单元一个入样概率 .一般而言 ,每个单元的入样概率是由该单元在整体中的地位来确定的 .因此每个单元的入样概率可能是不相同的 .返回什么时候使用不等概抽样 ?实际工作中,如果遇到下面几种情况,则可以考虑使用不等概抽样:1、抽样单元在总体中所占的地位不一致2、调查的总体单元与抽样总体的单元不一致3、改善估计量不等概抽样的优点:提高估计精度 ,减少抽样误差 。返回二、不等概抽样的种类1、放回不等概抽样首先给整体的每一个单元
2、赋予一个确定的入样概率(通常是不相等的),然后在总体中对每个单元按入样概率进行抽样,抽取出来的样本单元记录后又放回总体,再进行下一次的抽样,很显然每次抽样都是独立的。返回放回不等概抽样中,最常用的是按照整体单元的规模大小来确定单元在每次抽样时的入样概率,假设总体中第 i个单元的规模度量为 ,总体的总规模为 每次抽样中,第 i个单元被抽中的概率用 表示,其中返回这种不等概抽样称作放回的与规模大小成比例的概率抽样( probability proportional to size),简称 PPS抽样。实际问题中,总体单元大小的度量往往不止一个,比如企业员工数量、产值、销售量、利润等都可以度量企业规
3、模的大小。PPS抽样的实施主要有两种方法: 代码法 和拉希里 ( Lahiri)法,下面我们用一个实例分别介绍这两种方法。返回代码数,将代码数累加得到 每次抽样都 产生一个 1, 之间的随机数,设为 m则代码 m所 对应的单元被抽中 。( 如果 不是整数,则乘以某个倍数。 )( 1)代码法在 PPS抽样中,赋予每个单元与 相等的返回10 累 计 10 代 码123456789100.614.51.513.77.815103.661.1614515137781501003660116151166303381531631667727738167151152166167303304381382531
4、53263163266766872772873873.8 738 _ _【 例 5.1】 设某个总体有 N=10个单元 ,相应的单元大小 及其代码数如下表 ,我们要在其中产生一个 n=3的样本 .返回先在 1,738中产生一个随机数为 354,再在 1,738中产生第二个随机数为 553,最后产生第三个随机 493。则它们所对应的第 5,7, 6号单元被抽中。返回( 2)拉希里法令 每次抽样都分别产生一个 1, N之间的随机数 i 及 1, 之间的随机数 m如果 则第 i个单元被抽中;否则,重抽一组( i, m ).在例 5.1中 , 在 1,10和 1,150中分别产生 ( i, m ):返回(3,121), =15 121, 舍弃,重抽;(8,50), =36 50, 舍弃,重抽;(7,77), =100 77, 第 7号单元入样;(5,127), 78 127, 舍弃,重抽;(4,77), 137 77, 第 4号单元入样;(9,60), 60 60, 第 9号单元入样。因此,第 ,7, 9号单元被抽中。