1、第三次国家卫生服务调查西部扩大调查 抽样方案北京大学公共卫生学院陈育德省 级代表性抽样方法n 基本抽样单位:乡镇和街道 n 每省分别抽取 30个乡镇和 30个街道n 每个乡镇 /街道分别抽 2个行政村 /2个居委会n 每个村 /居委会随机抽 33户(考虑到失访或拒绝调查每个村或居委会可多抽 3-5户作为备选户)n 合计:每个省共抽取调查住户 3960户 多阶段分层整群系统随机抽样方法 表阶 段 抽 样单 位 数量 方法第一 阶 段 从各地(市)中抽取 乡镇、街道 30+30 系 统 抽 样第二 阶 段 从 乡镇 、街道中抽取村、居委会 2+2 配 额 ( 经济 、地域) 简单 随机抽样第三 阶
2、 段 从村、居委会中抽取 户 33+33 系 统 抽 样第一阶段:确定抽样乡镇 /街道n 样本总体:本次调查的样本街道是在地级市和省会城市的街道(剔除了国家样本街道)中抽取,样本乡镇是在剔除了国家样本乡镇后在全省所有其他的乡镇中抽取。 抽样方法n 将全省(市)内乡镇、街道 (剔除国家样本乡镇、街道 ),按其名称第一个字的拼音字母顺序,地(市)分别排序编号,参加抽样。n 分别计算各地(市)内乡镇、街道的抽样数:即 30本地(市)参加抽样乡镇、街道数 /全省(市)参加抽样乡镇、街道总数n 确定各地(市)的抽样间隔:即本地(市)参加抽样的乡镇、街道数 /本地(市)应抽乡镇、街道数n 确定抽样乡镇:随
3、机抽一张人民币。取其末四位数,该数除以抽样间隔的余数为 K值, K抽样间隔。 K值为被抽第 1个样本乡镇、街道编号; K值加抽样间隔为第 2个样本乡镇、街道编号;K值加 2个抽样间隔为第 3个样本乡镇、街道编号,以此类推。抽样方法实例n 某省共有 1650个乡镇(均非国家样本乡镇),其中某地(市)有 105个乡镇,则该地(市)应抽: 30 105 / 1650 = 2 个乡镇n 该地(市)的抽样间隔为: 105 / 2 50n 随机抽取的人民币后四位数: 6332, 6332 / 50=126 余数为 32n 即 K值 = 32n 则第一个抽样乡编号为 32,第二个抽样乡编号为32+50=82
4、号。某省某地 (市 )调查乡镇抽样记录 乡镇 名称 拼音字母编 号抽 样结 果编 号乡镇 名称 拼音字母编 号抽 样结 果编 号安仁 乡 1 石板 乡 54白 马乡 2 响水 乡 55 - - - - 30 - 81- 31 - 82 2. 第二个抽样乡- 32 1. 第一个抽样乡- - - - 53第二阶段:确定样本村、居委会n 确定样本村1、将样本乡镇的村,按经济水平分为等量的两组,并编号;2、用单纯随机(抓阄)的方法在两组内,各抽一个村。n 确定样本居委会在样本街道中随机抽取(抓阄)两个居委会第三阶段:确定抽样住户n 1、将样本村、居委会内全部住户(包括非本地户口住户)名单编号;n 2、
5、确定抽样间隔:本村、居委会内户数 / 33n 3、确定抽样住户:首先随机抽一张人民币,取其末四位数,该数除以抽样间隔后的余数确定为 K值,要求 K抽样间隔。n K值为被抽第 1个住户编号, K 值加抽样间隔为被抽中的第二个住户编号, K值加两个抽样间隔为第 3个被抽住户编号,n 以此类推。实例n 1、某样本村内共有住户 109户,编为 001 109号n 2、确定抽样间隔 109户 / 33 = 3.3 3n 3、随机抽取的人民币后四位数: 7832,7832/3 =2610 余数为 2。 即 K值 = 2 n 则该村第 2, 5, 8, 11, 14, 17, 20, 23, 26,29, 32, 35, 38, 41, 44, 47, 50, 53, 56,59, 62, 65, 68, 71, 74, 77, 80, 83, 86,89, 92, 95, 98共 33户。n 说明:计算抽样间隔为 3.3,但为了便于操作,则取3,这样使实际抽样间隔人为变小,到第 98号即抽满33户,多余的第 101, 104, 107共 3户则删去。