《抽样技术》第四版习题答案.doc

上传人:h**** 文档编号:891841 上传时间:2018-11-05 格式:DOC 页数:38 大小:1.84MB
下载 相关 举报
《抽样技术》第四版习题答案.doc_第1页
第1页 / 共38页
《抽样技术》第四版习题答案.doc_第2页
第2页 / 共38页
《抽样技术》第四版习题答案.doc_第3页
第3页 / 共38页
《抽样技术》第四版习题答案.doc_第4页
第4页 / 共38页
《抽样技术》第四版习题答案.doc_第5页
第5页 / 共38页
点击查看更多>>
资源描述

1、0第 2 章解: 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编2.1号为 164 的这些单元中每一个单元被抽到的概率都是 。10这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为 135 以及编号为 64 的这 36 个单元中每个单元的入样概率都是 ,而尚未210被抽中的编号为 3663 的每个单元的入样概率都是 。10这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为 20 300021 000 中的每个单元的入样概率都是 ,所以这种抽样是等概率的。1解:2.项目 相同之处 不同之处定义都是根据从一个总体中抽样得到的样本,然后定义样

2、本均值为。_1niy抽样理论中样本是从有限总体中按放回的抽样方法得到的,样本中的样本点不会重复;而数理统计中的样本是从无限总体中利用有放回的抽样方法得到的,样本点有可能是重复的。性质(1) 样本均值的期望都等于总体均值,也就是抽样理论和数理统计中的样本均值都是无偏估计。(2) 不论总体原来是何种分布,在样本量足够大的条件下,样本均值近似服从正态分布。(1) 抽样理论中,各个样本之间是不独立的;而数理统计中的各个样本之间是相互独立的。(2) 抽样理论中的样本均值的方差为 ,21fVySn其 中 。 在数理统计中,2_21iSYN,其中 为总体的方差。2Vyn2解:首先估计该市居民日用电量的 95

3、%的置信区间。根据中心极限定理可知,在2.3大样本的条件下, 近似服从标准正态分布, 的 的置_yEYV_Y195%信区间为 。22, 1.96,.6yzzyVyy 1而 中 总 体 的 方 差 是 未 知 的 , 用 样 本 方 差 来 代 替 , 置 信 区 间21fVySn2S2s为 。1.96,.96ffsysn 由题意知道, ,而且样本量为 ,代入可以求得_2.5,030,50nN。将它们代入上面的式子可得该市居民_213() 6.825fvysn日用电量的 95%置信区间为 。7.80,1.9下一步计算样本量。绝对误差限 和相对误差限 的关系为 。dr_drY根据置信区间的求解方法

4、可知 _1 1yYrPyYrPVy根据正态分布的分位数可以知道 ,所以 。_21yYZ2_rYVyz也就是 。2_2_2 /211rYrYSnNzSnNz 把 代入上式可得, 。所以样_29.5,06,1%,50ysr 861.752n本量至少为 862。解:总体中参加培训班的比例为 ,那么这次简单随机抽样得到的 的估计值.4PP的方差 ,利用中心极限定理可得 在大样本的条件p11fNVn pV下近似服从标准正态分布。在本题中,样本量足够大,从而可得 的 的置信195%区间为 。22,zpzVp 而这里的 是未知的,我们使用它的估计值V2。所以总体比例 的 的置信区 519.6210fVpvp

5、nP195%间可以写为 ,将 代入可2,zvzvp.3,20,0nN得置信区间为 。0.84.5解:利用得到的样本,计算得到样本均值为 ,从而估计2.5 89/14.5y小区的平均文化支出为 144.5 元。总体均值 的 的置信区间为_Y15%,用 来估计样本均值的方差 。22,yzVyzy 2fvsnVy计算得到 ,则 ,86.05s20.86.37.12f,代入数值后计算可得总体均值的 95%的置信区间21937.1.95zy为 。3.,.4解:根据样本信息估计可得每个乡的平均产量为 1 120 吨,该地区今年的粮食总6产量 的估计值为 (吨) 。Y_ 53501203.9y总体总值估计值

6、的方差为 ,总体总值的 的置信区2NfVYSn 95%间为 ,把22,Yzz 53.910,60,5,30,SnN代入,可得粮食总产量的 的置信区间为2.nfzN 195%。76,47解:首先计算简单随机抽样条件下所需要的样本量,把.带入公式 ,最后可得210,295%,68dS20/1dnNzS。06.3n如果考虑到有效回答率的问题,在有效回答率为 70%时,样本量应该最终确定为。078.59解:去年的化肥总产量和今年的总产量之间存在较强的相关性,而且这种相关关2.系较为稳定,所以引入去年的化肥产量作为辅助变量。于是我们采用比率估计量的形式来3估计今年的化肥总产量。去年化肥总产量为 。利用去

7、年的化肥总产量,今年的2135X化肥总产量的估计值为 吨。_46.RyYx解:本题中,简单估计量的方差的估计值为 =37.17。2.9 21fvysn利用比率估计量进行估计时,我们引入了家庭的总支出作为辅助变量,记为 。文化X支出属于总支出的一部分,这个主要变量与辅助变量之间存在较强的相关关系,而且它们之间的关系是比较稳定的,且全部家庭的总支出是已知的量。文化支出的比率估计量为 ,通过计算得到 ,_RyyXx2890/14.5y而 ,则 ,文化支出的比率估计量的值为_1580x_14.5098x(元) 。_46.3Ry现在考虑比率估计量的方差,在样本量较大的条件下,通 过 计 算 可 以 得

8、到 两 个 变 量 的 样221RxxfVMSEySRSn本 方 差 为 , 之 间 的 相 关 系 数 的 估 计 值 为 ,22486,9.580xsYX和0.974代 入 上 面 的 公 式 , 可 以 得 到 比 率 估 计 量 的 方 差 的 估 计 值 为 。 这 个 数 值_1.Rvy比 简 单 估 计 量 的 方 差 估 计 值 要 小 很 多 。 全 部 家 庭 的 平 均 文 化 支 出 的 的95%置 信 区 间 为,把具体22, 1.96,1.6RRRRRyzvyzvyvyvy 的数值代入可得置信区间为 。143.57,.0接下来比较比估计和简单估计的效率, ,这是比_

9、1.940.5237RVyv估计的设计效应值,从这里可以看出比估计量比简单估计量的效率更高。解:利用简单估计量可得 ,样本方差为2.10 160/iyn, ,样本均值的方差估计值为.s120N。/.219.4537fvysn4利用回归估计的方法,在这里选取肉牛的原重量为辅助变量。选择原重量为辅助变量是合理的,因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相关性,相关系数的估计值为 ,而且这种相关关系是稳定的,这里肉牛的原0.971重量的数值已经得到,所以选择肉牛的原重量为辅助变量。回归估计量的精度最高的回归系数 的估计值为 。14.5680.97.3xs现在可以得到肉牛

10、现重量的回归估计量为 ,代入数值可以得到_lryX。_159.4lry回归估计量 的方差为 ,方差的估计值为_lry _21lrlrfVyMSEySn,代入相应的数值, ,显2_1lrfvysn 2_1.lrfvs然有 。在本题中,因为存在肉牛原重量这个较好的辅助变量,所以回归估_lrvy计量的精度要好于简单估计量。第 3 章3.1 解:在分层随机抽样中,层标志的选择很重要。划分层的指标应该与抽样调查中最关心的调查变量存在较强的相关性,而且把总体划分为几个层之后,层应该满足:层内之间的差异尽可能小,层间差异尽可能大。这样才能使得最后获得的样本有很好的代表性。对几种分层方法的判断如下:(1)选择

11、性别作为分层变量,是不合适的。首先,性别这个变量与研究最关心的变量(不同职务,职称的人对分配制度改革的态度)没有很大的相关性;其次,用性别作为分层变量后,层内之间的差异仍然很大,相反,层之间的差异不是很大,因为男性和女性各自内部的职务,职称也存在很大的差别;最后,选择性别作为分层变量后,需要首先得到男性和女性的抽样框,这样会更加麻烦,也会使抽样会变得更加复杂。(2)按照教师、行政管理人员和职工进行分层,是合适的。这种分层的指标与抽样调查研究中最关心的变量高度相关,而且按照这种方法分层后,可以看出层内对于分配制度改革的态度差异比较小,因为他们属于相同的阶层,而层之间的态度的差异是比较大的。这样选

12、取出来的样本具有很好的代表性。(3)按照职称(正高、副高、中级、初级和其他)分层,也是合理的。理由与(2)相同,这样进行分层的变量选择与调查最关心的变量是高度相关的,分层后的层满足分层的5要求。所以,按照职称进行分层是合理的。(4)按照部门进行分层,是合理的。因为学校有很多院、系或者所,直接进行简单随机抽样,有可能样本不能很好地代表各个院系,最关心的变量与部门也存在一定的相关性。这样分层后,每个层的总体数目和抽取的样本量都较小,最终的样本的分布比较均匀,比简单随机抽样更加方便实施。3.2 解:设计的方案如下:第一种方案:可以按照不同的专业进行分层,但是考虑到如果在每层都抽取,不能保证每个新生的

13、入样概率相等,因为每个专业的人数比例未知,8 个人的样本量无法在每个层之间进行分配。所以采取如下方法:对所有的新生按照专业的先后顺序进行编号,使得每个专业的人的编号在一起,然后随机选取出一个号码,然后选取出这个号码所在的专业,选取出这个专业,再在这个专业的所有新生中按照简单随机抽样的方法选取出 8 个人。这样就可以保证每个人入选的概率是相等的。第二种方案:也可以按照性别进行分类,对他们进行编号,为 1800,使得男生的编号都在一起,女生的编号也都在一起,然后随机选取出一个号码,然后看这个号码所对应的性别,然后从这个性别的所有人中按照简单随机抽样的方法选取出 8 个新生。这样就可以保证所有的新生

14、的入样概率是相同的。第三种方案:随机地把所有的人分成 8 组,而且使得每组的人都是 100 个人,这样分组完成后,每个组的新生进行编号为 1100,然后随机抽取出一个号码,再从所有的小组中抽取出号码所对应的新生,从而抽取出 8 个人。3.3 解:(1) 首先计算出每层的简单估计量,分别为 ,其_123.,5.,20yy中, ,则每个层的层权分别为;12356,40,16,4NN312.0.976,0.9NWW则利用分层随机抽样得到该小区居民购买彩票的平均支出的估计量 ,代入_hstyW数值可以得到 。_20.7hsty购买彩票的平均支出的的估计值的方差为 ,此方差的估计3_221hsthfVy

15、Sn值为 ,根据数据计算可以得到每层的样本方差分别为:3_221hsthfvyWsn222194.,30.5,.6s其中 ,代入数值可以求得方差的估计值为 ,则估计的标1230n_9.4731stvy准差为 。_9.4731.08ststyv(2)由区间估计可知相对误差限满足6_11stst tstyYrPyYrPVy所以 , 。_2strzVy2_strYyz样本均值的方差为 ,从而可以2322 2111hhst hhfWSSSnN得到在置信度为 ,相对误差限为 条件下的样本量为r。2 2_2 21h hsth hWSnVyYzSNN对于比例分配而言,有 成立,那么 ,把相应h2_21hhW

16、SnrYzN的估计值和数值 代入后可以计算得到样本量为 ,相应的在各195%,10r 86n层的样本量分别为 。23126.479.6,863nnn按照内曼分配时,样本量在各层的分配满足 ,这时样本量的计hhWS算公式变为 ,把相应的数值代入后可得 ,在各层中2_21hhWSnrYZN175n的分配情况如下: 。1312,87,66nn3.4 解:(1) 首先计算得到每层中在家吃年夜饭的样本比例为,那么根据每1234560.9,.,0.9,.,0.93,0.97ppp一层的层权,计算得到该市居民在家吃年夜饭的样本比例为 。12.4%sthWp每一层中在家吃年夜饭的样本比例的方差为,则该市居民在

17、家吃年夜饭的比例111hhhhPfNnVpPnN7的方差,在 的条件下,1hhN266211hhsthNnVpWp,而其中每层的吃年夜饭的样本比例的方差的估计6211h hhPPWfnn值为 ,则样本比例的方差的估计值1hhhhhpfNvppn为 ,把相应的数值代入计算可得方差的6622111hsthhvf估计值为 ,从而可以得到该估计值的标准差为 。43.90stp0.19stp(2)利用上题的结果, ,这里的2 22 211h hsth hWSWSnVprPZNN方差是 ,在 的条件下,近似有 。21hhNSPhh2hhSP比例分配的条件下,有 成立,那么 ,把相应hW21hhWnrPzS

18、N的估 计 值 和 数 值 代 入 可 以 求 得 最 终 的 样 本 量 应 该 是 , 样 本 量 在 各 层 的263分 配 是 ,123479.3,59.,7.8nnn,42.60。568,8.6内曼分配条件下, ,则 ,代入相hhWS221hhWSnrPZN应 的 估 计 值 和 数 值 可 以 计 算 得 到 样 本 量 为 , 在 各 层 中 样 本 量 的 分 配 为56。12345536,0,17,0,39,nnn3.5 解:总体总共分为 10 个层,每个层中的样本均值已经知道,层权也得到,从而可以计算得到该开发区居民购买冷冻食品的平均支出的估计值为 。105.9sthyW8

19、下一步计算平均支出的 95%的置信区间,首先计算购买冷冻食品的平均支出的估计值的方差,其中 ,但是每层的方差是未知,则样本平均支出的方10_22hsthfVyWSn差的估计值为 ,每个层的样本标准差已知,题目中已经注明各层10_22hsthfvs的抽样比可以忽略,计算可以得到 。则这个开发区的10_2259.84hsthfvysn居民购买冷冻食品的平均支出 置信区间为195%_22,st styzvyzvy _1.96,1.96st st 代入数值后,可得最终的置信区间为 。0.63,953.6 解:首先计算简单随机抽样的方差,根据各层的层权和各层的总体比例可以得到总体的比例为 ,则样本量为

20、100 的简单随机样本的样本比例的方差为31.28hPW,不考虑有限总体校正系数, ,其中 ,2fVpSn21VpSn21NP在 的条件下,通过简单随机抽样得到的样本比例的方差为1N2 3112.061fVpSPn通过分层抽样得到的样本比例的方差为 ,但是因为不考虑有2hst fVpWSn限总体校正系数,而且抽样方式是比例抽样,所以有 成立,样本比例hhN的方差近似为 。对于每一层,分别有221hst hWSVpn,在 的条件下,近似的有 成立,有21hhNSPhhN21hhSP222130.9,.16,0.4SS样本量应该满足 ,同时这里要求分层随机抽样得到的估计的方差和简单hstWnVp9

21、抽样的方差是相同的, ,层权分别为 ,代入数值,stVp1230.,.,0.5W可以计算得到最终的样本量为 。23.869.hstSnp3.7 解 : 事 后 分 层 得 到 的 总 体 均 值 的 估 计 量 和 估 计 量 的 方 差 分 别 为_,pst pstEyYVary,估计量的方差的估计值2211hhfWSSnn21pst hfvyWsn。2s对于几种说法的判断如下:(1 )事后分层比简单随机抽样产生更加精确的结果,这个说法是错误的。从事后分层得到估计量的方差的估计值来看,它的方差不一定比简单随机抽样的要小,而且从事后分层得到的样本是利用简单随机抽样的方法得到的,只是在计算估计量

22、和估计量的方差时是按照分层随机抽样来处理,而且事后分层要求层权是已知的,但是当层权未知从而利用样本来估计层权时,就会产生偏差,事后分层不见得比简单随机抽样产生更精确的结果。(2 )事后分层比按比例分配产生更精确的结果,这个说法是错误的。从事后分层得到的估计量的方差的估计值可以看出,它的第一项就是按照比例分层抽样得到的估计量方差的估计值,公式中的第二项表示的是按事后分层时各层样本量与按照比例分层时各层样本量发生偏差所引起的方差的增量。(3 )事后分层的最优分配产生更精确的结果,这种说法是错误的。事后分层在样本量足够大的条件下是与比例分层相当的,但是在一般条件下,事后分层的精度仍然低于比例分层的,

23、那么事后分层的精度也会高于最优分配的精度。(4 )在抽样时不能得到分层变量,这个说法是正确的。事后分层在抽样时,是利用简单随机抽样的方法,在抽样时不涉及按照变量进行分层,至于按变量进行分层,是在抽样完成后,然后根据具体的变量来对样本进行分层。(5 )它的估计量的方差与真正按照比例分层随机抽样的方差差不多,只有在样本量足够大的条件下才成立。在样本量足够大的条件下,从事后分层的方差的计算公式可以看出,它的第二项会趋于 0,这时事后分层的估计量的方差和分层随机抽样的方差差不多。3.8 解:( 1) 根据简单随机抽样的公式,登记原始凭证的差错率的估计值为,在考虑到 的条件下,登记的原始凭证的差错率的估计3p%,1fN量的方差近似为 2 1ffVpSPPnn则估计量的方差的估计值为 ,计算得 ,1vp42.910vp则原始凭证的差错率的估计的标准差为 。21.70s(2 )这里,每个层的层权是事先知道的,那么利用事后分层来计算登记原始凭证的差

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 参考答案

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。