中国人民大学题库答案详解高等统计.docx

上传人:h**** 文档编号:1373308 上传时间:2019-02-23 格式:DOCX 页数:13 大小:61.51KB
下载 相关 举报
中国人民大学题库答案详解高等统计.docx_第1页
第1页 / 共13页
中国人民大学题库答案详解高等统计.docx_第2页
第2页 / 共13页
中国人民大学题库答案详解高等统计.docx_第3页
第3页 / 共13页
中国人民大学题库答案详解高等统计.docx_第4页
第4页 / 共13页
中国人民大学题库答案详解高等统计.docx_第5页
第5页 / 共13页
点击查看更多>>
资源描述

1、一、多项选择题1. 有关样本的分布,以下陈述正确的是:ABCA. 如果样本 X1,Xn 独立同分布来自 Gamma 分布, = 在大样本下有近似的正态分11布;( 中心极限定理 )B.如果样本 X1,Xn 独立同分布来自 N(, 2), = 在大样本情况下有精确分布11N(, 2/n);( 原分布为正态分布 )C.如果样本 X1,Xn 独立同分布来自 N(, 2),即使样本量不大, = 也服从正态分布;11( 原分布为正态分布 )D.如果样本 X1,Xn 来自任意分布,在大样本情况下,由 X1,Xn 组成的数据有近似的正态分布;( 不符合中心极限定理(样本均值) )2有关检验的 p 值,下面说

2、法正确的是: BCA. 一般为0,0.1之间的一个很小的概率; ( P 值一般 0,1) B. 接受备择假设的最小显著性水平;C. 如果 p 值小于显著性水平,则拒绝零假设; D. 样本统计量的分布函数。 ( P 值是概率值不是分布 )3. 请问以下哪些方法可以用来判断数据可能背离正态分布:BA. Q-Q 图上,如果数据和基线之间几乎吻合;( 要利用 QQ 图鉴别样本数据是否近似于正态分布,只需要看 QQ 图上的点是否近似的在一条直线附近,而且,该直线的斜率为标准差,截距为均值。 )B. Kolmogrov-Smirnov 正态检验中的统计量所对应的 p 值小于 0.05;( P 值小于 0.

3、05 拒绝原假设,即正态分布不成立 )C.对数据直方图做光滑后没有发现数据有很大的发散趋势;( 通过形状是否为正态钟形来判断 )D. 2拟合优度检验,统计量的值偏小。 ( 卡方统计量偏小则不拒绝原假设( H0:分布为正态) )4若抽样误差为 5,总体标准差为 40,如果样本量足够大,正态分布的 0.975分位数近似为 2,要估计总体均值的 95%的置信区间所需要的样本量大概为: BA 156 B 256 C 356 D 456.( n= = 4*1600/25 = 256)0.0252225.关于假设检验,给定一组独立同分布的随机样本,给定显著性水平,如下理解正确的是:DA.单边检验拒绝,双边

4、检验一定拒绝;B.双边检验接受,一定有一个单边检验是拒绝的;C.单边检验拒绝,双边检验一定拒绝。D.双边检验拒绝,一定有一个单边检验是拒绝的;( 在显著性水平一定的情况下(例如 =0.05) ,对于单侧检验时仍使用 进行统计推断,双侧检验则用 /2 进行统计推断,同样条件下双尾检测区域小、效率更低 )6某汽车生产厂家为增加某型号汽车的销售量,采用促销手段,促销一个月后,分别收集了 8 个销售点处促销前一个月和促销后一个月该车型的销售辆,如果不考虑其他影响销售量因素,仅通过观察和分析这些样本数据,是否认为这次促销有助于提高汽车的销售量。请将合适的可用于分析该类问题的检验过程选出来:C销售点代号:

5、 1 2 3 4 5 6 7 8促销前(辆): 90 83 105 97 110 78 55 123 促销后(辆): 97 80 110 93 123 84 57 110 A.两样本 Z 检验B.两样本 t 检验C.单一样本 t 检验D.单一样本 Z 检验 ( 同一样本即 8 个销售点做不同实验进行均值比较,且当前为小样本 8”或 “0),f(x,)=0(x0),f(x,)=0(x30 时二者相差很小;当n时二者重合.区别:正态分布是与自由度无关的一条曲线;t 分布是依自由度而变的一组曲线. t 分布较正态分布顶部略低而尾部稍高 .10. 解释假设检验和置信区间的区别假设检验与置信区间都是根据

6、样本信息推断总体参数,二者可相互转换,形成对偶性,都是统计推断的重要内容。主要区别:1)参数估计是根据样本统计量估计总体参数的真值;假设检验是根据样本统计量来检验对总体参数的先验假设是否成立;2)区间估计通常求得的是以样本估计值为中心的双侧置信区间,而假设检验以假设总体参数值为基准,不仅有双侧检验也有单侧检验;3)区间估计立足于大概率,通常以较大的把握程度(置信水平)1- 去保证总体参数的置信区间。而假设检验立足于小概率,通常是给定很小的显著性水平 去检验对总体参数的先验假设是否成立。 11. 统计推断与数据汇总之间有哪些重要的区别?描述统计是指统计数据的搜集、整理、显示和分析等,统计推断是利

7、用样本信息和概率论对总体的数量特征进行估计和检验等。12.中位数检验与均值 t 检验之间的区别与联系需要指出的是,我们现在处理的数据,大部分是对称的数据,数据符合或者近似符合正态分布.这时候,均值(平均数) 、中位数是一样的,从而中位数检验与均值 t 检验相同.只有在数据分布偏态(不对称)的情况下,才会出现均值、中位数的区别.所以说,如果是正态的话,用哪个统计量都行.如果偏态的情况特别严重的话,可以用中位数检验.三、计算题(25 分)(一)Hardy-Weinberg 平衡问题中,父代有两种基因 M 和 N,M 在种群中的分布为 b(1,p)现在测量到了子代基因分布为:M MN N 总量频数

8、342 500 187 1029a) 请根据这些数据求父代的 p 的极大似然估计;(10 分)b) 请给出 p 的置信区间的求解公式,并解释; (15 分)【解】a) 设父代样本 X 服从 b(1,p),L(p) = = 1(1)1 1(1)1l(p) = 1ln+(1)ln(1)= ()11 (1) 11=0最大似然估计为: = 1/由于 Hardy-Weinberg 平衡,群体的基因频率在一代一代繁殖传代中保持不变。从而子代的基因型频率分别为 2,2(1-),(1-)2,从而 2= ,= = 0.5834210293421029b)当样本数 n 足够多时父代基因 M 的频率近似服从正态分布

9、 N(p,p(1-p)/n),(-p)/ SQRT (p(1-p)/n)N(0,1) ,从而 (-p)/SQRT (1-)/n)N(0,1)从而参数 p 的置信区间为(-/2 SQRT(1-)/n), +/2 SQRT(1-)/n)(二)用 possion()分布参数 的极大似然估计的渐进分布求置信区间。【解】L()=(e - xi)/xi!= e-n xi /1!l()=-n + ln-1 1ln(!)l()=-n+ / = 0 1最大似然估计为: = /n.1当 n 充分大时,渐进正态 N( ,/n), ( -)/SQRT(/n)N(0,1)从而(-)/SQRT(/n)N(0,1)从而参数

10、 的置信区间为(-/2 SQRT(/n), +/2 SQRT(/n)(三) X1, X2, ,Xn 是从两点分布 Bernoulli(1,p)中抽取出来的独立同分布样本:1. 求 (1-p)2 的极大似然估计(10 分) 。2. 1 中的估计量是无偏估计吗?如果是有偏的,请给出(1-p) 2 的一个无偏估计。 (15 分)【解】1. 设总体 X 服从 b(1,p),L(p) = = 1(1)1 1(1)1l(p) = 1ln+(1)ln(1)= ()11 (1) 11=0最大似然估计为: = = 1/(1-p)2 的最大似然估计为(1-) 2=(1-)22. n = b(n,p)1E(n)=n

11、p,D(n)=np(1-p),/E(2)=(E()2+D(), 而 D()=D(X)/nE(1-)2=E(1+2-2)=1+ p(n-1)p+1)-2p 1=(1-p)2+ - 2是有偏估计,其中(1-) 2=1-S2 为无偏估计,事实上:E(1-)2)=1-E()-E(S2)=1-p- E( - n2)=(1-p)2 11 12(四)X 1,Xn是从正态分布 N(, 2)中抽取的独立随机变量,请回答1)计算 E( S2/ 2) ,S 2 是样本方差;(10 分)2)请在所有的形式为 aX1+bX2 的估计量中,找到 2 的最小方差无偏估计;(10分)【解】 (1)S 2= 111()2= 1

12、1(122)E(Xi2)= 2+2,E(2)= 2/n+2E( S2/ 2)= / 2 = 1 11(1(2)(2)(2)E(aX 1+bX2)=(a+b)=2V(aX1+bX2)=(a2+b2) 2当 a+b=2 的条件下,a=b=1 方差最小,使得(a 2+b2) 2 最小,X1+X2 为 2 的最小方差无偏估计。四、论述题:(25 分)(一)研究者想了解某种电子设备产品在一年的各个季节里被购买的情况是否存在不同。如果用销售量来解释这一问题,对这一问题可能提出的最简单的零假设可能是什么?在这一假设之下,研究者调查了有关这种产品过去 3 年的销售量 2070 万台。表 1 某种电子设备产品在

13、过去 3 年中的销售量季节 O(万) E Oi-Ei (Oi-Ei)2 ()2春季 495夏季 503秋季 491冬季 581总计 20701解释表头字母的含义;2请将上面的表格填写完整。2如果 2(3,0.95)=7.81,请给出你的推断过程和据此可能的结论。解:1.这一问题可能提出的最简单的零假设可能是 H0:各个季节里被购买的情况是相同。O 表示各个季度观察次数,E 表示各个季度的理论次数, 表示卡方统计量。()22.季节 O(万) E Oi-Ei (Oi-Ei)2 ()2春季 495 517.5 -22.5 506.25 0.98夏季 503 517.5 14.5 210.25 0.4

14、1秋季 491 517.5 -26.5 702.25 1.36冬季 581 517.5 63.5 4032.25 7.79总计 2070 2070 10.543.由于 2 2(3,0.95) = 7.81,拒绝原假设,认为各个季节里被购买的情况是显著差异的。(二) 研究者想了解某地区的医院出院人数(DISC)和床位量(BEDN),调查了21 家医院数据,分为甲级(I)和乙级(II)两类如下:等级 I I I I I II II II II II II II II II II II II II II II IIDISC 91240255233315200266120228362414518389

15、535273440431534426505322BEDN6264 67 69 70 73 81 91 96 1001001031101271111161201221301371421如果我们感兴趣的问题是医院出院人数小于 400 的比例估计,请给出通过抽取样本研究这一问题的统计推断问题和估计量;2如果假定 p 来自先验分布 beta(a,b),请先根据甲级医院估计出 a 和 b, 再给出对乙级医院 p 的后验估计计算公式和计算结果;3如果将床位量按(0,70,(71,110以及(110,150 分为大,中,小,请给出用来判断床位数和出院人数关系的统计模型和解答。1. 设随机变量 X 表示出院人

16、数,可以引进随机变量Yi = I(Xi400则 Yb(1,p), 医院出院人数小于 400 的比例估计转化为两点分布中参数 p 的估计。L(p)= = 1(1)1 1(1)1l(p)= +(n- )1ln 1ln(1)= (n- =0()11 1) 11最大似然估计为:= /n = 13/2112如果假定 p 来自先验分布 beta(a,b),请先根据甲级医院估计出 a 和 b, 再给出对乙级医院 p 的后验估计计算公式和计算结果;解:设 p 服从 beta(a,b),则1=E(p)= a/(a+b) ,2=E(p2)=( a+1) a/( a+b+1)( a+b),令 1= a/(a+b)

17、= A1 = , 2= ( a+1) a/( a+b+1)( a+b)=A2= 111 1112(其中 n1对应于甲级医院数据)得参数 a,b 的矩估计任意(不妨设=1),=0 (甲级医院出院人数都小于 400,是不是题目有些问题?)p 服从 beta(a,b),Y 服从 b(1,p),即P()=1/B(,) -1(1-) -1, P(y|)= y(1-) 1-y,利用共轭先验的性质,后验分布仍为 beta 分布,P(|y) P(y|)P() +y-1(1-) 1-y+-1beta(+y, 1-y+)从而后验估计为 = (+y)/(+1) 3 设变量 y 为出院人数,自变量 x 为床位量的等级变量,(a) 可以采用方差分析来检验床位数对出院人数有没有显著影响,(b) 也可用 y 对 x 的线性回归来分析。(a)方差分析:利用 R 程序检验F=data.frame(y=c(91,240,255,233,315,200,266,120,228,362,414,518,389,535,273,440,431,534,426,505,322),A=factor(c(1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,3,3,3,3)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 试题真题

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。