人民大学统计学在职题库统计综述答案.doc

上传人:h**** 文档编号:892027 上传时间:2018-11-05 格式:DOC 页数:88 大小:2.33MB
下载 相关 举报
人民大学统计学在职题库统计综述答案.doc_第1页
第1页 / 共88页
人民大学统计学在职题库统计综述答案.doc_第2页
第2页 / 共88页
人民大学统计学在职题库统计综述答案.doc_第3页
第3页 / 共88页
人民大学统计学在职题库统计综述答案.doc_第4页
第4页 / 共88页
人民大学统计学在职题库统计综述答案.doc_第5页
第5页 / 共88页
点击查看更多>>
资源描述

1、11 中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:1一、 (20 分) 随机抽取 20 块手机电池,测得其使用寿命数据如下(单位:小时):1008 993 998 1007 10111002 1013 999 1008 995983 995 1000 977 10151010 998 1005 1011 996列出描述上述数据所适用的统计图形,并说明这些图形的用途。直方图:直观的展示一组数据(电池使用寿命)的分布情况。箱线图:直观反映原始数据(电池寿命)的数据分布的特征,如偏态,是否有离群点。二、 (20 分)方差分析

2、中有哪些基本假定?这些假定中对哪个假定的要求比较严格?1、方差分析有 3 个基本假定: (1)正态性:每个总体都应服从正态分布,即对于因子的每一个水平,其观测值是来自正态分布总体的简单随机样本;(2)方差齐性:各个总体的方差必须相同;2(3)独立性:每个样本数据是来自因子各水平的独立样本2、对独立性要求比较严格,独立性得不到满足会对方差分析结果有较大影响,对正态性和方差齐性的要求相对比较宽松。三、 (20 分)某种食品每袋的标准重量是 100 克,从该批食品中抽取一个随机样本,检验假设 , 。10:0H10(1) 如果拒绝 ,你的结论是什么?,如果不拒绝 ,你0 H的结论是什么?(2) 能否得

3、到一个样本能够证明该食品的平均重量是 100 克?请说明理由。(3) 如果由该样本得到的检验的 ,你的结论是什么?03.P0.03 这个值是犯第类错误的概率,是实际算出来的显著性水平,你怎样解释这个 值?(1)拒绝 :该种食品每袋的平均重量不是 100g0H不拒绝 :提供的样本不能证明该种食品每袋的平均重量不是 100g(2)不能,样本得出的结论只能是拒绝或不拒绝原假设,并不能直接确定原假设为真(3)结论:若给定显著性水平为 0.05,则可以拒绝原假设,认为该食品每袋的平均重量不是 100 克;但若给定显著性水平为0.01,则不能拒绝原假设P 值: 如果该种食品每袋的平均重量是 100g,样本

4、结果会像实际观测那样极端或更极端的概率仅为 0.033四、 (20 分)在建立多元线性回归模型时,通常需要对自变量进行筛选。(1) 请谈谈你对变量筛选的必要性的看法。(2) 列出变量筛选的方法,请简要说明这些方法的特点。(1)若将所有的自变量都引入回归模型,往往会导致所建立的模型不能进行有效的解释,也可能会导致多重共线性,增加自变量还会导致判定系数 增大,从而高估模型拟合优度。2R(2)变量筛选有向前选择、向后剔除、逐步回归等方法。特点如下:向前选择:从没有自变量开始,不停向模型中增加自变量,直到增加不能导致 SSE 显著增加为止。向后剔除:从所有自变量开始,不停从模型中剔除自变量,直到剔除不

5、能导致 SSE 显著减小为止。逐步回归:结合向前选择和向后剔除,从没有自变量开始,不停向模型中增加自变量,每增加一个自变量就对所有现有的自变量进行考察,若某个自变量对模型的贡献变得不显著就剔除。如此反复,直到增加变量不能导致 SSE 显著减少为止。五、 (20 分)如果一个时间序列包含趋势、季节成分、随机波动,适用的预测方法有哪些?对这些方法做检验说明。可以使用 Winter 指数平滑模型、引入季节哑变量的多元回归和分解法等进行预测。(1)Winter 指数平滑模型4包含三个平滑参数,即 (取值均在 01) ,以及平滑值 、趋势项更、 、 新 、季节项更新 、未来第 k 期的预测值 。 +L

6、为季节周期的长度,对于季度数据,L=4,对于月份数据,L=12 ;I 为季节调节因子。平滑值消除季节变动,趋势项更新是对趋势值得修正,季节项更新是 t 期的季节调整因子, 是用于预测的模型。+=(+)+使用 Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4 年以上的数据) 。使用 Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4 年以上的数据) 。(2)引入季节哑变量的多元回归对于以季度记录的数据,引入 3 个哑变量,其中 =1(第 1 季度)或 0(其他季度),以此类推,则季2、 3、 4 2节性多元

7、回归模型表示为: =0+1+22+33+44其中 b0 是常数项,b1 是趋势成分的系数,表示趋势给时间序列带来的影响,b2、b3、b4 表示每一季度与参照的第 1 季度的平均差值。(3)分解预测第 1 步,确定并分离季节成分。计算季节指数,然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。第 2 步,建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测。第 3 步,计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。52 中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统

8、计思想综述课程代码:123201 考题卷号:2一、 (20 分)在某小学随机抽取 35 名小学生,调查他们每周购买零食的花费情况,得到的数据如下(单位:元):24 17 26 29 386 28 44 39 830 17 26 32 4010 20 27 43 3315 4 28 35 2647 25 17 26 4516 36 29 37 5列出描述上述数据所适用的统计量,并说明这些统计量的用途。平均数:用于度量对象的一般水平。中位数(分位数):用中间(某个)位置上的值代表数据水平,也用于度量对象的一般情况,且不受极值的影响具有稳定性。方差(标准差):用于描述一组数据的差异水平,越大说明数据

9、的分布越分散不稳定。偏态系数:用于描述数据分布的不对称性,越接近 0 越对称。6峰度系数:用于描述数据分布峰值高低,大于 0 为尖峰,小于 0 为扁平分布。二、 (20 分)简要说明 分布和 分布在推断统计中应用。tFt 分布:当正态总体标准差未知时,在小样本的条件下对总体均值的估计和检验要用到 t 分布。描述样本均值分布,用于对两个样本均值差异进行显著性测试、估算置信区间等。F 分布:通常用于比较不同总体的方差是否有显著差异。应用于方差分析、协方差分析和回归分析等,还可用于似然比检验。三、 (20 分)什么是 值?要证明原假设不正确,如何确定P合理的 值?P 值:犯第 I 类错误的真实概率,

10、也称观察到的显著性水平。是当原假设为真时,得到的样本结果会像实际观测结果这样极端或者更极端的概率。若要证明原假设不正确,则由样本得到的 P 值应小于给定的显著性水平。四、 (20 分)某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30 名工人,并指定每个人使用其中的一种方法。通过对7每个工人生产的产品数进行方差分析得到下面的结果:方差分析表差异源 SS df MS F P-value组间 210 0.245946组内 3836 总计2 (1) 完成上面的方差分析表。(2) 组装方法与组装产品数量之间的关系强度如何?(3) 若显著性水平 ,检验三种方法组

11、装的产品数05.量之间是否有显著差异?(1)差异源 SS df MS F P-value组间 2*210=420 I-1=2 210 210142.07=1.4780.245946组内 3836 30-3=27 =142.38362707 总计 420+3836=4256 29 (2)从 P 值来看,组装方法与组装产品数量之间的关系强度较弱。(3)原假设:三种方法每小时组装的产品数量没有差异若显著性水平为 0.05,则 P0.05,因此不能拒绝原假设,即不能证明三种方法组装的产品数量之间有显著差异。五、 (20 分)简要说明分解预测的基本步骤。第 1 步,确定并分离季节成分。计算季节指数,然后

12、将季节8成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。第 2 步,建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测。第 3 步,计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。93 中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:3一、 (20 分)在 2008 年 8 月 10 日举行的第 29 届北京奥运会女子 10 米气手枪决赛中,进入决赛的 8 名运动员的预赛成绩和最后 10 枪的决赛成绩如下表:要对各名运动员进行综合

13、评价,使用的统计量有哪些?简要说明这些统计量的用途。(1)集中趋势:指一组数据向某一中心值靠拢的程度,它可以反映选手射击成绩中心点的位置平均数:一组数据相加后除以数据的个数得到的结果。若各组数据在组内是平均分布的,则计算的结果还是比较准确的,否则误差会比较大。 (如中国选手发挥很稳定,适合使用平均数判断其成绩)中位数:一组数据排序后处于中间位置上的变量值,但不受极端值的影响。 (如波兰选手大多数成绩比较平均,但有一枪打到8.1,会严重影响其平均值,但不会影响中位数)(2)离散程度:各变量值远离其中心值的程度,它可以反映选手发挥的稳定性10标准差:方差的平方根,能够很好的反映出数据的离散程度,若

14、选手的平均成绩差异不大,可以通过直接比较标准差的方式进行衡量离散系数:一组数据的标准差与其相应的平均数之比,离散系数越大则数据的离散程度也大,若选手的平均成绩差异很大,则需要计算离散系数比较稳定性极差:一组数据的最大值与最小值之差,它容易受极端值的影响,不能反映中间数据的分散情况,但可从另一方面选手是否存在发挥异常(3)分布形状峰态:峰态是对数据分布平峰或尖峰程度的测度,当 K0 时为尖峰分布,数据的分布更集中;当 K0 时为扁平分布,数据的分布越分散。通过对选手的峰态分布情况分析,可看出成绩分布是否平均。偏态:偏态是对数据分布对称性的测量,若偏态系数明显不等于0,表明分布是非对称的,偏态系数

15、的数值越大,表示偏斜的程度越大。通过对选手的偏态分布情况情况分析,可看出选手成绩分布是否对称,是否受比赛时长影响。二、 (20 分)为什么说假设检验不能证明原假设正确?(1)假设检验的目的主要是收集证据拒绝原假设,而支持你所倾向的备择假设。因为假设检验只提供不利于原假设的证据(证据的强弱取决于 P 值的大小) 。因此,当拒绝原假设时,表明样本提供的证据证明它是错误的;当没有拒绝原假设时,我们也没法证明它是正确的,因为假设检验的程序没有提供它正确的证据。(2)假设检验得出的结论都是根据原假设进行阐述的。我们要么拒绝原假设,要么不拒绝原假设。当不能拒绝原假设时,我们也不能说“接受原假设” ,因为没有足够的证据拒绝原假设并不等于你已经证明了原假设时真的,它仅仅意味着目前我们还没有足够的证据证明原假设,只表示目前的样本提供的证据还不足以拒绝原假设。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 参考答案

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。