统计学离线作业.doc

上传人:hw****26 文档编号:2282641 上传时间:2019-05-05 格式:DOC 页数:20 大小:1.20MB
下载 相关 举报
统计学离线作业.doc_第1页
第1页 / 共20页
统计学离线作业.doc_第2页
第2页 / 共20页
统计学离线作业.doc_第3页
第3页 / 共20页
统计学离线作业.doc_第4页
第4页 / 共20页
统计学离线作业.doc_第5页
第5页 / 共20页
点击查看更多>>
资源描述

1、第一次作业二、主观题(共 4 道小题)6. 指出下面的数据类型: (1) 年龄 数值型数据(2) 性别 分类型数据(3) 汽车产量 数值型数据(4) 员工对企业某项改革措施的态度(赞成、中立、反对) 顺序数据(5) 购买商品时的支付方式(现金、信用卡、支票) 分类数据7. 某研究部门准备抽取 2000 个职工家庭推断该城市所有职工家庭的年人均收入。要求: (1)描述总体和样本。总体是“该城市所以的职工家庭”样本是“抽取的 2000个职工家庭”(2)指出参数和统计量。参数是“城市所有职工家庭的年人均收入”统计量是“抽取的 2000个职工家庭”计算出的年人均收入8. 一家研究机构从 IT 从业者中

2、随机抽取 1 000 人作为样本进行调查,其中 60回答他们的月收入在 5 000 元以上,50的人回答他们的消费支付方式是用信用卡。要求: (1)这一研究的总体是什么?总体是所有的 IT从业者(2)月收入是分类变量、顺序变量还是数值型变量?顺序变量(3)消费支付方式是分类变量、顺序变量还是数值型变量?分类变量(4)这一研究涉及截面数据还是时间序列数据?截面数据9. 一项调查表明,消费者每月在网上购物的平均花费是 200 元,他们选择在网上购物的主要原因是 “价格便宜”。要求: (1)这一研究的总体是什么?总体是所有网上购物者(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值型变量?

3、分类变量(3)研究者所关心的参数是什么?所有网上购物者的月平均花费(4)“消费者每月在网上购物的平均花费是 200元”是参数还是统计量?统计量(5)研究者所使用的主要是描述统计方法还是推断统计方法?推断统计法第二次作业二、主观题(共 1 道小题)31. 自填式、面访式、电话式各有什么长处和弱点?自填式;优点:1 调查组织者管理容易,2 成本低,可进行大规模调查,3 对被调查者,可选择方便时间答卷,减少回答敏感问题压力。缺点:1 返回率低,2 不适合结构复杂的问卷,调查内容有限,3 调查周期长,4 在数据搜集过程中遇见问题不能及时调整。面访式;优点:1 回答率高,2 数据质量高,3 在调查过程中

4、遇见问题可以及时调整。缺点:1 成本比较高,2 搜集数据的方式对调查过程的质量控制有一定难度,3 对于敏感问题,被访者会有压力。电话式;优点:1 速度快,2 对调查员比较安全,3 对访问过程的控制比较容易。缺点:1 实施地区有限,2 调查时间不能过长,3 使用的问卷要简单,4 被访者不愿回答时,不易劝服。第三次作业二、主观题(共 5 道小题)16. 为评价家电行业售后服务的质量,随机抽取了由 100 个家庭构成的一个样本。服务质量的等级分别表示为:A好;B 较好;C 一般;D较差; E.差。调查结果如下: B E C C A D C B A ED A C B C D E C E EA D B

5、C C A E D C BB A C D E A B D D CC B C E D B C C B CD A C B C D E C E BB E C C A D C B A EB A C E E A B D D CA D B C C A E D C BC B C E D B C C B C要求:(1)指出上面的数据属于什么类型。顺序类型(2)用 Excel制作一张频数分布表。接收 频数E 15D 18C 32B 21A 14(3)绘制一张条形图,反映评价等级的分布。(4)绘制评价等级的帕累托图。17. 某行业管理局所属 40 个企业 2002 年的产品销售收入数据如下: 152 124 12

6、9 116 100 103 92 95 127 104105 119 114 115 87 103 118 142 135 125117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率按销售收入分组 频数 向下累计频数向下累计频率向上累计频数向上累计频率8595 3 3 7.50% 0 100.00%95105 6 9 22.50% 37 92.50%105115 9 18 45.00% 31 77.50%1151

7、25 11 29 72.50% 22 55.00%125135 4 33 82.50% 11 27.50%135145 5 38 95.00% 7 17.50%145155 2 40 100.00% 2 5.00%(2)按规定,销售收入在 125 万元以上为先进企业,115125 万元为良好企业,105115 万元为一般企业,105 万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。按销售收入分组(万元)企业数(个)频率(%)先进企业 11 27.50%良好企业 11 27.50%一般企业 9 22.50%落后企业 9 22.50%18. 一种袋装食品用生产线自动装填,每袋

8、重量大约为 50g,但由于某些原因,每袋重量不会恰好是 50g。下面是随机抽取的 100 袋食品,测得的重量数据如下: 单位:g57 46 49 54 55 58 49 61 51 4951 60 52 54 51 55 60 56 47 4753 51 48 53 50 52 40 45 57 5352 51 46 48 47 53 47 53 44 4750 52 53 47 45 48 54 52 48 4649 52 59 53 50 43 53 46 57 4949 44 57 52 42 49 43 47 46 4851 59 45 45 46 52 55 47 49 5054 4

9、7 48 44 57 47 53 58 52 4855 53 57 49 56 56 57 53 41 48要求:(1)构建这些数据的频数分布表。重量(g) 频率 比率(%) 向上累 计40-45 8 8 845-50 37 37 4550-55 34 34 7955-60 18 18 9760-65 3 3 100合计 100 100 100(2)绘制频数分布的直方图。(3)说明数据分布的特征。答:由图表可知食品重量主要是分布在 45-55之间,它的分布呈现两头小中间大的钟形分布中的偏态分布,符合正常的分布规律。19. 甲乙两个班各有 40 名学生,期末统计学考试成绩的分布如下: 人数考试成

10、绩甲班 乙班优良中及格不及格361894615982要求:(1)根据上面的数据,画出两个班考试成绩的对比条形图和环形图。(2)比较两个班考试成绩分布的特点。从上面的图形可以看出,甲班同学的成绩主要分布在中,乙班同学的成绩主要分布在良;甲班的不及格人数比乙班不及格人数多。(3)画出雷达图,比较两个班考试成绩的分布是否相似。从上图可知,甲乙班的考试成绩是不相似的。20. 已知 19952004 年我国的国内生产总值数据如下 (按当年价格计算) : 单位:亿元国内生产总值年份第一产业 第二产业 第三产业19951996199758478.16788467446261199313844.2142112

11、2853833613372231794720428230291998199920002001200220032004783452820675894681973148105172.311739021368759145524144719614628215411816117316928120768073861940558449354875052980612747238725174270382990533153360753918843721要求:(1)用 Excel绘制国内生产总值的线图。(2)绘制第一、二、三产业国内生产总值的线图。(3)根据 2004年的国内生产总值及其构成数据绘制饼图。第四次作业

12、二、主观题(共 7 道小题)18. 随机抽取 25 个网络用户,得到他们的年龄数据如下:单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1) 计算众数、中位数:o=19 和 23;Me=23(2) 根据定义公式计算四分位数。QL=19,QU=26.5 (3) 计算平均数和标准差;(4) 计算偏态系数和峰态系数:(5) 对网民年龄的分布特征进行综合分析:样本数据的均值是 24岁,单标准差较大,说明网民年龄之间差异较大;从偏值和峰度系数来看,网民年龄呈现右偏尖峰分布。19. 某银行为缩短顾

13、客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列:另种是顾客在三千业务窗口处列队 3 排等待。为比较哪种排队方式使顾客等待的时间更短两种排队方式各随机抽取 9 名顾客。得到第一种排队方式的平均等待时间为 72 分钟,标准差为 197 分钟。第二种排队方式的等待时间( 单位:分钟)如下: 55 66 67 68 71 73 74 78 78要求:(1)画出第二种排队方式等待时间的茎叶图。树茎 树叶 频数5 5 16 678 37 13488 5(2)计算第二种排队时间的平均数和标准差。(3)比较两种排队方式等待时间的离散程度。因为两种排队方式的平均数不同

14、,所以用离散系数进行比较,利用离散系数的计算公式,得第一种排队方式的离散系数为 0.274;第二种排队方式的离散系数为 0.102,所以第一种排队方式等待的离散程度大于第二种排队方式。(4)如果让你选择一种排队方式,你会选择哪种?试说明理由。选择第二种,因为平均等待时间短,而且离散程度小。20. 在某地区抽取 120 家企业,按利润额进行分组,结果如下: 按利润额分组(万元) 企业数(个)200300300400400500500600600 以上1930421811合 计 120要求:(1)计算 120家企业利润额的平均数和标准差。平均数是 426.67,标准差是 116.48。(2)计算分

15、布的偏态系数和峰态系数。21. 一项关于大学生体重状况的研究发现男生的平均体重为 60kg,标准差为 5kg;女生的平均体重为 50kg,标准差为 5kg。请回答下面的问题: (1)是男生的体重差异大还是女生的体重差异大?为什么?女生的体重差异大,因为女生体重的离散系数为 0.1,男生体重的离散系数为 0.08.(2)以磅为单位(1ks22lb),求体重的平均数和标准差。(3) 粗略地估计一下,男生中有百分之几的人体重在 55kg 一 65kg 之间?男生中有 68%的人体重在 55kg 一 65kg 之间(4)粗略地估计一下,女生中有百分之几的人体重在 40kg60kg 之间?女生中有 95

16、%的人体重在 40kg 一 60kg 之间22. 一条产品生产线平均每天的产量为 3 700 件,标准差为 50 件。如果某一天的产量低于或高于平均产量,并落人士2 个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制? 时间 周一 周二 周三 周四 周五 周六 周日产量(件) 3 850 3 670 3 690 3 720 3 610 3 590 3 700用标准分数判断:时间 周一 周二 周三 周四 周五 周六 周日标准化值 3 -0.6 -0.2 0.4 -1.8 -2.2 0周一和周六失去控制23. 一种产品需要人工组装,现有三种可供选择的组装

17、方法。为检验哪种方法更好,随机抽取 15 个工人,让他们分别用三种方法组装。下面是 15 个工人分别用三种方法在相同的时间内组装的产品数量: 单位:个方法 A 方法 B 方法 C16416716816517016516416816416216316616716616512913012913013130129127128128127128128125132125126126127126128127126127127125126116126125要求:(1)你准备采用什么方法来评价组装方法的优劣?方法 A组装优先理由是平均数较大,离散数较小,分布较为紧密,分析较方便,具有代表性。(2)如果让你选择

18、一种方法,你会作出怎样的选择?试说明理由。我选第一种,单位时间的产量是后面第二种的 130%,最小值也比后面的最大值高出很多,很明显生产效率很高,作为老板必须选这个的,前提是产品质量必须一样。24. 在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了 200 种商业类股票和 200 种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。 (1)你认为该用什么样的统计量来反映投资的风险?方差或标准差(3)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?商业类股票(4)如果进行股票投资,你会选择商业类股票还是高科技类股票?高科技类股票第五次作业二、主观题(共 3 道小题)12. 调节一个装瓶机使其对每个瓶子的灌装量均值为 盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差盎司的正态分布。随机抽取由这台机器灌装的 9 个瓶子形成一个样本,并测定每个瓶子的灌装量。试确定样本均值偏离总体均值不超过 0.3 盎司的概率。 13. , , 表示从标准正态总体中随机抽取的容量,n=6 的一个样本,试确定常数 b,使得

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 精品笔记

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。