1、1统计学 第四版 (贾俊平 著) 中国人民大学出版社 课后答案第 1 章 绪论1什么是统计学?怎样理解统计学与统计数据的关系?2试举出日常生活或工作中统计数据及其规律性的例子。3 一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是 2 440 加仑的油漆罐。这家零售商抽查了 50 罐油漆,每一罐的质量精确到 4 位小数。装满的油漆罐应为 4.536 kg。要求:(1)描述总体; (2)描述研究变量; (3)描述样本;(4)描述推断。答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;
2、(3)样本:最近的一个集装箱内的 50 罐油漆;(4)推断:50 罐油漆的质量应为 4.53650226.8 kg。4 “可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了 1000 名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出 A 品牌或 B 品牌中哪个口味更好。要求:(1)描述总体;(2)描述研究变量;(3)描述样本; (4)一描述推断。答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口
3、味的品牌名称;(3)样本:1000 名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。第 2 章 统计数据的描述练习题1.为评价家电行业售后服务的质量,随机抽取了由 100 家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:B E C C A D C B A ED A C B C D E C E EA D B C C A E D C BB A C D E A B D D CC B C E D B C C B CD A C B C D E C E BB E C C A D C B A EB A C D E A B D D CA D
4、B C C A E D C B2C B C E D B C C B C(1) 指出上面的数据属于什么类型;(2)用 Excel 制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。解:(1)由于表 2.21 中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级 家庭数(频数) 频率%A 14 14B 21 21C 32 32D 18 18E 15 15合计 100 100(3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到 Excel 表中,点击:图表向导条形图选择子图表类型完成(见 E
5、xcel 练习题 2.1)。即得到如下的条形图:0 20 40ABCDE 服 务 质 量 等级 评 价 的 频数 分 布 频率 %服 务 质 量 等级 评 价 的 频数 分 布 家 庭数 ( 频 数 )2.某行业管理局所属 40 个企业 2002 年的产品销售收入数据如下(单位:万元):152 124 129 116 100 103 92 95 127 104105 119 114 115 87 103 118 142 135 125117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126(1)根据
6、上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:销售收入在 125 万元以上为先进企业,115 万125 万元为良好企业,105 万115 万元为一般企业,105 万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。解:(1)要求对销售收入的数据进行分组,全部数据中,最大的为 152,最小的为 87,知数据全距为 15287=65;为便于计算和分析,确定将数据分为 6 组,各组组距为 10,组限以整 10 划分;为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87 可能落在最小组之下,最大值 152 可能落在最大组之
7、上,将最小组和最大组设计成开口形式;按照“上限不在组内”的原则,用划记法统计各组内数据的个数企业数,3也可以用 Excel 进行排序统计(见 Excel 练习题 2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数 40,得到各组频率,填入表中第三列;在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。整理得到频数分布表如下:40 个企业按产品销售收入分组表向上累积 向下累积按销售收入分组(万元)企业数(个)频率(%) 企业数 频率 企业数 频率100 以下100110110120120
8、130130140140 以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计 40 100.0 (2)按题目要求分组并进行统计,得到分组表如下:某管理局下属 40 个企分组表按销售收入分组(万元) 企业数(个) 频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计 40 100.0 3.某百货公司连续 40 天的商品销售额如下(单位:万元):41 25 29 47 38 34 30 38 43 404
9、6 36 45 37 37 36 45 43 33 4435 28 46 34 30 37 44 26 38 4442 36 37 37 49 39 42 32 36 35根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。解:全部数据中,最大的为 49,最小的为 25,知数据全距为 4925=24;为便于计算和分析,确定将数据分为 5 组,各组组距为 5,组限以整 5 的倍数划分;为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值24 已落在最小组之中,最大值 49 已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”的原则,用划记法或用 Excel 统
10、计各组内数据的个数天数,(见 Excel 练习题 2.3)并填入表内,得到频数分布表如下表中的左两列;将各组天数除以总天数 40,得到各组频率,填入表中第三列;得到频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元) 频数(天) 频率(%)2530 4 10.0430353540404545506159615.037.522.515.0合计 40 100.0直方图:将上表(包含总标题,去掉合计栏)复制到 Excel 表中,点击:图表向导柱形图选择子图表类型完成。即得到如下的直方图:(见 Excel 练习题 2.3)01020304025303035354040454550某 百 货
11、 公 司日 商 品 销 售额 分 组 表 频数 ( 天 )某 百 货 公 司日 商 品 销 售额 分 组 表 频率 ( %).为了确定灯泡的使用寿命(小时) ,在一批灯泡中随机抽取 100 只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718706 715 712 722 691 708 690 692 707 701708 729 694 681 695 685 706 661 735 665668 710 693 697 674 658 698 666 696 698706 692 691 747 699 682 698 700 710
12、722694 690 736 689 696 651 673 749 708 727688 689 683 685 702 741 698 713 676 702701 671 718 707 683 717 733 712 683 692693 697 664 681 721 720 677 679 695 691713 699 725 726 704 729 703 696 717 688(1)利用计算机对上面的数据进行排序;(2)以组距为 10 进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。解:(1)排序:将全部数据复制到 Excel 中,并移动到同一
13、列,点击:数据排序确定,即完成数据排序的工作。(见 Excel 练习题 2.4)(2)按题目要求,利用已排序的 Excel 表数据进行分组及统计,得到频数分布表如下:(见 Excel 练习题 2.4)100 只灯泡使用寿命非频数分布按使用寿命分组(小时) 灯泡个数(只) 频率(%)650660 2 2660670 5 5670680 6 6680690 14 145690700 26 26700710 18 18710720 13 13720730 10 10730740 3 3740750 3 3合计 100 100制作直方图:将上表(包含总标题,去掉合计栏)复制到 Excel 表中,选择全
14、表后,点击:图表向导柱形图选择子图表类型完成。即得到如下的直方图:(见 Excel 练习题 2.4)051015202530650660670680690700710720730740100只 灯 泡使 用 寿 命 非频 数 分 布灯 泡 个 数100只 灯 泡使 用 寿 命 非频 数 分 布频 率 ( %)(3)制作茎叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶,得到茎叶图如下:65 1 866 1 4 5 6 867 1 3 4 6 7 968 1 1 2 3 3 3 4 5 5 5 8 8 9 969 0 0 1 1 1
15、1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 970 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 971 0 0 2 2 3 3 5 6 7 7 8 8 972 0 1 2 2 5 6 7 8 9 973 3 5 674 1 4 7将直方图与茎叶图对比,可见两图十分相似。.下面是北方某城市 12 月份各天气温的记录数据:-3 2 -4 -7 -11 -1 7 8 9 -6 -7-14 -18 -15 -9 -6 -1 0 5 -4 -9 -3-6 -8 -12 -16 -19 -15 -22 -25 -24 -19 -21-8 -6 -
16、15 -11 -12 -19 -25 -24 -18 -17 -24-14 -22 -13 -9 -6 0 -1 5 -4 -9 -3-3 2 -4 -4 -16 -1 7 5 -6 -5(1)指出上面的数据属于什么类型;6(2)对上面的数据进行适当的分组;(3)绘制直方图,说明该城市气温分布的特点。解:(1)由于各天气温的记录数据属于数值型数据,它们可以比较高低,且 0 不表示没有,因此是定距数据。(2)分组如下:由于全部数据中,最大的为 9,最小的为25,知数据全距为 9(25)=34;为便于计算和分析,确定将数据分为 7 组,各组组距为 5,组限以整 5 的倍数划分;为使数据的分布满足穷
17、尽和互斥的要求,注意到,按上面的分组方式,最小值25 已落在最小组之中,最大值 9 已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”的原则,用划记法(或 Excel 排序法,见 Excel 练习题 2.5)统计各组内数据的个数天数,并填入表内,得到频数分布表如下表;北方某城市 12 月份各天气温分组 天数(天)-25-20 8-20-15 8-15-10 10-10-5 14-50 1405 4510 7合计 65(3)制作直方图:将上表(包含总标题,去掉合计栏)复制到 Excel 表中,点击:图表向导柱形图选择子图表类型完成。即得到如下的直方图:(见 Excel 练习题 2.
18、5)北 方 某 城 市 1 2月 份 各 天 气 温 天 数( 天 )051015-25-20-20-15-15-10-10-5-50 05510北 方 某 城 市 1 2月 份 各 天气 温 天 数( 天 ).下面是某考试管理中心对 2002 年参加成人自学考试的 12000 名学生的年龄分组数据:年龄 1819 2121 2224 2529 3034 3539 4044 4559% 1.9 34.7 34.1 17.2 6.4 2.7 1.8 1.2(1)对这个年龄分布作直方图;(2)从直方图分析成人自学考试人员年龄分布的特点。解:(1)制作直方图:将上表复制到 Excel 表中,点击:图
19、表向导柱形图选择子图表类型完成。即得到如下的直方图:(见 Excel 练习题 2.6)7%051015202530354018192121222425293034353940444559%(2)年龄分布的特点:自学考试人员年龄的分布为右偏。.下面是 A、B 两个班学生的数学考试成绩数据:A 班:44 57 59 60 61 61 62 63 63 6566 66 67 69 70 70 71 72 73 7373 74 74 74 75 75 75 75 75 7676 77 77 77 78 78 79 80 80 8285 85 86 86 90 92 92 92 93 96B 班:35
20、39 40 44 44 48 51 52 52 5455 56 56 57 57 57 58 59 60 6161 62 63 64 66 68 68 70 70 7171 73 74 74 79 81 82 83 83 8485 90 91 91 94 95 96 100 100 100(1)将两个班的考试成绩用一个公共的茎制成茎叶图;(2)比较两个班考试成绩分布的特点。解:(1)将树茎放置中间,A 班树叶向左生长,B 班树叶向右生长,得茎叶图如下:A 班 B 班数据个数 树 叶 树茎 树叶 数据个数0 3 59 21 4 4 0448 42 97 5 122456677789 1211 9
21、7665332110 6 011234688 923 98877766555554443332100 7 00113449 87 6655200 8 123345 66 632220 9 011456 60 10 000 3(2)比较可知:A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比 A 班分散,且平均成绩较 A 班低。8.1997 年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征。月份 北京 长春 南京 郑州 武汉 广州 成都 昆明 兰州 西安81 49 70 76 57 77 72 79 65 51 672 41 6
22、8 71 57 75 80 83 65 41 673 47 50 77 68 81 80 81 58 49 744 50 39 72 67 75 84 79 61 46 705 55 56 68 63 71 83 75 58 41 586 57 54 73 57 74 87 82 72 43 427 69 70 82 74 81 86 84 84 58 628 74 79 82 71 73 84 78 74 57 559 68 66 71 67 71 81 75 77 55 6510 47 59 75 53 72 80 78 76 45 6511 66 59 82 77 78 72 78 71
23、 53 7312 56 57 82 65 82 75 82 71 52 72资料来源:中国统计年鉴 1998 ,中国统计出版社 1998,第 10 页。解:箱线图如下:(特征请读者自己分析) Min-ax25%7ed vlu3546578959.某百货公司 6 月份各天的销售额数据如下(单位:万元):257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269 295(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算
24、日销售额的标准差。 解:(1)将全部 30 个数据输入 Excel 表中同列,点击列标,得到 30 个数据的总和为8223,于是得该百货公司日销售额的均值:(见 Excel 练习题 2.9)= = =274.1(万元)xn8230或点选单元格后,点击“自动求和”“平均值” ,在函数 EVERAGE()的空格中输入“A1:A30” ,回车,得到均值也为 274.1。在 Excel 表中将 30 个数据重新排序,则中位数位于 30 个数据的中间位置,即靠中的第 15、第 16 两个数 272 和 273 的平均数:Me= =272.5(万元)2739由于中位数位于第 15 个数靠上半位的位置上,所
25、以前四分位数位于第 1第 15个数据的中间位置(第 8 位)靠上四分之一的位置上,由重新排序后的 Excel 表中第 8 位是 261,第 15 位是 272,从而:QL=261+ =261.25(万元)2734同理,后四分位数位于第 16第 30 个数据的中间位置(第 23 位)靠下四分之一的位置上,由重新排序后的 Excel 表中第 23 位是 291,第 16 位是 273,从而:QU=291 =290.75(万元) 。(2)未分组数据的标准差计算公式为:s=3021()iixn利用上公式代入数据计算是个较为复杂的工作。手工计算时,须计算 30 个数据的离差平方,并将其求和,()再代入公
26、式计算其结果:得 s=21.1742。(见 Excel 练习题 2.9)我们可以利用 Excel 表直接计算标准差:点选数据列(A 列)的最末空格,再点击菜单栏中“”符号右边的小三角“” ,选择“其它函数”选择函数“STDEV” “确定” ,在出现的函数参数窗口中的 Number1 右边的空栏中输入:A1:A30,“确定” ,即在 A 列最末空格中出现数值:21.17412,即为这30 个数据的标准差。于是:(万元) 。(见 Excel 练习题 2.9)17.2s10.甲乙两个企业生产三种产品的单位成本和总成本资料如下:总成本(元)产品名称单位成本(元) 甲企业 乙企业ABC152030210
27、030001500325515001500比较哪个企业的总平均成本高?并分析其原因。解:设产品单位成本为 x,产量为 f,则总成本为 xf,由于:平均成本 = = ,而已知数据中缺产量 f 的数据,f总 成 本总 产 量又因个别产品产量 f = =该 产 品 成 本该 产 品 单 位 成 本 xf从而 = ,于是得:xf甲企业平均成本 19.41(元) ,xf210350510乙企业平均成本 18.29(元) ,xf325103对比可见,甲企业的总平均成本较高。原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。11.在某地区抽取的 120
28、 家企业按利润额进行分组,结果如下:按利润额分组(万元) 企业数(个)200300 19300400 30400500 42500600 18600 以上 11合计 120计算 120 家企业利润额的均值和标准差。解:设各组平均利润为 x,企业数为 f,则组总利润为 xf,由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:组中值 企业数(个) 总利润按利润额分组(万元)x f xf200300 250 19 4750300400 350 30 10500400500 450 42 18900500600 550 18 9900600 以上 650 11 7150合计 120 51200于是,120 家企业平均利润为:= = = 426.67(万元) ;xf5120分组数据的标准差计算公式为:s=2()1ixf手动计算须列表计算各组数据离差平方和( x426.67) 2f, 并求和,再代入计算公式:列表计算如下组中值 企业数(个)x f(x426.67) 2f250 19 593033.4891350 30 176348.667450 42 22860.1338550 18 273785.2002
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。