1、应用统计学题目及答案1. 有一个班 40 名学生的统计学考试成绩如表 3-3 所示。表 3-3 40 名学生的统计学考试成绩表89 88 76 99 74 60 82 60 93 9994 82 77 79 97 78 87 84 79 6598 67 59 72 56 81 77 73 65 6683 63 89 86 95 92 84 85 79 70学校规定:60 以下为不及格;6075 分为中;7689 分为良;90100 为优。试把该班学生分为不及格、中、良、优 4 组,编制一张频数分布表。解:统计学考试成绩频数分布表如下表 3-7 所示。表 3-7 40 名学生的统计学考试成绩频数
2、分布表成绩分组 学生人数(人) 比率(%)60 分以下 2 5.060 75 11 27.576 89 19 47.590 100 8 20.0合 计 40 100.02. 宏发电脑公司在全国各地有 36 家销售分公司,为了分析各公司的销售情况,宏发公司调查了这 36 家公司上个月的销售额,所得数据如表 3-4 所示。表 3-4 分公司销售额数据表 (单位:万元)60 60 62 65 65 66 67 70 7172 73 74 75 76 76 76 76 7778 78 79 79 80 82 83 84 8486 87 88 89 89 90 91 92 92根据上面的资料进行适当分组
3、,并编制频数分布表。解:“销售额”是连续变量,应编制组距式频数分布表。具体过程如下:第一步:计算全距: 92603R第二步:按经验公式确定组数: 1.lg67K第三步:确定组距: 32/75d第四步:确定组限:以 60 为最小组的下限,其他组限利用组距依次确定。第五步:编制频数分布表。如表 3-8 所示。表 3-8 分公司销售额频数分布表按销售额分组(万元) 公司数(个) 频率(%)60 65 3 8.33 65 70 4 11.11 70 75 5 13.89 75 80 10 27.78 80 85 5 13.89 85 90 5 13.89 90 95 4 11.11 合 计 36 10
4、0.00 3. 有 27 个工人看管机器台数如表 3-5 所示。表 3-5 工人看管机器台数表 (单位:台)5 4 2 4 3 4 3 4 42 4 3 4 3 2 6 4 42 2 3 4 5 3 2 4 3试编制一张频数分布表。解:“工人看管机器台数”是离散变量,变量值变动范围很小,应编制单项式频数分布表。编制结果如表 3-9 所示。表 3-9 工人看管机器台数频数分布表看管机器台数(台) 工人数(人) 工人数的比重(%)2 6 223 7 264 11 415 2 76 1 4合 计 27 100 4. 对下面职工家庭基本情况调查表(如表 3-6 所示)中的答复进行逻辑检查,找出相互矛盾
5、的地方,并进行修改。表 3-6 职工家庭基本情况调查表解:职工家庭基本情况调查表修正如表 3-10 所示。表 3-6 职工家庭基本情况调查表姓名 性别 年龄 与被调查者 的关系 工作单位 参加工作年月 职务或工 种 固定工或 临时工刘 盛 男 44 被调查者本人 长城机电公司 1973.7 干部 临时陈心华 女 40 夫妻 市第一针织厂 1975.4 工人 固定刘淑影 女 18 长女 待业青年 1999 无 临时刘平路 男 16 长子 医学院 2000 学生 无姓名 性别 年龄 与被调查者 的关系 工作单位 参加工作年月 职务或工 种 固定工或 临时工刘 盛 男 44 被调查者本人 长城机电公
6、司 1973.7 干部 固定陈心华 女 40 夫妻 市第一针织厂 1975.4 工人 固定刘淑影 女 18 父女 待业青年 无 无刘平路 男 16 父子 医学院学习 2000 学生 无第二个计算题1. 某厂对 3 个车间 1 季度生产情况分析如下:第 1 车间实际产量为 190 件,完成计划 95%;第 2 车间实际产量为 250 件,完成计划100%;第 3 车间实际产量为 609 件,完成计划 105%。则 3 个车间产品产量的平均计划完成程度为:。另外,1 车间产品单位成本为 18 元/件,2 车间产品单位95%1050%成本为 12 元/件,3 车间产品单位成本为 15 元/件,则 3
7、 个车间平均单位成本为:元/件。以上平均指标的计算是否正确?如不正确请说明理由并改正。82答:两种计算均不正确。平均计划完成程度的计算,因各车间计划产值不同,不能对其进行简单平均,这样也不符合计划完成程度指标的特定含义。正确的计算方法是:平均计划完成程度 19025610.84%9.mx平均单位成本的计算也因各车间的产量不同,不能简单相加,产量的多少对平均单位成本有直接的影响。所以正确的计算方法为:平均单位成本 (元/件)1890251609514.83xf2. 某高校某系学生的体重资料如表 4-6 所示。试根据所给资料计算学生体重的算术平均数、中位数、众数和标准差。表 4-6 学生体重资料表
8、按体重分组(公斤) 学生人数(人)52 以下 285255 395558 685861 5361 以上 24合计 212解:先列表计算有关资料如表 4-8 所示。表 4-8 学生体重计算表按体重分组(公斤) 组中值(x) 学生人数(f) xf 向上累积频数52 以下 50.5 28 1414.0 285255 53.5 39 2086.5 675558 56.5 68 3842.0 1355861 59.5 53 3153.5 18861 以上 62.5 24 1500.0 212合计 _ 212 11996.0 _(1)学生平均体重:(公斤)1965.82xf(2)学生体重中位数:(公斤)1
9、2672535.28mefSMLd(3)学生体重众数: 1()6839556.98()()mo mfLdf公3. 已知某公司职工的月工资收入为 1965 元的人数最多,其中,位于全公司职工月工资收入中间位置的职工的月工资收入为 1932 元,试根据资料计算出全公司职工的月平均工资。并指出该公司职工月工资收入是何种分布形式?解:月平均工资为:(元)319326519.02eoMx因为 ,所以该公司职工月工资收入呈左偏分布。eox第三个计算题4. 随机抽取 400 只袖珍半导体收音机,测得平均使用寿命 5000 小时。若已知该种收音机使用寿命的标准差为 595 小时,求概率保证程度为 99.73%
10、的总体平均使用寿命的置信区间。解:已知 ,总体平均使用寿/240,5,95,19.73%,nx Z命的置信区间为: /20340589.2(17,.5)xZn该批半导体收音机平均使用寿命的置信区间是 4910.75 小时5089.25 小时。5. 一个电视节目主持人想了解观众对某个电视专题的喜欢程度,他选取了 500 个观众作样本,结果发现喜欢该节目的有 175 人。试以 95%的概率估计观众喜欢这一专题节目的区间范围。若该节目主持人希望估计的极限误差不超过 5.5%,问有多大把握程度?解:已知 因此,在概率保证程度/21750,0.3,195%,1.96,npZ为 95%时,观众喜欢这一专题
11、节目的置信区间为: /2()0.3(.5).03542.8,9.2pZn 若极限误差不超过 5.5%,则/2 .%5.8213(1)035(1)dZpn 于是,把握程度为 99%。6. 假定总体为 5000 个单位,被研究标志的方差不小于 400,抽样允许误差不超过 3,当概率保证程度为 95%时,问(1)采用重复抽样需抽多少单位?(2)若要求抽样允许误差减少 50%,又需抽多少单位?解:已知 2 /250,40,3,195%,1.96ndZ(1) ,需抽查 171 个单位。/22()1.967.4Zd(2) ,需抽查 683 个单位。2/ 2().08.955n7. 调查一批机械零件合格率。
12、根据过去的资料,合格品率曾有过 99%、97%和 95%三种情况,现在要求抽样极限误差不超过 1%,要求估计的把握程度为 95%,问需抽取多少个零件?解:根据提供的 3 个合格率,取总体方差最大值进行计算,故用 /295%,1.96pZ,需抽查 1825 件。2/ 2()1).684.70Znd第四个计算题8. 有 10 个同类企业的生产性固定资产年平均价值和工业总产值资料如表 8-9 所示。表 8-9 生产性固定资产与工业总产值表企业编号 生产性固定资产价值(万元) 工业总产值(万元)1 318 5242 910 10193 200 6384 409 8155 415 9136 502 92
13、87 314 6058 1210 15169 1022 121910 1225 1624合计 6525 9801要求:(1)说明两变量之间的相关方向。(2)建立直线回归方程。(3)计算估计标准误差。(4)估计生产性固定资产(自变量)为 1100 万元时总产值(因变量)的可能值。解:由 Excel 回归分析工具可得如下输出表回归统计 Multiple R 0.947757 R Square 0.898243 Adjusted R Square 0.885523 标准误差 126.6279 观测值 10 方差分析 df SS MS F Significance F 回归分析 1 1132339.8
14、 1132339.8 70.61835987 3.05923E-05 残差 8 128277.0999 16034.63748 总计 9 1260616.9 Coefficients 标准误差 t Stat P-value Lower 95% Upper 95%Intercept 395.567 80.2611267 4.928500839 0.001151611 210.4845404 580.6495202X Variable 1 0.895836 0.106603063 8.403473084 3.05923E-05 0.650008865 1.141663072由此,有 ,于是可得到如
15、下结01.9478,395.67,0.895,126.8r果:(1)两个变量之间是线性正相关关系。(2)直线回归方程为: ,其线性拟合图如下:395.670.8yx(3)估计标准误差为 126.628 万元。(4)生产性固定资产为 1100 万元时总产值的可能值为 1380.986 万元。9. 某种产品的产量与单位成本的资料如表 8-10 所示。表 8-10 某产品产量与单位成本资料表产量(千件) 单位成本(元/件)2 733 724 713 734 695 68要求:(1)计算相关系数 ,并判断其相关程度。r(2)建立直线回归方程。(3)指出产量每增加 1000 件时,单位成本平均下降了多少
16、元?解:由 Excel 回归分析工具的输出表可知:01.91,7.3,.82r(1)产品的产量与单位成本之间为高度相关关系。(2)产品的产量与单位成本之间的直线回归方程为 7.3182yx(3)由直线回归方程 可知,产量每增加 1000 件时,单位成本平均下降7.3182yx了 1.82 元。10. 某企业希望确定其广告费 与销售收入 之间的关系,以制定营销计划。使用 Excely回归分析工具计算得到结果如表 8-11 所示。表 8-11 回归分析结果表回归统计相关系数 0.98283344判定系数 0.96596157修正判定系数 0.9602885标准误差 1.92157756观测值 8方
17、差分析df SS MS FF 统计量的显著性水平回归分析 1 628.7202 628.7202 170.271359残差 6 22.15476 3.69246总计 7 650.875系数 标准误差 t 统计量值 P 值 Lower95% Upper95%截距 5.71428571 1.497281 3.816441 0.00879716 2.050570678 9.378000751变量 X 3.86904762 0.296506 13.04881 1.2485E-05 3.143523931 4.594571307要求:(1)写出广告费与销售收入的回归方程。(2)给出 与 置信度为 95%的区间估计。01(3)指出广告费与销售收入的判定系数。(4)指出回归标准误差。(5)判定广告费与销售收入的线性相关程度(说明理由) 。解:由 Excel 回归分析工具计算出的有关结果可知:(1)广告费与销售收入的回归方程为 。5.7386yx