1、 应用统计学习题与案例 第一章 绪 论 . 1 复习思考题 . 1 案例讨论题 . 1 第二章 统计数据的收集与整理 . 3 复习思考题 . 3 案例讨论题 . 4 第三章 抽样分布 . 6 复习思考题 . 6 案例讨论题 . 6 第四章 统计推断 . 8 复习思考题 . 8 案例讨论题 . 9 第五章 方差分析 . 11 复习思考题 . 11 案例讨论题 . 11 第六章 回归分析 . 13 复习思考题 . 13 案例讨论题 . 15 第七章 时间序列分析 . 17 复习思考题 . 17 案例讨论题 . 17 第八章 统计指数 . 19 复习思考题 . 19 案例讨论题 . 20 第九章 统
2、计决策 . 21 复习思考题 . 21 案例讨论题 . 22 第十章 产品质量的统计管理 . 23 复习思考题 . 23 案例讨论题 . 24 1 第一章 绪 论 复习思考题 1如何理解“统计”一词的含义? 2简述统计活动的过程。 3人类统计活动产生与发展的大致时期和过程如何? 4统计学产生与发展的大致时期和过程如何? 5统计学发展过程中有哪些主要学派?其学术观点是什么?主要代表人物及其对统计学的贡献有哪些? 6统计学有哪些分科?他们之间的关系是什么? 7统计学与其他学科之间有些什么联系? 8统计研究的对象是什么? 9统计研究的特点有哪些? 10统计研究的方法有哪些类别? 11如何理解大量观测
3、法? 12 统计描述法和统计推断法的区别和联系是什么 13统计的作用有哪些? 案例讨论题 根据中华人民共和国国家统计局网站 (http:/ 2006 年 1-8月份全国工业实现利润及同比增长如下图所示。 2006 年 1-8 月份全国工业实现利润及同比增长图 2006 年 1-8 月份,全国规模以上工业企业(全部国有工业企业和年产品销售收入 500万元以上的非国有工业企业,下同)实现利润 11327 亿元,比去年同期增长 29.1%。工业经济效益综合指数 184.96,比去年同期提高 16.33 点。 2 在规模以上工业企业中,国有及国有控股企业实现利润 5086 亿元,比去年同期增长19.7
4、%;集体企业实现利润 339 亿元,增长 32.1%;股份制企业实现利润 6113 亿元,增长31%;外商及港澳台商投资企业利润 3136 亿元,增长 26.9%;私营企业实现利 润 1672 亿元,增长 53.1%。在 39 个工业大类中,石油和天然气开采业利润同比增长 40.2%,有色金属冶炼及压延加工业增长 105.2%,交通运输设备制造业增长 53%,专用设备制造业增长 51.7%,电力行业增长 37.2%,电子通信行业增长 28.1%,煤炭行业增长 12.3%,化工行业增长 15.1%,钢铁行业利润同比下降 2.5%,石油加工及炼焦业净亏损 378 亿元。 规模以上工业企业税金总额
5、8497 亿元,同比增长 23.4%, 其中,国有及国有控股企业税金总额 4803 亿元,增长 18.9%。规模以上工业实现主营业务收入 191357 亿元,同比增长26.1%,其中,国有及国有控股企业 63618 亿元,增长 20.2%。 8 月末,规模以上工业企业应收帐款净额 30454 亿元,同比增长 19.5%, 其中,国有及国有控股企业应收帐款净额 7898亿元,增长 9%。工业产成品资金 14054 亿元,同比增长 17.3%,其中,国有及国有控股企业产成品资金 3861 亿元,增长 13.1%。 讨论题: ( 1)试描述该研究的统计目的; ( 2)由 2006 年 1-8 月份全
6、国工业实现利润及同比增长图可以看出哪些统计数据。 ( 3)调查了哪些企业; ( 4)试描述该研究的统计分 析过程。 3 第二章 统计数据的收集与整理 复习思考题 1统计调查有哪些分类 ?它们有什么特点 ?运用于什么样的社会经济现象 ? 2统计调查方案包括哪几个方面的内容 ?请针对调查某产品销售情况,设计一个调查方案。 3.统计分组的方法有哪些 ?区分简单分组、复合分组、单项式分组、组距式分组、等距分组和异距分组等分组方法,结合实际加以运用。 4. 调查对象、调查单位和报告单位相互之间有什么关系? 5反映总体集中趋势的指标有哪几种 ?离散趋势的指标有哪几种?各有什么特点和作用? 6 某班 45
7、名学生“统计学”考试成绩从 低分到高分排列如下: 50 5l 52 56 58 59 5l 62 63 64 65 66 67 68 69 70 71 72 72 72 73 74 74 74 75 75 76 76 77 78 79 80 81 83 84 84 86 86 87 88 90 91 93 97 99 试将上述资料编成等距数列,计算组距、组中值,编制统计表。 7根据下表资料,计算强度相对数的正指标和逆指标,并根据正指标数值分析该地区医疗卫生设施的变动情况。 指标 1999 年 2005 年 医院数量(个) 60 89 地区人口总数(万人) 112.5 132.3 8甲乙两班同时
8、进行数学考试,有关成绩分布如下表所示,哪一个班级考试成绩好些?哪一个班级成绩较为稳定? 甲班 乙班 成绩(百分制) 学生人数 (人 ) 成绩 (5 分制 ) 学生人数() 60 分以下 60-69 70-79 80-89 90-100 3 13 18 13 5 1 2 3 4 5 0 11 39 36 14 9某市奶粉厂有甲、乙两车间生产某种品牌豆奶粉,每包标准重量定为 400 5 克。从甲车间随机抽得 100 包、有关资料如下表所示。又已知乙车间奶粉平均重量为 400.6g包,标准差为 5.2g。 4 按豆奶粉重量分组 (g/包 ) 数量 /包 390 以下 390-394 394-398
9、398-402 402-406 406-410 410 以上 2 9 19 39 18 9 4 合计 100 试求: (1) 甲车间豆奶粉的平均重量; (2) 甲车间豆奶粉重量的全距 (近似值 ); (3) 甲车间豆奶粉的不合格率; (4) 甲、乙两车间豆奶粉的平均重量哪一个更接近标准中心值 ?哪个车间的平均重量更具有代表性 ? (5) 甲车间豆奶粉重量的众数和中位数; (6) 甲车间奶粉重量属何种分布状态? 10对某地区农村劳动力进行抽样调查,得到劳动力按年龄的统计资料如下表所示。 年龄(周岁) 比重 (%) 25 以下 25-30 30-40 40-50 50 以上 9 21 42 20
10、8 合计 100 ( 1)试计算劳动力平均年龄、方差、偏度及峰度; (2) 绘制劳动力年龄直方图与饼分图 案例讨论题 城镇家庭收入情况 反映了城镇居民生活现状及变化情况, 2004 年我国 各地区城镇居民平均每人 全年 家庭收入 及 来源 情况,如下表所示。 数据来源于国家统计局城市社会经济调查总队的城镇住户调查,是对城镇居民家庭抽样调查汇总的结果。其中, 城镇家庭总收入 指家庭成员得到的工薪收入、经营净收入、财产性收入、转移性收入之和,不包括出售财物收入和借贷收入。 城镇家庭可支配收入是 指家庭成员得到可用于 最终消费支出和其它非义务性支出以及储蓄的总和,即居民家庭可以用来自由支配的收入。它
11、是家庭总收入扣除交纳的所得税、个人交纳的社会保障支出以及记账补贴后的收入。 2004 年我国 各地区城镇居民平均每人 全年 家庭收入 情况及 来源 如下表所示。 5 单位 (元 ) 地区 可支配收入 总收入 总收入 工薪收入 经营净收入 财产性收入 转移性收入 北京 15637.84 17116.46 11590.45 177.54 146.45 5202.02 天津 11467.16 12279.73 7508.72 600.40 123.55 4047.06 河北 7951.31 8381.42 5589.89 334.28 108.97 2348.28 山西 7902.86 8428.8
12、1 6338.80 335.91 141.19 1612.92 内蒙古 8122.99 8488.13 5893.79 757.82 98.59 1737.93 辽宁 8007.56 8706.46 5806.05 333.47 79.35 2487.58 吉林 7840.61 8226.78 5447.36 791.60 69.69 1918.14 黑龙江 7470.71 7803.41 5031.88 611.30 46.04 2114.18 上海 16682.82 18501.66 13156.67 506.77 214.74 4623.47 江苏 10481.93 11236.68 6
13、869.00 752.10 202.02 3413.56 浙江 14546.38 15881.63 10752.74 1336.37 383.55 3408.98 安徽 7511.43 7993.55 5583.71 513.20 117.96 1778.68 福建 11175.37 12117.93 7996.08 729.86 347.97 3044.02 江西 7559.64 7876.70 5541.74 433.67 88.52 1812.77 山东 9437.80 10187.12 8327.11 299.94 116.84 1443.23 河南 7704.90 8073.36 5
14、322.07 429.33 126.04 2195.92 湖北 8022.75 8522.06 6390.81 291.87 122.72 1716.66 湖南 8617.48 9190.21 6807.36 494.07 92.90 1795.88 广东 13627.65 14953.39 11646.42 738.35 371.29 2197.34 广西 8689.99 9324.00 6737.70 341.90 174.20 2070.21 海南 7735.78 8121.85 5599.27 261.99 267.81 1992.78 重庆 9220.96 9910.09 7162.
15、69 228.53 109.67 2409.20 四川 7709.87 8261.44 5461.35 439.25 197.40 2163.45 贵州 7322.05 7518.72 5135.14 576.33 54.21 1753.04 云南 8870.88 9546.29 6138.33 518.17 334.41 2555.38 西藏 9106.07 10395.86 10204.52 42.59 1.18 147.58 陕西 7492.47 8043.23 5725.33 201.25 138.45 1978.20 甘肃 7376.74 7990.65 6087.37 330.43
16、 53.37 1519.49 青海 319.67 7785.09 5022.57 299.21 67.25 2396.05 宁夏 217.87 7748.53 5166.44 495.12 60.03 2026.93 新疆 7503.42 8201.82 6394.50 371.74 62.95 1372.63 数据来源:中华人民共和国国家统计局网站 http:/ 讨论题: (1) 编制每种收入形式下收入量的频 数与频率分布统计表。 (2) 绘制 每种收入形式 下 收入 量的条形图和 直方 图。 (3) 对 可分配收入、总收入及总收入中每种收入形式 下的均值和中位数进行比较,并给出相应的解释。
17、 (4) 比较各种 收入 方式下 收入 金额的离散程度。 (5) 绘制箱线图。 (6) 谈一谈你对 我国不同地区城镇居民家庭收入及来源情况 的看法或建议。 6 第三章 抽样分布 复习思考题 1对于有限总体,要得到一个简单随机样本,需要采用有放回的抽样,为什么?而无限总体则 为何 无须此要求? 2如何理解一个总体就是一个具有确定概率分布的随机变量。 3设 1621 , XXX 为 )0( 24,N 的一个样本,则 1612161i iX的数学期望和方差分别为多少? 4在总体 ),( 2N 中抽取样本 4321 , XXXX ,其中 已知而 2 未知。在样本的函数: 41i iX, 321 XX
18、, ),m in( 4321 XXXX , 41221i iX, | 14 XX 中哪些是统计量,哪些不是 统计量,为什么? 5在总体 )( 23.6,52N 中随机抽取一容量为 36 的样本,求样本均值落在 50.8 到 53.8之间的概率。 6. 设总体 X 服从正态分布 ),( 2N , 4321 , XXXX 为其一个样本,( 1)试给出4321 , XXXX 的联合分布密度函数;( 2)给出样本均值 X 的密度函数。 案例讨论题 在 1936 年的美国总统选举中有两位候选人,即民主党候选人罗斯福( F.D.Roosevelt)和共和党候选人兰登( G.A.London)。 有一家文摘
19、杂志通过从电话号码簿和一些俱乐部成员的名单中选取 1000 万人,以发出询问信的方式进行民意调查,共有 240 万人作出了回答。据此资料,此文摘杂志预测兰登将以获得 57%的选票获胜,而罗斯福的得票率将是 43%。而选举 结果罗斯福的得票率则是 62%,兰登仅得到 38%的选票。为此,这家杂志社很快就倒闭了。 自 1916 年以来,此家杂志每次所作的预测都是正确的,因而影响很大。这次它的预测是 基于巨大数字的 240 万 答卷作出的,却预测错误。 当时有电话的家庭有 1100 万户,失业者有 900 万人。 有一个叫乔治 .盖洛普( George Gallup)的人建立的一个调查组织从 100
20、0 万人中随机选取了 3000 人,就提前知道了文摘将要得出的结论:兰登将以 56%的选票获胜,这与文摘公布结果的仅差 1%,而这个结论来自于 3000 人而非 240 万人。 盖洛 普从更大的范围内随机选取了 5000 人,据此预测罗斯福将以 56%得票率获胜,而兰登的得票率为 44%。 与实际结果差 6%。 讨论题: 7 ( 1)此文摘杂志社此次预测错误的根本原因? ( 2)为什么盖洛普预测成功? ( 3)预测的误差是否随着抽样数量的增加而减少? ( 4)从这个案例分析中得到什么启发? 8 第四章 统计推断 复习思考题 1 设 4321 , XXXX 为总体 X 的一个样本,且设总体的方差
21、大于零 。 一般说来,总体均值 的 无 偏 估 计 量 有 多 个 。 试 验 证 统 计 量 :31 74271172 XT XX ,42 41361241131 XT XXX , 413 41i iXT都是总体均值 的无偏估计量,那么,在实际使用中我们一般取上述 3 个统计量中哪一个,为什么? 2 假设检验中的显著性水平的意义? 3 假设检验依据的是哪个基本原理? 4 随 机 地 取 8 只 活 塞 环 , 测 得 它 们 的 直 径 ( 单 位 : mm )为:74.001,74.005,74.003,74.001,74.000, 73.998,74.006,74.002,试求总体均值和
22、方差的矩估计量 。 5 某一地质学家为了研究密歇根湖湖滩地区的岩石成分,随机地自该地区抽取 100 个样品,每个样品有 10 块石子,记录了每个样品中属于石灰石的石子数 。 假设这 100 次 观测相互独立,并由以往经验知它们都服从参数为 10n , p 的二项分布 。 这里 p 为这一地区石子为石灰石的概率 。 试求 p 的最大似然估计 。 测得的数据为: 样品中属石灰石的石子数 0 1 2 3 4 5 6 7 8 9 10 观测 到石灰石的样品数 0 1 6 7 23 26 21 12 3 1 0 6 设某种清漆的 9 个样品,其干燥时间(以小时计)分别为:6.0,5.7,5.8,6.5,
23、7.0,6.3,5.6,6.1,5.0,又假设干燥时间总体服从正态分布 ),( 2N ,在以下条件下,试求 的置信度为 0.95 的置信区间:( 1)若由以往经验知 6.0 (小时);( 2)若 为未知 。 7某大学的学生管理部门为了解学生每天的上网时间,在全校 10000 名学生中采用不重复的方法随机抽取了 40 人,得到他们每天的上网时间如下 3.3 4.4 2.1 4.7 3.1 2.0 1.9 1.4 6.2 5.4 1.2 1.2 5.8 2.6 5.1 2.9 2.4 4.2 1.8 4.1 3.5 4.3 6.4 2.3 5.4 3.5 3.6 0.5 4.5 5.7 0.8 3
24、.6 3.2 2.3 1.5 2.5 1.7 3.2 0.8 4.1 试在置信度分别为 0.9, 0.95 下,给出该校大学生平均上网时间的置信区间。 8某家用电器生产厂想要了解某市居民使用其品牌空调的情况,在该市随机调查了 200户居民,发现其中有 46 户使用其品牌。对于置信度 0.95,求该市居民户中使用此品牌空调的比率的置信区间。 9 9 经测定某批矿沙的 5 个样品中镍的含量为( %): 3.25,3.27,3.24,3.26,3.24。 设测定值总体服从正态分布,问在显著性水平 0.01 下能否接受假设:这批矿沙的镍 含量的均值为3.25。 10一项随机调查了 200 个家庭的工作
25、显示,每个家庭每天看电视的平均时间为 7.25小时,标准差为 2.5 小时。据报道, 10 年前每个家庭每天看电视的平均时间为 6.7 小时,在显著性水平 0.01 下,这个调查资料能否支持你的观点:“现在每个家庭每天收看电视的平均时间增加了”? 11某著名医生声称有 75%的女性所穿的鞋子过小。有一个研究机构随机调查了 356名女性,发现其中有 313 名女性所穿鞋子的尺码至少小一号。在显著性水平 0.05 下,检验假设: 75.0:,75.0: 10 PHPH 12 某化纤厂生产的维尼伦,在正常情况下,其纤度服从正态分布,方差为 0.052。 现使用新的原材料进行生产,抽取 6 根进行纤度
26、试验,检测结果为 1.35,1.54,1.40,1.55,1.45,1.39。 问利用新的原材料生产,纤度的方差有无显著变化(显著性水平为 0.05) 。 13某药品研究所要测试两种减肥药的效果,在自愿者中随机选取了 100 名,且随机地平分成两组,第一组服用减肥药甲,第二组服用减肥药乙,经过一段时间后对试验者的体重测量。结果显示,第一组平均减少 5.2 千克,标准差为 2 千克;第二组平均减少 4.7 千克,标准差为 2.3 千克。在显著性水平 0.05 下,试检验这两种减肥药的效果有否显著差异? 14 有两台铣床生产同一种型号的套管,要比较它们所生产的套管内槽深度的方差,测得深度数据为(单
27、位: mm) 第一台铣床 15.2 15.1 14.8 14.8 15.5 15.2 15.0 14.5 第二台铣床 15.2 14.8 15.0 14.8 15.1 15.2 14.8 15.0 15.0 假设两样本独立,且分别来自两个正态总体,试判断第二台铣床产品的方差是否比第一台铣床的要小(显著性水平为 0.05) 15检查了一本书的 100 页,记录各页中印刷错误数, 结果为 错误个数 if 0 1 2 3 4 5 6 7 含 if 错误的页数 36 40 19 2 0 2 1 0 由此资料能否认为一页中的印刷错误数 服从泊松分布(显著性水平为 0.05) ? 案例讨论题 某中学的中考
28、升学率一直不高,学生家长对此意见较大,有的学生通过各种渠道转到其他学校就读,学校的声誉受到较大的影响 。 为此, 学校 主 管 部门对学校的领导班子进行了调整 。 新任校长通过调查研究,针对学校存在的问题,进行了一系列的改革,经过一年的实践,学校的教风、学风得到明显改善 。 在当地教育系统组织的一些评比、竞赛活动中 也取得了较好的成绩,学生家长对此也很满意 。 罢 有一天这所中学的校长看到了这样一则报道:“这一城市的初中生平均每周看电视 8 小时 ”。 他认为他领导的学校,学生看电视的时间明显小于该数字 。 为此,他在他的学校里随机地调查了 100 个学生,得到这 100 个学生平均每周看电视的时间为 6.5 小时,这一个样本的标准差为 2 小时 。 试讨论下列问题: