1、思考题与练习题参 考 答 案【友情提示】请各位同学完成思考题和练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行!第一章 绪论思考题参考答案1 不能,英军所有战机= 英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。2 问
2、题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。3 能,拯救和发展自己的参考路径为:找出自己的优点,明确自己大学阶段的最佳目标,拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。练习题参考答案一、填空题1 调查。2 探索、调查、发现。3. 目的。二、简答题1 瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。2 统计学解决实际问题的基本思路,即基本步骤是: 提出与统计有关的实际问题;建立有效的指标体系;收集数据;选用或创造有效的统计方法整理、显示所收集数据的特征
3、;根据所收集数据的特征、结合定性、定量的知识作出合理推断; 根据合理推断给出更好决策的建议。不解决问题时,重复第-步。3 在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。三、案例分析题1 总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生 课程的成绩;指标:全班学生 课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学 课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生 课程的平均成绩;随机变
4、量:我班部分同学 课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生 月 门课程的出勤率;时间序列数据:我班学生 课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生 课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。2 (1)总体:广州市大学生;单位:广州市的每个大学生。(2) 如果调查中了解的是价格高低,为定序尺度;如果调查中了解的是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4) 是用统计量作为参数的估计。(5)推断统计。3 (1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:
5、车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%; (6)30%。第二章 收集数据思考题参考答案1 二手数据的特点主要有:易获得;成本低;快速获得;相关性差;时效性差和可靠性低。对于任何一项研究,首先想到有没有现成的二手数据可用,实在没有或有但无法使用时才进行原始数据的收集。2 普查的特点有:一次性的;规定统一的标准时点调查期限;数据一般比较准确,规范化程度较高;使用范围比较窄;调查质量不易控制;工作量大,花费大,组织工作复杂;易产生重复和遗漏现象等特点
6、。抽样调查的特点有:经济性好;实效性强;适应面广;准确性高。3 两者不能替代。两者的目的不同,调查对象不同,组织方式不同。经济普查的“全面”包括所有经济体,比如个体户,而全面统计报表中的“全面”是相对的,只有注册为公司或企业并具有一定经济规模的经济体,才是调查对象,并不包括个体经营户。4 略。练习题参考答案一、判断题1. 2. 3. 4. 5. 6. 7. 8. 9. 10.二、单项选择题1.C 2.B 3.C 4.A 5.D 6.C三、略。第三章 整理和显示数据思考题答案1 因为收集的数据符合数据通常要求后,往往杂乱无章,不可用,所以有必要对数据进行整理。2 比如市场营销专业。为了解各种不同
7、饮料在市场的占有率情况,于是采用了问卷调查方法,得到相关的数据结果,整理成如下所示频数分布表和复式条形图来显示结果。3195465647012345678910百 事 可 乐 汇 源 果 汁 可 口 可 乐 露 露 旭 日 升 冰 茶男女3洛伦茨曲线的思想是洛伦茨曲线图是用人口累计率与收入累计率绘出散点图,并用平滑曲线来连接这些散点,以此来描述一国财富或收入分配状况的统计工具。其一般为一条向下弯曲的曲线,偏离 45 度角直线越小,表明该社会收入分配状况的平等化程度越高,偏离 45 度角直线越大,表明该社会收入分配状况的平等化程度越低。练习题参考答案一、单选题1 C 2D 3 A二、简答题1.数
8、值型数据的统计分组方法有两种,一种是单变量值分组,一种是组距分组。单变量值分组就是将一个变量值作为一组,总体中有几个不同的变量值就分几个组,适合于离散型变量,且适合变量值较少的情况。组距式分组是将变量值的一个区间作为一组,适合于连续变量和变量值较多的离散型变量情况。2.( 1) 70 应为第四组,因为是遵循“上组限不在内”的原则。70 只能作为下限值放在第四组。(2 ) 91 没有被分入组内,是违背了“不重不漏”的原则。三、实操题1.( 1)上面数据属于分类型数据(2 )频数分布表如下表所示:类别 频数 比例 百分比(%)A 10 0.25 25B 9 0.225 22.5C 7 0.175
9、17.5D 6 0.15 15E 8 0.20 20(3 )条形图如下所示10 97 6 8024681012A B C D E频 数频 数饼图如下所示25%22%18%15%20%频 数ABCDE2. 2. (1)Excel 中得到的频数分布表贷款数分组 频数 频率(% )向上累计频率(% )500 以下 6 15 155001000 16 40 5510001500 8 20 7515002000 6 15 902000 以上 4 10 100合 计 40 100 (2 )在Excel中绘制的频率直方图15%40%20%15%10%0%5%10%15%20%25%30%35%40%45%5
10、00以 下 500 1000 1000 15001500 2000 2000以 上系 列 1在Excel中绘制的累计频率分布图(3 )钟型右偏分布。3最低温度的茎叶图最低温度 Stem-and-Leaf PlotFrequency Stem .22L(3 ) ()9.01ixsn(4 )因为是单峰分布,且满足 ,所以该组数据近似左偏分布。exM2.( 1)因为该题中产品销售额和销售利润两组数据的变量值水平不同,所以比较产品销售额和销售利润的差异应该选用离散系数这个统计量。(2 )因为 ;1584ixn21()90.1ixsn;23.2ix2()4.ixs所以 190.1.485svx2.0.6
11、2831svx因为 ,所以销售利润这组数据的差异大。12s3.( 1)假定数据对称分布,判断数据的百分比问题应该用经验法则。因为新员工的平均得分是 85 分,标准差是 5 分,所以可以判断 7595 分正好对应着均值2 倍的标准差范围,根据经验法则可知大约有 95%的数据落在此范围内。(2 )假定员工得分的分布未知,判断数据的百分比问题应该用切比雪夫不等式。因为新员工的平均得分是 85 分,标准差是 5 分,所以可以判断 7595 分正好对应着均值2 倍的标准差范围,根据切比雪夫不等式( ,其中 k 为标准差前的倍数)可知至少有 75%的21-数据落在此范围内。4根据题意,应用标准分数来比较。第一学期小明微积分的标准分数: ;257081sxz第二学期小明微积分的标准分数: ;.1062sxz因为 ,所以小明第一学期的微积分成绩更理想。21z5.( 1) 84015ixf甲 850163ixf乙因为 ,所以供应商乙的灯泡寿命更长。x甲 乙(2 )因为 2()58.4761ixfsn甲 甲甲 2().3ixfs乙 乙乙所以 258.4760.251svx甲 甲甲 261.80.2461svx乙 乙乙因为 ,所以可知供应商甲灯泡寿命更稳定。s甲 乙(3 )因为是分组数据,所以偏态系数026.98.1726543saSK甲 153.017982.33saSK乙峰态系数