1、1第 2 讲 用样本估计总体【2013 年高考会这样考】1考查样本的频率分布(分布表、直方图、茎叶图)中的有关计算,样本特征数(众数、中位数、平均数、标准差)的计算主要以选择题、填空题为主2考查以样本的分布估计总体的分布(以样本的频率估计总体的频率、以样本的特征数估计总体的特征数)【复习指导】1由于高考对统计考查的覆盖面广,几乎对所有的统计考点都有所涉及,其中频率分布直方图、均值与方差、茎叶图是核心考点,需要好好掌握复习时,对于统计的任何环节都不能遗漏,最主要的是掌握好统计的基础知识,适度的题量练习2高考对频率分布直方图或茎叶图与概率相结合的题目考查日益频繁因此,复习时要加强这方面的训练,弄清
2、图表中有关量的含义,并从中提炼出有用的信息,为后面的概率计算打好基础 基础梳理1频率分布直方图(1)通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的分布;另一种是用样本的数字特征估计总体的数字特征(2)作频率分布直方图的步骤求极差(即一组数据中最大值与最小值的差)决定组距与组数将数据分组列频率分布表画频率分布直方图(3)在频率分布直方图中,纵轴表示 ,数据落在各小组内的频率用各小长方形的面积表频 率组 距示各小长方形的面积总和等于 1.2频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图(2)总体密度曲线:随着样
3、本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线23茎叶图的优点用茎叶图表示数据有两个突出的优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示4样本方差与标准差设样本的元素为 x1, x2, xn,样本的平均数为 ,x(1)样本方差: s2 (x1 )2( x2 )2( xn )21n x x x(2)样本标准差:s .1n x1 x 2 x2 x 2 xn x 2两个异同(1)众数、中位数与平均数的异同众数、中位数及平均数都是描述一组数据集中趋势的量,平均数
4、是最重要的量由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质. 众数考查各数据出现的频率,其大小只与这组数据中的部分数据有关当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题某些数据的变动对中位数可能没有影响中位数可能出现在所给数据中,也可能不在所给数据中当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势(2)标准差与方差的异同标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度则越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所
5、以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差三个特征利用频率分布直方图估计样本的数字特征:(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和(3)众数:最高的矩形的中点的横坐标双基自测1(人教 A 版教材习题改编)某工厂生产滚珠,从某批产品中随机抽取 8 粒,量得直径分别3为(单位:mm):14.7,14.6,15.1,15.0,14.8,15.1,15.0,14.9,则估计该厂生产的滚珠直径的平均数为( )A14.8 mm B14.9
6、 mmC15.0 mm D15.1 mm解析 平均数 (14.714.615.115.014.815.115.014.9)14.9 (mm)x18答案 B2(2012合肥月考)一个容量为 100 的样本,其数据的分组与各组的频数如下:组别 (0,10 (10,20 (20,30 (30,40 (40,50 (50,60 (60,70频数 12 13 24 15 16 13 7则样本数据落在(10,40上的频率为( )A0.13 B0.39C0.52 D0.64解析 由列表可知样本数据落在(10,40上的频数为 52,故其频率为 0.52.答案 C3(人教 A 版教材习题改编)10 名工人某天生
7、产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天 10 名工人生产的零件的中位数是( )A14 B16 C15 D17解析 将这组数据从小到大排列得 10,12,14,14,15,15,16,17,17,19.故中位数为15.15 152答案 C4.某雷达测速区规定:凡车速大于或等于 70 km/h 的汽车视为“超速” ,并将受到处罚,如图是某路段的一个检测点对 200 辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有( )A30 辆 B40 辆 C60 辆 D80 辆解析 由题图可知,车速大于或等于 70 km/
8、h 的汽车的频率为 0.02100.2,则将被处罚的汽车大约有 2000.240(辆)答案 B45(2011江苏)某老师从星期一到星期五收到的信件数分别为 10,6,8,5,6,则该组数据的方差 s2_.解析 平均数 7.x10 6 8 5 65 s2 (107) 2(67) 2(87) 2(57) 215(67) 2 (91141)3.2.15答案 3.2 考向一 频率分布直方图的绘制与应用【例 1】某校从参加高一年级期中考试的学生中随机抽出 60 名学生,将其物理成绩(均为整数)分成六段40,50),50,60),90,100后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(
9、1)求分数在70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分审题视点 利用各小长方形的面积和等于 1 求70,80)内的频率解 (1)设分数在70,80)内的频率为 x,根据频率分布直方图,有5(0.0100.01520.0250.005)10 x1,可得 x0.3,所以频率分布直方图如图所示(2)平均分为: x450.1550.15650.15750.3850.25950.0571(分)频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布根据频率分布直方图估计样本(或
10、者总体)的平均值时,一般是采取组中值乘以各组的频率的方法【训练 1】 (2011湖北)有一个容量为 200 的样本,其频率分布直方图如图所示根据样本的频率分布直方图估计,样本数据落在区间10,12)内的频数为( ) A18 B36C54 D72解析 样本数据落在区间10,12)内的频率 1(0.190.150.050.02)20.18,所以数据落在此区间的频数为 2000.1836.答案 B考向二 茎叶图的应用【例 2】如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中 m 为数字 09 中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为 a1、
11、a2,则一定有( )A a1 a26B a2 a1C a1 a2D a1, a2的大小与 m 的值有关审题视点 去掉的最低分和最高分就是第一行和第三行的数据,剩下的数我们只要计算其叶上数字之和,即可对问题作出结论解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是 20,乙选手叶上的数字之和是 25,故 a2 a1.故选 B.答案 B由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断,这类试题往往伴随着对数据组的平均值或者是方差的计算等【训练 2】 在一项大西瓜品种的实验中,共收获甲种大西瓜 13 个
12、、乙种大西瓜 11 个,并把这些大西瓜的重量(单位:斤,1 斤500 克)制成了茎叶图,如图所示,据此茎叶图写出对甲乙两种大西瓜重量的两条统计结论是:(1)_;(2)_解析 从这个茎叶图可以看出,甲种大西瓜的重量大致对称,平均重量、众数及中位数都是 30 多斤;乙种大西瓜的重量除了一个 51 斤外,也大致对称,平均重量、众数及中位数都是 20 多斤,但甲种大西瓜的产量比乙种稳定,总体情况比乙好答案 (1)甲种大西瓜的平均重量大于乙种大西瓜 (2)甲种大西瓜的产量比乙种大西瓜稳定考向三 用样本的数字特征估计总体的数字特征【例 3】甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图7(1)
13、分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价审题视点 (1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价解 (1)由图象可得甲、乙两人五次测试的成绩分别为甲:10 分,13 分,12 分,14 分,16 分;乙:13 分,14 分,12 分,12 分,14 分. 甲 13,x10 13 12 14 165乙 13,x13 14 12 12 145s (1013) 2(1313) 2(1213) 2(1413) 2(1613) 24,2甲15s (1313) 2(1413) 2(1213) 2(1213)
14、2(1413) 20.8.2乙15(2)由 s s 可知乙的成绩较稳定2甲 2乙从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小【训练 3】 甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了 5 次,成绩如下表(单位:环):甲 10 8 9 9 9乙 10 10 7 9 9如果甲、乙两人中只有 1 人入选,则入选的最佳人选应是_解析 甲 乙 9 环, s (910) 2(98
15、) 2(99) 2(99) 2(99) 2 ,x x 2甲15 25s (910) 2(910) 2(97) 2(99) 2(99) 2 s ,故甲更稳定,故填2乙15 65 2甲甲答案 甲规范解答 19怎样解答茎叶图与概率的综合性问题8【问题研究】 茎叶图是一个将数据分成主、次两部分,把主要部分当做茎、次要部分当作叶表达数据的一个图,它是一种常用的统计图.因此考题常将茎叶图作为载体来考查平均数、方差以及概率问题.【解决方案】 首先对茎叶图中的数据全面分析,然后再根据茎叶图的数据解决其它问题.【示例】(本题满分 12 分)(2011北京)以下茎叶图记录了甲、乙两组各四名同学的植树棵数乙组记录中
16、有一个数据模糊,无法确认,在图中以 X 表示(1)如果 X8,求乙组同学植树棵数的平均数和方差;(2)如果 X9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数为 19的概率(注:方差 s2 (x1 )2( x2 )2( xn )2,其中 为 x1, x2, xn的平均数)1n x x x x第(1)问直接套入公式求值;第(2)问利用古典概型的知识解决解答示范 (1)当 X8 时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,所以平均数为 .(2 分)x8 8 9 104 354方差为s214(8 354)2 (8 354)2 (9 354)2 (10 354)2 .(5
17、 分)1116(2)记甲组四名同学为 A1, A2, A3, A4,他们植树的棵数依次为 9,9,11,11;乙组四名同学为 B1, B2, B3, B4,他们植树的棵数依次为 9,8,9,10.分别从甲、乙两组中随机选取一名同学,所有可能的结果有 16 个,它们是:(A1, B1),( A1, B2),( A1, B3),( A1, B4),( A2, B1),( A2, B2),( A2, B3),( A2, B4),(A3, B1),( A3, B2),( A3, B3),( A3, B4),( A4, B1),( A4, B2),( A4, B3),( A4, B4),(9分)用 C 表示:“选出的两名同学的植树总棵数为 19”这一事件,则 C 中的结果有 4 个,它们是:( A1, B4),( A2, B4),( A3, B2),( A4, B2)故所求概率为 P(C) .(12 分)416 14茎叶图一般记录两组的数据,它最直观、最清晰,但利用茎叶图解决概率问题时对重复出现的数据要重复记录,不能遗漏9