1、 统计与统计案例1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等.2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题1 随机抽样(1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少(2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多(3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成2 常用的统计图表(1)频率分布直方图小长方形的面积组距 频
2、率;频 率组 距各小长方形的面积之和等于 1;小长方形的高 ,所有小长方形的高的和为 .频 率组 距 1组 距(2)茎叶图在样本数据较少时,用茎叶图表示数据的效果较好3 用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数数字特征 样本数据 频率分布直方图众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标中位数将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分左右两个面积相等的分界线与 x 轴交点的横坐标平均数 样本数据的算术平均数每个小矩形的面积乘以小矩形底边中点的横坐标之和(2)方差: s2 (x1 )2( x2 )2( xn )
3、21n x x x标准差:s .1n x1 x 2 x2 x 2 xn x 24 变量的相关性与最小二乘法(1)相关关系的概念、正相关和负相关、相关系数(2)最小二乘法:对于给定的一组样本数据( x1, y1),( x2, y2),( xn, yn),通过求Q (yi a bxi)2最小时,得到线性回归方程 x 的方法叫做最小二乘法ni 1 y b a 5 独立性检验对于取值分别是 x1, x2和 y1, y2的分类变量 X 和 Y,其样本频数列联表是:y1 y2 总计x1 a b a bx2 c d c d总计 a c b d n则 K2 (其中 n a b c d 为样本容量).n ad
4、bc 2 a b c d a c b d考点一 抽样方法例 1 (2012山东)采用系统抽样方法从 960 人中抽取 32 人做问卷调查,为此将他们随机编号为 1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为 9.抽到的 32 人中,编号落入区间1,450的人做问卷 A,编号落入区间451,750的人做问卷B,其余的人做问卷 C.则抽到的人中,做问卷 B 的人数为 ( )A7 B9 C10 D15答案 C解析 由系统抽样的特点知:抽取号码的间隔为 30,抽取的号码依次为960329,39,69,939.落入区间451,750的有 459,489,729,这些数构成首项为459,
5、公差为 30 的等差数列,设有 n 项,显然有 729459( n1)30,解得 n10.所以做问卷 B 的有 10 人在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为 (N 为样本容量),首先确定在第一组中抽取的个体的号码Nn数,再从后面的每组中按规则抽取每个个体解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值(1)(2013江西)总体由编号为 01,02,19,20 的 20 个个体组成,利用下面的随机数表选取 5 个个体,选取方法是从随机数表第 1 行的第
6、 5 列和第 6 列数字开始由左到右依次选取两个数字,则选出来的第 5 个个体的编号为( )7816 6572 0802 6314 0702 4369 9728 01983204 9234 4935 8200 3623 4869 6938 7481A.08 B07 C02 D01(2)某单位 200 名职工的年龄分布情况如图所示,现要从中抽取 40 名职工作样本用系统抽样法,将全体职工随机按 1200 编号,并按编号顺序平均分为 40 组(15 号,610 号,196200 号)若第 5 组抽出的号码为 22,则第 8 组抽出的号码应是_若用分层抽样方法,则 40 岁以下年龄段应抽取_人答案
7、(1)D (2)37 20解析 (1)从第 1 行第 5 列、第 6 列组成的数 65 开始由左到右依次选出的数为:08,02,14,07,01,所以第 5 个个体编号为 01.(2)由分组可 知,抽号的间隔为 5,又因为第 5 组抽出的号码为 22,即第 n 组抽取的号码为 5n3,所以第 8 组抽出的号码为 37;40 岁以下年龄段的职工数为2000.5100,则应抽取的人数为 10020 人40200考点二 用样本估计总体例 2 (1)(2013四川)某学校随机抽取 20 个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为 5 将数据分组成0,5),5,10),30
8、,35),35,40时,所作的频率分布直方图是( )(2)(2013江苏)抽样统计甲、乙两位射击运动员的 5 次训练成绩(单位:环),结果如下:运动员 第 1 次 第 2 次 第 3 次 第 4 次 第 5 次甲 87 91 90 89 93乙 89 90 91 88 92则成绩较为稳定(方差较小)的那位运动员成绩的方差为_答案 (1)A (2)2解析 (1)由于频率分布直方图的组距为 5,去掉 C、D,又0,5),5,10)两组各一人,去掉 B,应选 A.(2) 甲 (8791908993)90,x15乙 (8990918892)90,x15s (8790) 2(9190) 2(9090)
9、2(8990) 2(93 90)24,2甲15s (8990) 2(9090) 2(9190) 2(8890) 2(9290) 22.2乙15(1)反映样本数据分布的主要方式有:频率分布表、频率分布直方图、茎叶图关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小在“2012 魅力新安江”青少年才艺表演评比活动中,参赛选手成绩的茎叶图和频率分布直
10、方图都受到不同程度的破坏,可见部分如图,据此回答以下问题:(1)求参赛总人数和频率分布直方图中80,90)之间的矩形的高,并完成直方图;(2)若要从分数在80,100之间任取两份进行分析,在抽取的结果中,求至少有一份分数在90,100之间的概率解 (1)由茎叶图知,分数在50,60)之间的频数为 2.由频率分布直方图知,分数在50,60)之间的频率为0008100.08.所以参赛总人数为 25(人)20.08分数在80,90)之间的人数为 25271024(人),分数在80,90)之间的频率为 0.16,425得频率分布直方图中80,90)间矩形的高为 0.016.0.1610完成直方图,如图
11、(2)将80,90)之间的 4 个分数编号为 1,2,3,4;90,100之间的 2 个分数编号为 5 和 6.则在80,100之间任取两份的基本事件为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6),共 15 个,其中至少有一个在90,100之间的基本事件为(1,5),(1,6),(2,5),(2,6),(3,5),(3,6),(4,5),(4,6),(5,6),共 9 个故至少有一份分数在90,100之间的概率是 .915 35考点三 统计案例例 3 (2013
12、重庆)从某居民区随机抽取 10 个家庭,获得第 i 个家庭的月收入 xi(单位:千元)与月储蓄 yi(单位:千元)的数据资料,算得i80, i20, iyi1 84, 720.10i 1x10i 1y10i 1x10i 1x2i(1)求家庭的月储蓄 y 对月收入 x 的线性回归方程 y bx a;(2)判断变量 x 与 y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为 7 千元,预测该家庭的月储蓄附:线性回归方程 y bx a 中, b , a b ,其中 , 为样本平ni 1xiyi n x yni 1x2i n x2 y x x y均值,线性回归方程也可写为 x .y b a 解
13、 (1)由题意知 n10, i 8,x1nni 1x 8010 i 2,y1nni 1y 2010又 lxx n 2720108 280,ni 1x2i xlxy iyi n 184108224,ni 1x xy由此得 b 0.3,lxylxx 2480a b 20.380.4,y x故所求线性回归方程为 y0.3 x0.4.(2)由于变量 y 的值随 x 值的增加而增加( b0.30),故 x 与 y 之间是正相关(3)将 x7 代入回归方程可以预测该家庭的月储蓄为 y0.370.41.7(千元)(1)对具有线性相关关系的两个变量 可以用最小二乘法求线性回归方程,求 是关键,b 其中 .b
14、ni 1 xi x yi yni 1 xi x 2ni 1xiyi nx yni 1x2i nx2(2)在利用统计变量 K2( 2)进行独立性检验时,应该注意数值的准确代入和正确计算,最后把计算的结果与有关临界值相比较(1)通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计爱好 40 20 60不爱好 20 30 50总计 60 50 110由 K2( 2) 算得,n ad bc 2 a b c d a c b dK2( 2) 7.8.110 4030 2020 260506050附表:P(K2( 2) k) 0.050 0.010 0.001k 3.84
15、1 6.635 10.828参照附表,得到的正确结论是 ( )A在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关”B在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关”C有 99%以上的把握认为“爱好该项运动与性别有关”D有 99%以上的把握认为“爱好该项运动与性别无关”(2)已知 x、 y 取值如下表:x 0 1 4 5 6 8y 1.3 1.8 5.6 6.1 7.4 9.3从所得的散点图分析可知: y 与 x 线性相关,且 0.95 x ,则 等于 ( )y a a A1.30 B1.45 C1.65 D1.80答案 (1)C (2)B解析 (1)根
16、据独立性检验的定义,由 K2( 2)7.86.635 可知我们有 99%以上的把握认为“爱好该项运动与性别有关” ,故选 C.(2)依题意得, (014568)4,x16 (1.31.85.66.17.49.3)5.25;y16又直线 0.95 x 必过样本点中心( , ),即点(4,5.25),于是有y a x y5.250.954 ,由此解得 1.45.a a 1 用样本估计总体(1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为 1.(2)众数、中位数及平均数的异同众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量(3)当总体的个体数较少时,
17、可直接分析总体取值的频率分布规律而得到总体分布;当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布总体期望的估计,计算样本平均值 xi.x1n n i 1总体方差(标准差)的估计:方差 (xi )2,标准差 ,1n n i 1 x 方 差方差(标准差)较小者较稳定2 线性回归方程 x 过样本点中心( , ),这为求线性回归方程带来很多方便y b a x y3 独立性检验(1)作出 22 列联表(2)计算随机变量 K2( 2)的值(3)查临界值,检验作答.1 经问卷调查,某班学生对摄影分别持“喜欢” 、 “不喜欢”和“一般”三种态度,其中持“一般”态度的学生比持“不喜
18、欢”的学生多 12 人,按分层抽样的方法(抽样过程中不需要剔除个体)从全班选出部分学生进行关于摄影的座谈若抽样得出的 9 位同学中有 5 位持“喜欢”态度的同学,1 位持“不喜欢”态度的同学和 3 位持“一般”态度的同学,则全班持“喜欢”态度的同学人数为 ( )A6 B18 C30 D54答案 C解析 由题意设全班学生为 x 人,持“喜欢” 、 “不喜欢”和“一般”态度的学生分别占全班人数的 、,所以 x( )12,解得 x54,所以全班持“喜欢”态度的人591913 13 19数为 54 30.故选 C.592 某校从参加高三年级期中考试的学生中随机抽取 60 名学生,将其数学成绩(均为整数
19、)分成六段40,50),50,60),90,100后得到如图的频率分布直方图,请你根据频率分布直方图中的信息,估计出本次考试数学成绩的平均分为_答案 71解析 由频率分布直方图得每一组的频率依次为 0.1,0.15,0.15,0.3,0.25,0.05,又由频率分布直方图,得每一组数据的中点值依次为 45,55,65,75,85,95.所以本次考试数学成绩的平均分为450.1550.15650.15750.3850.25950.0571.x故填 71.3 随机抽取某中学甲、乙两班各 10 名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图(1)根据茎叶图判断哪个班的平均身高较高;(
20、2)计算甲班的样本方差;(3)现从乙班这 10 名同学中随机抽取两名身高不低于 173 cm的同学,求身高为 176 cm 的同学被抽中的概率解 (1)由茎叶图可知:甲班身高集中于 160 cm179 cm 之间,而乙班身高集中于170 cm180 cm 之间,因此乙班平均身高高于甲班,其中甲 x158 162 163 168 168 170 171 179 179 18210170,乙 x159 162 165 168 170 173 176 178 179 18110171.1.(2)甲班的样本方差为 (158170) 2(162170) 2(163170) 2(168170)1102(1
21、68170) 2(170170) 2(171170) 2(179170) 2(179170) 2(182170)257.2.(3)设身高为 176 cm 的同学被抽中的事件为 A.从乙班 10 名同学中抽取两名身高不低于 173 cm 的同学有:(181,173)、(181,176)、(181,178)、(181,179)、(179,173)、(179,176)、(179,178)、(178,173)、(178,176)、(176,173),共 10 个基本事件,而事件 A 含有 4 个基本事件, P(A) .410 25(推荐时间:60 分钟)一、选择题1 要完成下列两项调查:从某肉联厂的火
22、腿肠生产线上抽取 1 000 根火腿肠进行“瘦肉精”检测;从某中学的 15 名艺术特长生中选出 3 人调查学习负担情况适合采用的抽样方法依次为 ( )A用分层抽样,用简单随机抽样B 用系统抽样,用简单随机抽样C都用系统抽样D都用简单随机抽样答案 B解析 中总体容量较大,且火腿肠之间没有明显差异,故适合采用系统抽样;中总体容量偏小,故适合采用简单随机抽样2 (2012四川)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查假设四个社区驾驶员的总人数为 N,其中甲社区有驾驶员 96 人若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,
23、25,43,则这四个社区驾驶员的总人数 N 为( )A101 B808 C1 212 D2 012答案 B解析 由题意知抽样比为 ,而四个社区一共抽取的驾驶员人数为129612212543101,故有 ,解得 N808.1296 101N3 (2013福建)某校从高一年级学生中随机抽取部分学生 ,将他们的模块测试成绩分成6 组:40,50),50,60),60,70),70,80),80,90),90,100加以统计,得到如图所示的频率分布直方图已知高一年级共有学生 600 名,据此估计,该模块测试成绩不少于 60 分的学生人数为( )A588 B480 C450 D120答案 B解析 少于
24、60 分的学生人数 600(0.050.15)120(人),不少于 60 分的学生人数为 480 人4 甲、乙两位运动员在 5 场比赛的得分情况如茎叶图所示,记甲、乙两人的平均得分分别为 甲 , 乙 ,则下列判断正确的是 ( )x xA. 甲 乙 ;甲比乙成绩稳定x xB. 甲 乙 ;乙比甲成绩稳定x xC. 甲 乙 ;甲比乙成绩稳定x xD. 甲 乙 ;乙比甲成绩稳定x x答案 D解析 由茎叶图可知甲 25,x17 16 28 30 345乙 26,x15 28 26 28 335 甲 乙x x又 s (1725) 2(1625) 2(2825) 2(3025) 2(3425) 252,2甲15
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。