1、【知识点:统计】一简单随机抽样1 总体和样本 总体:在统计学中 , 把研究对象的全体叫做总体个体:把每个研究对象叫做个体总体容量:把总体中个体的总数叫做总体容量为了研究总体 的有关性质,一般从总体中随机抽取一部分: , , , 研究,我们称它为样本其中个体的个数称为样本容量。2简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。特点是:每个样本单位被抽中的可能性相同(概率相等) ,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。3简单随机抽样常用
2、的方法:(1)抽签法;随机数表法; 计算机模拟法;使用统计软件直接抽取。在简单随机抽样的样本容量设计中,主要考虑:总体变异情况;允许误差范围;概率保证程度。4抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。5随机数表法:例:利用随机数表在所在的班级中抽取 10 位同学参加某项活动。二系统抽样1系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。d(抽样距离)=N(总体规模)/n (样
3、本规模)三.分层抽样1分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。2分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。3分层的比例问题:(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。 4样本频率分布图1.作图步骤:(1)求极差(一组数据中最大值和最小值得差) (2)决定组距和组数;(3)将数据分组;(4)计算各
4、小组的频率,列频率分布表;(5)画频率分布直方图2.特点:(1)以面积的形式反映数据落在各小组的频率大小;.13)2(于于 于5茎叶图适用范围:在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录。当样本数据较多时,茎叶图就不太方便了。六用样本的数字特征估计总体的数字特征1、本均值: nxx212、 样本标准差: nxxs n22212 )()()( 3用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准
5、差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。4 ( 1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变(2 )如果把一组数据中的每一个数据乘以一个共同的常数 k,标准差变为原来的 k 倍五两个变量的线性相关1、概念: (1)回归直线方程 axby(2)回归系数 niiiniiiii xyxy1212)( xbya2最小二乘法3 直线回归方程的应用(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系(2)利用回归方程进行预测;把预报因子(即自变量 x)代入回归方程对预报量(即因变量 Y)进行估计,即
6、可得到个体 Y 值的容许区间。(3)利用回归方程进行统计控制规定 Y 值的变化,通过控制 x 的范围来实现统计控制的目标。(4)回归直线一定经过样本的中心点( , ),据此性质可以解决有关的计算问题x y【例题讲解】1. 某同学使用计算器求 个数据的平均数时,错将其中一个数据 输入为 ,30105那么由此求出的平均数与实际平均数的差是( )A 头htp:/w.xjkygcom126t:/.j B 头htp:/w.xjkygcom126t:/.j 35C 头htp:/w.xjkygcom126t:/.j D 头htp:/w.xjkygcom126t:/.j 52. 设有一个直线回归方程为 ,则变
7、量 增加一个单位时( ).xA 头htp:/w.xjkygcom126t:/.j 平均增加 个单位 B 头htp:/w.xjkygcom126t:/.j 平均增加 个单位. 2C 头htp:/w.xjkygcom126t:/.j 平均减少 个单位 D 头htp:/w.xjkygcom126t:/.j 平均减少 个单位153. 从 个编号中抽取 个号码入样,若采用系统抽样方法进行抽取,Nn则分段间隔应为( )A 头htp:/w.xjkygcom126t:/.j B 头htp:/w.xjkygcom126t:/.j C 头htp:/w.xjkygcom126t:/.j D 头htp:/w.xjky
8、gcom126t:/.j nnNn4.从某厂生产的 802 辆轿车中抽取 80 辆测试某项性能请合理选择抽样方法进行抽样,并写出抽样过程5. 为了了解参加运动会的 名运动员的年龄情况,从中抽取 名运动员;就这个问2010题,下列说法中正确的有 ; 名运动员是总体;每个运动员是个体;所抽取的 名运动员是一个样本;20样本容量为 ;这个抽样方法可采用按年龄进行分层抽样;每个运动员被抽到的1概率相等 头htp:/w.xjkygcom126t:/.j 6. 数据 的标准差是_ 头htp:/w.xjkygcom126t:/.j 7,37. 数据 的方差为 ,平均数为 ,则12.,na2(1)数据 的标准
9、差为 ,23,.,(0)nkbakbakb平均数为 头htp:/w.xjkygcom126t:/.j (2 ) 数据 的标准差为 ,13(),(),(),.(),n平均数为 头htp:/w.xjkygcom126t:/.j 8. 用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )A 头htp:/w.xjkygcom126t:/.j 总体容量越大,估计越精确 B 头htp:/w.xjkygcom126t:/.j 总体容量越小,估计越精确C 头htp:/w.xjkygcom126t:/.j 样本容量越大,估计越精确 D 头htp:/w.xjkygcom126t:/.j 样本容量越小,估
10、计越精确9 头htp:/w.xjkygcom126t:/.j 从两个班中各随机的抽取 名学生,他们的数学成绩如下: 0甲班 76 74 82 96 66 76 78 72 52 68乙班 86 84 62 76 78 92 82 74 88 85画出茎叶图并分析两个班学生的数学学习情况 头htp:/w.xjkygcom126t:/.j 【课堂练习】1. 相关关系与函数关系的区别是 头htp:/w.xjkygcom126t:/.j 2. 从 个篮球中任取一个,检验其质量,则应采用的抽样方法为_ 头htp:/w.xjkygcom126t:/.j 103. 下列说法错误的是 ( )A 头htp:/w
11、.xjkygcom126t:/.j 在统计里,把所需考察对象的全体叫作总体 B 头htp:/w.xjkygcom126t:/.j 一组数据的平均数一定大于这组数据中的每个数据 C 头htp:/w.xjkygcom126t:/.j 平均数、众数与中位数从不同的角度描述了一组数据的集中趋势 D 头htp:/w.xjkygcom126t:/.j 一组数据的方差越大,说明这组数据的波动越大4. 要了解全市高一学生身高在某一范围的学生所占比例的大小,需知道相应样本的( )A 头htp:/w.xjkygcom126t:/.j 平均数 B 头htp:/w.xjkygcom126t:/.j 方差 C 头htp
12、:/w.xjkygcom126t:/.j 众数 D 头htp:/w.xjkygcom126t:/.j 频率分布 5. 要从已编号( )的 枚最新研制的某型导弹中随机抽取 枚来进行发射试验,0 6用每部分选取的号码间隔一样的系统抽样方法确定所选取的 枚导弹的编号可能是( )A 头htp:/w.xjkygcom126t:/.j B 头htp:/w.xjkygcom126t:/.j 5,233,453C 头htp:/w.xjkygcom126t:/.j D 头htp:/w.xjkygcom126t:/.j 486. 数据 的方差为 ,则数据 的方差为( )3,.,na123,.naaA 头htp:/
13、w.xjkygcom126t:/.j B 头htp:/w.xjkygcom126t:/.j C 头htp:/w.xjkygcom126t:/.j D 头htp:/w.xjkygcom126t:/.j 47. 已知样本 的平均数是 ,标准差是 ,则 头htp:/w.xjkygcom126t:/.j 9,0,08. 有 件产品编号从 到 ,现在从中抽取 件检验,用系统抽样5155确定所抽取的编号为( )A 头htp:/w.xjkygcom126t:/.j B 头htp:/w.xjkygcom126t:/.j 5,0,25,03,4C 头htp:/w.xjkygcom126t:/.j D 头htp:
14、/w.xjkygcom126t:/.j 7399(2013武夷模拟)用系统抽样法要从 160 名学生中抽取容量为 20 的样本,将 160 名学生随机地从 1160 编号,按编号顺序平均分成 20 组(18 号,916 号,153160号),若第 16 组抽出的号码为 126,则第 1 组中用抽签的方法确定的号码是 _10(2012江西)样本(x 1,x 2,x n)的平均数为 ,样本(y 1,y 2,y m)的平均数为x( )若样本 (x1,x 2, ,x n,y 1,y 2,y m)的平均数 (1) ,其中yx y z x y0 m Cnm D不能确定11已知施化肥量 x 与水稻产量 y
15、的试验数据如下表,则变量 x 与变量 y 是_相关(填“正”或“负”).施化肥量 x 15 20 25 30 35 40 45水稻产量 y 330 345 365 405 445 450 45512(2013长春调研)已知 x,y 取值如下表:x 0 1 4 5 6 8y 1.3 1.8 5.6 6.1 7.4 9.3从所得的散点图分析可知:y 与 x 线性相关,且 0.95x a,则 a( )y A1.30 B1.45 C1.65 D1.8013.某班同学利用国庆节进行社会实践,对25,55岁的人群随机抽取 n 人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念,称为“低碳族
16、” ,否则称为“非低碳族” ,得到如下统计表和各年龄段人数频率分布直方图:(1)补全频率分布直方图; (2)求 n,a,p 的值14 头htp:/w.xjkygcom126t:/.j 以下是某地搜集到的新房屋的销售价格 和房屋的面积 的数据: yx(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为 时的销售价格 头htp:/w.xjkygcom126t:/.j 215015(2012揭阳调研)某校高一某班的某次数学测试成绩 (满分为 100 分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:组数 分
17、组 低碳族的人数 占本组的频率第一组 25,30) 120 0.6第二组 30,35) 195 p第三组 35,40) 100 0.5第四组 40,45) a 0.4第五组 45,50) 30 0.3第六组 50,55 15 0.3(1)求分数在50,60的频率及全班人数;(2)求分数在80,90之间的频数,并计算频率分布直方图中80,90间的矩形的高16已知某单位有 50 名职工,现要从中抽取 10 名 职工,将全体职工随机按 150 编号,并按编号顺序 平均分成 10 组,按各组内抽取的编号依次增加 5 进行系统抽样(1) 若第 5 组抽出的号码为 22,写出所有被抽出职工 的号码;(2)
18、分别统计这 10 名职工的体重( 单位:公斤),获得体重数据的茎叶图如图所示,求该样本的方差;(3)在(2)的条件下,从这 10 名职工中随机抽取两名体重不轻于 73 公斤(73 公斤)的职工,求体重为 76 公斤的职工被抽取到的概率【课后作业】1. 头htp:/w.xjkygcom126t:/.j 一个容量为 的样本,已知某组的频率为 ,则该组的频数为_ 头htp:/w.xjkygcom126t:/.j 200.252. 头htp:/w.xjkygcom126t:/.j 用随机数表法从 名学生(男生 人)中抽取 人进行评教,某男生1被抽取的机率是_ 头htp:/w.xjkygcom126t:
19、/.j 3(2013沈阳质检)沈阳市某高中有高一学生 600 人,高二学生 500 人,高三学生 550 人,现对学生关于消防安全知识了解情况进行分层抽样调查,若抽取了一个容量为 n 的样本,其中高三学生有 11 人,则 n 的值等于_4. 一个容量为 的样本数据,分组后组距与频数如下表:20组距 ,13,40,5,60,7,频数2 3 4 5 4 2则样本在区间 上的频率为_ 头htp:/w.xjkygcom126t:/.j ,505. 某单位有老年人 人,中年人 人,青年人 人,为调查身体健康状况,需要从中2848抽取一个容量为 的样本,用分层抽样方法应分别从老年人、中年人、青年人中各抽取
20、 36_人、 人、 人 头htp:/w.xjkygcom126t:/.j 6. 某学校共有教师 人,其中不到 岁的有 人, 岁及以上的有 人 头htp:/w.xjkygcom126t:/.j 为了4900354040了解普通话在该校中的推广普及情况,用分层抽样的方法,从全体教师中抽取一个容量为人的样本进行普通话水平测试,其中在不到 岁的教师中应抽取的人数为多少人?707. 如图,从参加环保知识竞赛的学生中抽出 名,将其成绩(均为整数)整理后画出的60频率分布直方图如下:观察图形,回答下列问题:(1) 这一组的频数、频率分别是多少?79.58.:(2)估计这次环保知识竞赛的及格率( 分及以上为及
21、格)60统计答案【例题答案】例 1. B 少输入 平均数少 ,求出的平均数减去实际的平均数等于90,3, 3例 2. 例 3. C 剔除零头0.714.24.审题视点 因为 802 不能整除 80,为了保证“等距”分段,应先剔除 2 个个体解 由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:第一步:先从 802 辆轿车中剔除 2 辆轿车(剔除方法可用随机数法) ;第二步:将余下的 800 辆轿车编号为 1,2,800,并均匀分成 80 段,每段含k 10 个个体;80080第三步:从第 1 段即 1,2,10 这 10 个编号中,用简单随机抽样的方法抽取一个编号(
22、如 5)作为起始编号;第四步:从 5 开始,再将编号为 15,25,795 的个体抽出,得到一个容量为 80 的样本解决系统抽样问题的两个关键步骤为:(1)分段的方法应依据抽取的样本容量而定,即根据定义每段抽取一个样本(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定5., 名运动员的年龄情况是总体;每个运动员的年龄是个体;206. 571731.5,4X22225(0.)(.)(71.5)(731.)s7 头htp:/w.xjkygcom126t:/.j (1) , (2 ) ,kbkkb(1) 1 12. .n naaaX bk2 212 2()().().n
23、nskbkbnaak (2 ) 1 12()()().nkkaX bkn 22 212()().()(.nnskabkakbkabkn8. C 9. 解:甲班 乙班 2 5 6 6 28 6 6 4 2 7 4 6 82 8 2 4 5 6 86 9 2乙班级总体成绩优于甲班 头htp:/w.xjkygcom126t:/.j 【课堂练习】1.函数关系是两个变量之间有完全确定的关系,而相关关系是两个变量之间并没有严格的确定关系,当一个变量变化时,另一变量的取值有一定的随机性 头htp:/w.xjkygcom126t:/.j 2. 简单随机抽样 3. B 平均数不大于最大值,不小于最小值4 头ht
24、p:/w.xjkygcom126t:/.j D 5 头htp:/w.xjkygcom126t:/.j B ,间隔应为0106. D 222111(),()4()4,nnni i ii i iXXX 7. , ,96050,xy22010xy2 2()9()()9,6xyxy8.D 间隔为 109. 6 解析 设第 1 组抽取的号码为 b,则第 n 组抽取的号码为 8(n1)b, 8(161)b126,b 6,故第 1 组抽取的号码为 6.10.解析 依题意得 x1x 2x nn ,y1y 2y mm ,x yx1x 2x ny 1y 2y m(mn) ( mn) ( mn)(1 ) ,z x yn m ( mn) (mn)(1) ,x y x yError!于是有 nm(mn) (1)(m n)(21),0n. 答案 A1211 .正12.解析 依题意得, (014568)4, (1.31.85.66.17.49.3)x16 y 16
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。