抽样方法 总体分布的估计复习.doc

上传人:创****公 文档编号:1004342 上传时间:2018-11-14 格式:DOC 页数:3 大小:85KB
下载 相关 举报
抽样方法 总体分布的估计复习.doc_第1页
第1页 / 共3页
抽样方法 总体分布的估计复习.doc_第2页
第2页 / 共3页
抽样方法 总体分布的估计复习.doc_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、抽样方法 总体分布的估计复习一、明确复习目标1.会用随机抽样、系统抽样、分层抽样等常用的抽样方法从总体中抽取样本2.会用样本频率分布去估计总体分布 3.了解正态分布的意义及主要性质 4.了解线性回归的方法和简单应用二建构知识网络1.简单随机抽样:设一个总体的个体数为 N如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样. 简单随机抽样的特点:逐个抽取,不放回抽样,各个个体被抽到的概率相等.简单随机抽样方法是其他更复杂抽样方法的基础(2)简单随机抽样的两种方法:抽签法:编号写签,搅拌均匀,逐个抽取.先后抽取概率均等.抽签法简便易行,适用于个

2、体数不太多总体随机数表法:“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样系统抽样的步骤:(总体中的个体的个数为 N,样本容量为 n)采用随机的方式将总体中的个体编号.为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等 确定分段(部分)的间隔 k 奎 屯王 新 敞新 疆 当 是整数时,k= ;当 不是整数时,先从总体中用n简单随机抽样剔除一些个体,使剩下的总体中个体数 能被 n

3、 整除,取 k= .NNn在第一段用简单随机抽样确定起始的个体编号 .l按照事先确定的规则抽取样本(通常是将 加上间隔 k,得到第 2 个编号 +k,第 3l个编号 +2k,)l与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的.可以证明:当 n 不能整除 N 时,先刎除的个体与其它个体一样,被抽的概率也是 1/N.3.分层抽样: 当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.简单随机抽样,系统抽样,分层抽样都是等概率抽样,简单随机抽样是基础,系统抽样的第一部分和分

4、层抽样的每一层都采用简单随机抽样. 随 机 抽 样 、 系 统 抽 样 、 分 层 抽 样 都 是不 放 回 抽 样4.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.5.总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n 的样本,就是进行了 n 次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.总体分布是不易知道的,通常用“样本频率分布估计总体分布

5、” ,这是统计的基本思想方法,样本容量越大,估计越精确.6.总体密度曲线:如果 是连续型随机变量,就把 的取值区间分组,当样本容量无限增大,分组的组距无限缩小,各组的频率就越接近于总体在相应各组取值的概率,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线它反映了总体在各个范围内取值的概率根据这条曲线,可求出总体在区间(a,b)内取值的概率等于该区间上总体密度曲线与 x 轴、直线 x=a、x=b 所围成曲边梯形的面积。总体分布密度密度曲线函数 y=f(x)的两条基本性质:f(x) 0(xR);由曲线 y=f(x)与 x 轴围成面积为 1。7.正态分布:象测量的误差、产品的尺

6、寸等总体分布密度曲线可用, (0,-x)2()1()xfxe近似表示,这样的分布中正态分布, 记为 ,f(x)叫正态分布密度函数.其中 是),(2N圆周率;e 是自然对数的底;x 是随机变量的取值; 为正态分布的均值; 是正态分布的标准差.(1)正态分布由参数 、 唯一确定,如果随机变量 N(, 2),根据定义有:=E ,=D 。(2)正态曲线具有以下性质:在 x 轴的上方,与 x 轴不相交。关于直线 x = 对称。在 x = 时位于最高点。当 x 时,曲线下降。并且当曲线向左、右两边无限延伸时,以 x 轴为渐近线,向它无限靠近。当 一定时,曲线的形状由 确定。 越大,曲线越“矮胖” ,表示总

7、体越分散; 越小,曲线越“瘦高” ,表示总体的分布越集中。8.标准正态曲线:当 =0、=l 时,叫标准正态总体, 分布密度函数: , (-x+),相应的曲线叫标准正态曲线.21)(exf总体密度曲线baxO频 率组 距y标准正态总体 N(0,1)中,总体取值小于 的概率,P(x0 时,0x可由标准正态分布表查得.当 时, ;0x)(1)((0)=0.5. 122()(Pxx任何正态分布的概率问题均可通过 转化成标准正态总体.)()F9.假设检验的思想:小概率事件不能发生假设某种指标服从正态分布N(,2) ;(2)确定一次试验中的取值 a;(2)作出统计推断:若a(3, +3) ,则接受假设,若 a(3,+3) ,则拒绝假设.10线性回归:变量与变量之间的关系大致可分为为两类:确定的函数关系,和不确定的相关关系,不确定的两变量之间也有规律可循,回归分析就是研究这种相关关系的一种数理统计方法.如果 n 组数据(x 1,y1), (x2,y2),(xn,yn)对应的点大致分布在一条直线附近,这条直线就叫回归直线,方程为 ,其中 a、b 是待定系数,bxy, , ,12niixbanix1niy1

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 实用文档资料库 > 规章制度

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。