1、2.1 随机抽样 1简单随机抽样 一般地,设总体中有个个体,从中 逐个不放回地 抽取 n 个个体作为样本 (n N),如果每次抽取时总体中 的各个个体 被抽到的机会都相等 就把这种抽样方 法叫做简单随机抽样 . 特点:每个样本单位被抽中的可能性相同(概率相等)。 练习: 1. 从 60 个产品中抽取 6个进行检查 ,则总体个数为 _, 样本容量为 _. 2对于简单随机抽样 ,个体被抽到的机会 ( ) A.相等 B.不相等 C.不确定 D.与抽样次数有关 3.从某批零件中抽取 50个 ,然后再从 50 个中抽出 40 个 进行合格检查 ,发现合格品有 36 个 ,则该批产品 的合格率为 ( )
2、A.36 B. 72 C.90 D.25 4. 对总数为 N 的一批零件抽取一个容量为 30 的样本, 若每个零件被抽取的可能性为 25%,则 N 为 A. 150 B.200 C.100 D.120 5.已知总容量为 160,若用随机数表法抽取一个 容量为 10 的样本 .下 面对总体的编号正确的是 ( ) A. 1,2, ,106 B. 0,1, ,105 C.00,01, ,105 D. 000,001, ,105 2 系统抽样 当总体中的个体数较多时 ,将总体分成均衡 的几个部分,然后按照预先定出的规则, 从每一部分抽取一个个体,得到所需要的 样本,这样的抽样叫做系统抽样 . 步骤:
3、( 1)先将总体中的 N 个体编号 .有时可直接利用个体自身所带的号码 . ( 2)确定分段间隔 K。对编号均衡地分段, Nn 是整数时, NnK ; Nn 不是整数时,从 N 中剔除一些个体,使得其为整数为止。 ( 3)第一段用简单随机抽样确定起始号码 l。 ( 4)按照规则抽取样本: l; l k; l 2k; ; l nk 例 1 下列抽样中不是系统抽样的是( ) A. 从号码为 115 的 15 个球中任选 3 个作为样本, 现在 15 号球中用抽签法抽出 0i 号,再将号码为 50i , 100i 的球也抽出 B. 工厂生产的产品,用传送带将产品送入包装车 间的过程中,检查人员从传送
4、带上每 5min 抽取 意见产品进行检验 C. 搞某项市场调查,规定在商场门口随机地抽取 一个人进行询问,知道调查到事先规定的调查人数为止 D. 某电影院调查观众的某一指标,通知每排(每 排人数相等)座位号为 14 的观众留下来座谈 2. 为了解 1200名学生对学校教改试验的意见 。 打算从中抽取一个容量为 30 的样本 ,考虑采用 系统抽样 ,则分段的间隔 k为 ( ) A.40 B.30 C.20 D.12 3.为了调查某产品的销售情况 ,销售部门从下属 的 92 家销售连锁店中抽取 30 家了解情况 ,若用 系统抽样法 ,则抽样间隔和随机剔除的个 体数分别为 ( ) A . 3,2 B
5、. 2,3 C. 2,30 D. 30,2 3 分层抽样 一般地,在抽样时,将总体分成 互不交叉 的层, 然后按照一定的比例,从各层 独立地 抽取一定数量 的个体,将各层取出的个体合在一起作为样本,这 种抽样的方法叫分层抽样。 1. 我校高中生共有 2700人 ,其中高一年级 900 人 , 高二年级 1200人 ,高三年级 600人 ,现采取分层 抽样法抽取容量为 135 的样本 ,那么高一、高二、 高三各年级抽取的人数分别为 ( ) A.45,75,15 B. 45,45,45 C.30,90,15 D. 45,60,30 2.一单位有职工 80 人 ,其中业务人员 56 人 ,管理 人员
6、 8 人 ,服务人员 16人 ,为了解职工的某种情况 , 决定采用分层抽样的方法抽取一 个容量为 10的样 本 ,每个管理人员被抽到的频率为 ( ). A. 1/80 B. 1/24 C. 1/10 D. 1/8 2.2 用样本估计总体 1频率分布直方图 : 反映样本的频率分布。 其一般步骤为: 1)计算一组数据中最大值与最小值的差,即求极差 2)决定组距与组数 3)将数据分组 4)列频率分布表 5)画频率分布直方图 2.各小长方形的面积等于相应各组的频率, 频率之和等于 1。 2、频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长 方形上端的中点,就得到 频率分布折线图
7、。 总体密度曲线:在样本频率分布直方图中,相应的频率 折线图会越来越接近于一条光滑曲线,统计中称这条光 滑曲线为总体密度曲线。 3、茎叶图 练习: 1. 下表给出了某校 500名 12岁男孩中用随机 抽样得 出的 120人的身高 (单位 ) , 频率分布表如下 : (1) 画出频率分布直方图 ; (2)估计身高小于 134的人数占总人数的百分比 . 分组 频数 频率 122 ,12 6) 5 0.04 126 ,13 0) 8 0.07 130 ,13 4) 10 0.08 134 ,13 8) 22 0.18 138 ,14 2) 33 0.28 142 ,14 6) 20 0.17 146
8、 ,15 0) 11 0.09 150 ,15 4) 6 0.05 154 ,15 8) 5 0.04合计 120 1解:()其频率分布直方图如下: ( 2)由样本频率分布表可知身高小于 134cm 的男孩 出现的频率为 0.04+0.07+0.08=0.19,所以我们估计身 高小于 134cm 的人数占总人数的 19%. 例题 1. 在频率分布直方图中 ,小矩形的高表示 ( ) A.频率 /样本容量 B.组距频率 C.频率 D.频率 /组距 2.频率分布直方图中 ,小长方形的面积等于 ( ) A.相应各组的频数 B.相应各组的频率 C.组数 D.组距 3.从一群学生中抽取一个一定容量的样本对
9、他们的 学习成绩进行分析 ,已知不超过 70 分的人数为 8人 , 其累计 频率为 0.4,则这样的样本容量是 ( ) 122 126 130 134 138 142 146 150 158 154 身高( cm) o 0.01 0.02 0.03 0.04 0.05 0.06 0.07 频率 /组距 A. 20 人 B. 40 人 C. 70 人 D. 80 人 4.研究统计问题的基本思想方法是 ( ) A.随机抽样 B.使用先进的科学计算器计算样本的频率等 C.用小概率事件理论控制生产工业过程 D.用样本估计总体 5.一个容量为 20的样本数据 ,分组后组距为 10, 区间与频数分布如下
10、: 10,20 ,2; 20,30 ,3; 30,40 ,4; 40,50 ,5; 50,60 ,4; 60,70 ,2. 则样本在 ,50 上的频率为 ( ) A. 120 B. 14 C.12 D.710 13.某中学高二 (2)班甲、乙两名同学自高中以来 每场数学考试成绩如下: 甲的得分: 95,81,75,91,86,89,71,65,76,88,94,110,107; 乙的得分: 83,86,93,99,88,130,98,114,98,79,101. 画出两人数学成绩茎叶图 ,请根据茎叶图对两人的成绩进行比较 . 2.2.2 用样本的数字特征估计总体的数字特征 1、众数、中位数、平
11、均数 众数: 最高的矩形的中点的横坐标 ; 平均数 : 每个小矩形的面积乘以 小矩形底边中点的横坐标之和; 中位数: 中 位数左边和右边的直方图的面积应该相等。 2、标准差、方差 1)标准差 标准差较大,数据的离散程度较大; 标准差较小,数据的离散程度较小。 )方差 练习: 1. 如果 5 个数 1x ,2x ,3x ,4x ,5x 的平 均数是 7 , 那么 1x +1, 2x +1,3x +1,4x +1,5x +1这 5个 数的平均数是 ( ) A.5 B.6 C.7 D.8 2.已知样本数据 1x ,2x , nx 的方差为 4, 则数据 21x +3,22x +3, 2nx +3的标
12、准差是 _. 2 2 2121 ( ) ( ) ( ) ns x x x x x xn 3.在统计中 ,样本的标准差可以近似 地反映总体的 ( ) A.平均状态 B.分布规律 C.波动大小 D.最大值和最小值 4.两个样本甲和乙 ,其中 x甲 =10,x乙 =10, 2s甲 =0.055, 2s乙 =0.015,那么样本甲比样本乙波动 ( ) A. 大 B. 相等 C. 小 D.无法确定 2.3 变量间的相关关系 1. 相关关系 两个变量之间的关系可能是确定的关系, 或非确定性关系。当自变量取值一定时,因变 量也确定,则为确定关系;当自变量取值一定 时,因变量带有随机性,这种变量之间的关系 称
13、为相关关系。相关关系是一种 非确定性 关系。 2. 正相关与负相关概念: 3. 回归直线 如果散点图中点的分布从整体上看大致在一条 直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线 公式 : axby .,)()(2121121xbyaxnxyxnyxxxyyxxb niiniiiniiniii1.回归方程为 1.5 15yx,则 ( ) A. 1.5 15yx B.15 是回归系数 a C. 1.5 是回归系数 a D. 10x 时 0y 2.设有一个回归方程为 2 1.5yx ,则变量 x 增加一个单位时 ( ) A. y 平均增加 1.5 单位 B. y 平均增加 2 单位 C. y 平均减少 1.5 单位 D. y 平均减少 2 单位 3.回归直线方 程必定过 ( ) A. 0,0 B. ,0x C. 0,y D. ,xy