1、2019 年艺体生文化课-百日突围讲练通专题二 概率统计(理科)统计【背一背基础知识】一、用样本估计总体1.频率分布直方图:画一个只有横、纵轴正方向的直角坐标系,把横轴分成若干段,每一段对应一个组的组距,然后以此段为底作一矩形,它的高等于该组的 ,这样得出一系列的矩形,每个矩形的面积恰频 率组 距好是该组上的频 率,这些矩形就构成了频率分布直方图.在频率分布直方图中,每个小矩形的面积等于相应数据的频率,各小矩形的面积之和等于 ;12.茎叶图:茎叶图是一种将样本数据有条理地列出来,从中观察样本分布情况的图.在茎叶图中, “茎”表示数的高位部分, “叶”表示数的低位部分.3.样本的数字特征:(1)
2、众数:一组数据中,出现次数最多的数据就是这组数据的众数(一组数据中的众数可能只有一个,也可能有多个).在频率分布直方图中,最高的矩形的中点的横坐标即为该组数据的众数;(2)中位数:将一组数据由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.在频率分布直方图中,中位数 对应的直线 的左右两边的矩形面积之和均为 ,可以根据这个特点axa0.5求频率分布直方图中的中位数;(3)平均数:设 个数分别为 、 、 、 ,则 叫做这 个数的算数平均数.n1x2 n12nxx在频率分布直方图中,它等
3、于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;(4)方差:设 个数分别为 、 、 、 ,则 叫做这12 nx 22221 ns x 个数的方差,方差衡量样本的稳定性的强弱.一般来讲,方差越大,样本的稳定性越差;方差越小越接近n于零,样本的稳定性越强;学-科网(5)标准差:设 个数分别为 、 、 、 ,则 叫做n1x2 nx2221 nsxxx 这 个数的标准差,标准差也可以衡量样本稳定性的强 弱.n4.独立性检验(1)分类变量:对于变量的“值”表示个体所属的不同类别,像这样的变量称为分类变量;(2)列联表:列出的两个分类变量的频数表,称为列联表.学-科网(3)与表格相比,三
4、维柱形图与二维条形图更能直观地反映出相关数据的总体状况.(4)利用随机变量 来确定是否能以给定把握认为“两个分类变量有关系”的方法,称为两个分类变量的2K独立性检验(5)两个分类变量的独立性检验的一般步骤:列出两个分类变量的列联表:假设两个分类变量 、 无关系;xy计算 (其中 nabcd 为样本容量);22nadbcKd把 的值与临界值比较,确定 、 有关的程度或无关系.2 xy临界值附表: 2pKk来源:0.5Zxxk.Com.40.25.10.50.2.10.5.1.78.3.72.63.841.6.37.89.25. 两个变量的相关关系(1)作出两个变量的散点图,如果这些点从整体上看大
5、致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线(2)回归方程为 ,其中 = , .ybxa12niixy12)(niiiiixy(aybx【讲一讲释疑解惑】来源:学科网 ZXXK1.必备技能:在求解样本的众数、中位数、平均数以及方差时,首先一般要将样本的数据按照一定的顺序进行列举,并根据这些数的定义进行计算;在综合题中求解相应事件的概率时,可以利用树状图作为巩固辅助基本事件的列举,最后在作答时一般利用点列法进行列举.2.典型例题例 1. 【2018 年全国卷理】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生
6、产方式的效率,选取 40 名工人,将他们随机分成两组,每组 20 人,第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求 40 名工人完成生产任务所需时间的中位数 ,并将完成生产任务所需时间超过 和不超过 的工人数填入下面的列联表:超过 不超过第一种生产方式第二种生产方式(3)根据(2)中的列 联表,能否有 99%的把握认为两种生产方式的效率有差异?附: , 例 2 .【2018 年理数全国卷 II】下图是某地区 2000 年至 2016 年环境基础设施投资额 (
7、单位:亿元)的折线图为了预测该地区 2018 年的环境基础设施投资额,建立了 与时间变量 的两个线性回归模型根据2000 年至 2016 年的数据(时间变量 的值依次为 )建立模型: ;根据 2010 年至 2016 年的数据(时间变量 的值依次为 )建立模型 : (1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由学科+网例 3.【2017 课标 II,理 18】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收 获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg)某频率分布直方图如下:(1)
8、 设两种养殖方法的箱产量相互独立,记 A 表示事件:“旧养殖法的箱产量低于 50kg, 新养殖法的箱产量不低于 50kg”,估计 A 的概率;(2) 填写下面列联表,并根据列联表判断是否有 99%的把握认为箱产量与养殖方法有关:箱产量50kg 箱产量50kg旧养殖法新养殖法(3) 根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到 0.01)附:22()(nadbcK概率、随机变量分布列及其期望与方差【背一背基础知识】1.互斥事件有一个发生的概率:计算公式 P(AB)P(A)P(B)(A、B 互斥);对于较复杂的互斥事件的概率求法可考虑利用对立事件去求2相互独立事件与 n 次
9、独立重复试验(1)若 A1,A 2,A n是相互独立事件,则 P(A1A2An)P(A 1)P(A2)P(An)(2)如果在一次试验中事件 A 发生的概率为 p,事件 A 不发生的概率为 1p,那么在 n 次独立重复试验中事件 A 发生 k 次的概率为:P n(k) C pk(1p) nk .kn3离散型随机变量的分布列、期望与方差(1)离散型随机变量 的分布列若离散型随机变量 X 可能取的不同值为 x1,x 2,x i,x n,X 取每一个值 xi(i1,2,n) 的概率P(Xx i)p i,则表X x1 x2 xi xnP p1 p2 pi pn离散型随机变量 X 的分布列,注意: , =
10、1.0iP1ni(2)二项分布:在 次独立重复试验中,用 表示事件 A 发生的次数,设每次试验中事件 A 发生的概率为n,则 = ( =0,1,2,n) ,称随机变量 服从二项分布,记p()k(1)knknCp 作 ,并称 为成功的概率.,B(3)超几何分布:一般地,在含有 M 件次品的 N 件产品中,任取 n 件,其中恰有 件次品,则 = ( =0,1,2,m)()pknkNC其中 = ,且 N,MN,M,N ,则称随机变量 服从超几何分布.mi,*(4)离散随机变量的数学期望、方差、标准差期望: ,12nExPxP方差: = ,D221-()()nnExEP( )标准差: = . ,()(
11、Eab2abD若 ,则 ,BnpEn(1)p4.正态分布特征:(1)曲线在 轴上方,与 轴不相交.学-科网xx(2)曲线是单峰的,它关于直线 = 对称.(3)曲线在 = 处达 到峰值.(4)曲线与 轴之间的面积为 1.x(5) 一定时,曲线的形状由 确定. 越大,曲线越“矮胖” ,总体分布越分散; 越小,曲线越“瘦 高” ,总体分布越集中.【讲一讲释疑解惑】1.必备技能:求解独立性检验的基本问题时,一般只需按照独立性检验的基本步骤进行即可,即第一步提出假设,第二步计算 的值,第三步计算犯错误的概率,第四步下结论.2K2.典型例题例 1. 【2018 年浙江卷】设 0p1,随机变量 的分布列是
12、0 1 2P则当 p 在(0,1)内增大时,A. D()减小 B. D()增大 C. D()先减小后增大 D. D()先增大后减小例 2 .【2018 年理新课标 I 卷】某工厂的某种产品成箱包装,每箱 200 件,每一箱产品在交付用户之前要对产品作检 验,如检验出不合 格品,则更换为合格品 检验时,先从这箱产品中任取 20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为 ,且各件产品是否为不合格品相互独立 (1)记 20 件产品中恰有 2 件不合格品的概率为 ,求 的最大值点 (2)现对一箱产品检验了 20 件,结果恰有 2 件不合格品,以(1)中确定的
13、 作为 的值已知每件产品的检验费用为 2 元,若有不合格品进入用户手中,则工厂要对每件不合格品支付 25 元的赔偿费用 (i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 ,求 ;(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?例 3 【2018 届江西上饶市高三上学期第一次模拟】2013 年秋天中国国家主席习近平提出“一带一路”战略构想的重大倡议,时隔四年,2017 年秋天中国共产党第十九次全国代表大会通过了中国共产党章程(修正案)的决议,将推进“一带一路”建设写入党章,这充分体现了在中国共产党领导下,中国高度重视“一带一路”建设、坚
14、定推进“一带一路”国际合作的决心和信心.某市为了了解人们对这一复兴中国梦的伟大战略举措的认识程度,对不同年龄的人举办了一次“一带一路”知识竞赛,满分 100 分,现将所有参赛者按分数分成 5 组(第一组: ,第二组: ,第三组: ,第四组: ,第五组: ),得到如图所示的频率分布直方图.(1)求实数 的值,并求所有参赛者分数的中位数;(2)若从分数在 , 的参赛者中按分层抽样选取 6 人.求选取的 6 人中,分数分别在 , 上的人数;再从选取的 6 人中随机挑选 2 人到省里培训,记选中的 2 人中得分在 的人数为 ,求随机变量的分布列及数学期望.【练一练能力提升】解答题(12*10=120
15、分)1.【2018 届吉林省长春市高三质量监测(二) 】某种植园在芒果临近成熟时,随机从一些芒果树上摘下100 个芒果,其质量分别在 , , , , , (单位:克)中,经统计得频率分布直方图如图所示.(1)现按分层抽样从质量为 , 的芒果中随机抽取 个,再从这 个中随机抽取 个,记随机变量 表示质量在 内的芒果个数,求 的分布列及数学期望.(2)以各组数据的中间数代表这组数据的平均值,将频率视为概率,某经销商来收购芒果,该种植园中还未摘下的芒果大约还有 个,经销商提出如下两种收购方案:A:所以芒果以 元/千克收购;B:对质量低于 克的芒果以 元/个收购,高于或等于 克的以 元/个收购.通过
16、计算确定种植园选择哪种方案获利更多?2. 为了增强环保意识,我校从男生中随机抽取了 60 人,从女生中随机抽取了 50 人参加环保知识测试,统计数据如下表所示:优秀 非优秀 总计男生 40 20 60女生 20 30 50总计 60 50 110()试判断是否有 99%的把握认为环保知识是否优秀与性别有关;()为参加市里举办的环保知识竞赛,学校举办预选赛,已知在环保测试中优秀的同学通过预选赛的概率为 ,现在环保测试中优秀的同学中选 3 人参加预选赛,若随机变量 表示这 3 人中通过预选赛的人32 X数,求 的分布列与数学期望X2()PKk0500来源:学_科_网0400 0100 0010 0
17、0010455 0708 2706 6635 10828附: 2K2()(nadbc3. 【2018 届江西省南昌市高三第一次模拟】某校为了推 动数学教学方法的改革,学校将高一年级部分生源情况基本相同的学生分成甲、乙两个班,每班各 40 人,甲班按原有模式教学,乙班实施教学方法改革.经过一年的教学实验,将甲、乙两个班学生一年来的数学成绩取平均数,两个班学生的平均成绩均在,按照区间 , , , , 进行分组,绘制成如下频率分布直方图,规定不低于 80 分(百分制)为优秀.完成表格,并判断是否有 以上的把握认为“数学成绩优秀与教学改革有关” ;(2)从乙班 , , 分数段中,按分层抽样随机抽取 7
18、 名学生座谈,从中选三位同学发言,记来自 发言的人数为随机变量 ,求 的分布列和期望.4.【2018 届河南省南阳市第一中学高三第九次】下表提供了某厂节能降耗技术改造后生产 甲产品过程中记录的产量 (吨)与相应的生产能耗 (吨)标准煤的几组对照数据:(1)请根据上表提供的数据,用最小二乘法求出 关于 的线性回归方程 ;(2)已知该厂技改前,100 吨甲产品的生产能耗为 90 吨标准煤.试根据(1)求出的线性回归方程,预测生产100 吨甲产品的生产能耗比技改前降低多少吨标准煤?,参考数值: .5 【2018 届河北省唐山市高三第一次模拟】某水产品经销商销售某种鲜鱼,售价为每公斤 元,成本为每公斤
19、 元.销售宗旨是当天进货当天销售.如果当天卖不出去,未售出的全部降价处理完,平均每公斤损失元.根据以往的销售情况,按 , , , , 进行分组,得到如图所示的频率分布直方图.(1)求未来连续三天内,该经销商有连续两天该种鲜鱼的日销售量不低于 公斤,而另一天日销售量低于 公斤的概率;(2)在频率分布直方图的需求量分组中,以各组区间的中点值代表该组的各个值.(i)求日需求量 的分布列;(ii)该经销商计划每日进货 公斤或 公斤,以每日利润 的数学期望值为决策依据,他应该选择每日进货 公斤还是 公斤?6 【2018 届湖北省武汉市高中毕业生二月调研】从某工厂的一个车间抽取某种产品 50 件,产品尺寸(单位: )落在各个小组的频数分布如下表:数据分组频数 3 8 9 12 10 5 3(1)根据频数分布表,求该产品尺寸落在 的概率;