1、专题十 概率与统计第二十九讲 回归分析与独立性检验一、选择题1 (2015 湖北)已知变量 和 满足关系 ,变量 与 正相关,下列结论中xy0.1xyz正确的是A 与 正相关, 与 负相关 B 与 正相关, 与 正相关xyz zC 与 负相关, 与 负相关 D 与 负相关, 与 正相关xxyx2 (2014 湖北)根据如下样本数据x 3 4 5 6 7 8y 4.0 2.5 0.0.5 2.03.得到的回归方程为 ,则bxaA , B , C , D , 0aaba0b3 (2014 江西)某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量之间的关系,随机抽查 52 名中学生,得到统
2、计数据如表 1 至表 4,则与性别有关联的可能性最大的变量是4 (2012 新课标)在一组样本数据(x 1,y 1) , (x 2,y 2) , (x n,y n) (n2,x 1,x2,xn不全相等)的散点图中,若所有样本点(x i,y i)( i=1,2,n)都在直线 上,则这组样本数据的样本相关系数为 A1 B0 C D1125 (2012 湖南)设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相关关系,根据一组样本数据( , ) (i =1,2,n) ,用最小二乘法建立的回归方ix程为 y=0.85x 85.71,则下列结论中不正确的是Ay 与 x 具有正的线性相关
3、关系B回归直线过样本点的中心( x, y)C若该大学某女生身高增加 1cm,则其体重约增加 0.85kgD若该大学某女生身高为 170cm,则可断定其体重必为 58.79kg6 (2011 山东)某产品的广告费用 x 与销售额 y 的统计数据如下表广告费用 x(万元) 4 2 3 5销售额 y(万元) 49 26 39 54根据上表可得回归方程 ba中的 为 9.4,据此模型预报广告费用为 6 万元时销售额为A63.6 万元 B 65.5 万元 C67.7 万元 D72.0 万元二、填空题7 (2015 北京)高三年级 267 位学生参加期末考试,某班 37 位学生的语文成绩,数学成绩与总成绩
4、在全年级中的排名情况如下,甲、乙、丙为该班三位学生从这次考试成绩看,在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ;在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 三、解答题8(2018 全国卷)下图是某地区 2000 年至 2016 年环境基础设施投资额 (单位:亿y元)的折线图为了预测该地区 2018 年的环境基础设施投资额,建立了 与时间变量 的两个线性回yt归模型根据 2000 年至 2016 年的数据(时间变量 的值依次为 )建立模t127, , ,型: ;根据 2010 年至 2016 年的数据(时间变量 的值依次为30.415yt t)建立模型: 127, ,
5、 , 917.5yt(1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由9 (2017 新课标)为了监控某种零件的一条生产线的生产过程,检验员每隔 30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)下面是检验员在一天内依次抽取的 16 个零件的尺寸:抽取次序 1 2 3 4 5 6 7 8零件尺寸 995 1012 996 996 1001 992 998 1004抽取次序 9 10 11 12 13 14 15 16零件尺寸 1026 991 1013 1002 922 1004 1005 99
6、5经计算得 ,16.7ix161622()()i iisxx, , ,其中 为抽取0.2162(8.5).439i16()8.5.7ii i的第 个零件的尺寸, =1, 2,16ii(1)求 的相关系数 ,并回答是否可以认为这一天生产的零件(,)ix1,6)r尺寸不随生产过程的进行而系统地变大或变小(若 ,则可以认为零件的尺寸|0.25不随生产过程的进行而系统地变大或变小)(2)一天内抽检零件中,如果出现了尺寸在 之外的零件,就认为这(3,)xs条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查()从这一天抽检的结果看,是否需对当天的生产过程进行检查?()在 之外的数据称
7、为离群值,试剔除离群值,估计这条生产线当天3,)xs生产的零件尺寸的均值与标准差(精确到 001)附:样本 的相关系数 ,(,)ixy1,2)n 1221()()niiini ii ixyr0.8.910 (2016 年全国 III 卷)如图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图注:年份代码 17 分别对应年份 20082014.()由折线图看出,可用线性回归模型拟合 y 与 的关系,请用相关系数加以说明;t()建立 y 关于 的回归方程(系数精确到 0.01) ,预测 2016 年我国生活垃圾无害t化处理量.附注:参考数据:, , , 2.646.71
8、9.32iy7140.ity721()0.5iiy7R(7)参考公式:相关系数 1221()(y)niiniiitr,回归方程 中斜率和截距的最小二乘估计公式分别为:yabt12()niiity, =.abt11(2015 新课标 1)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:千元)对年销售量 (单位: )和年利润 (单位:千元)的影响,对xytz近 8 年的年宣传费 和年销售量 ( =1,2, 8)数据作了初步处理,得到ixi下面的散点图及一些统计量的值xyw821()iix821()iiw81()iiixy81()iiiwy46.6 563 6.8 289.8 1.6
9、 1469 108.8表中 , = iix81i()根据散点图判断, 与 哪一个适宜作为年销售量 关于yabxycdxy年宣传费 的回归方程类型?(给出判断即可,不必说明理由)x()根据()的判断结果及表中数据,建立 关于 的回归方程;()已知这种产品的年利率 与 、 的关系为 根据()的结果zxy0.2zyx回答下列问题:()年宣传费 时,年销售量及年利润的预报值是多少?49x()年宣传费 为何值时,年利率的预报值最大?附:对于一组数据 , , , ,其回归线 的斜率和1(,)uv2(,)(,)nuvvu截距的最小二乘估计分别为 , 12()niiiiiuvvu12 (2014 新课标 2)
10、某地区 2007 年至 2013 年农村居民家庭纯收入 y(单位:千元)的数据如下表:年份 2007 2008 2009 2010 2011 2012 2013年份代号 t 1 2 3 4 5 6 7人均纯收入 y 2.9 3.3 3.6 4.4 4.8 5.2 5.9()求 y 关于 t 的线性回归方程;()利用()中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均纯收入的变化情况,并预测该地区 2015 年农村居民家庭人均纯收入附:回归直线的斜率和截距的最小二乘估计公式分别为:,12niiitybaybt13 (2012 辽宁)电视传媒公司为了解某地区电视观众对某体育节
11、目的收视情况,随机抽取了 100 名观众进行调查,其中女性有 55 名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于 40 分钟的观众称为“体育迷”,已知“体育迷”中有 10名女性.(I)根据已知条件完成下面 2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷 体育迷 合计男女合计(II)将日均收看该体育节目不低于 50 分钟的观众称为“ 超级体育迷” ,已知“超级体育迷”中有 2 名女性.若从“超级体育迷” 中任意选取 2 人,求至少有 1 名女性观众的概率.附: 212)(n,)(2kP0.05 0.013.841 6.635