1、专题十 概率与统计第二十九讲 回归分析与独立性检验答案部分1C 【解析】因为变量 x和 y满足关系 0.1yx,其中 0.1,所以 x与 y成负相关;又因为变量 y与 z正相关,不妨设 zkb(),则将 .y代入即可得到:(0.1)0.1()zkxbkx,所以 0.1,所以 x与 z负相关,综上可知,应选 C2A【解析】画出散点图知 ,a3D【解析】因为 ,22215(6140)583630,2225(40)563,2223(81)9630,22245(06)5483则有 ,所以阅读量与性别关联的可能性最大22414D【解析】因为所有的点都在直线上,这组样本数据完全正相关,故其相关系数为 1,
2、故选 D.5D【解析】由回归方程为 y=0.85 85.71 知 y随 x的增大而增大,所以 y 与 x 具有正的x线性相关关系,由最小二乘法建立的回归方程得过程知 ()ybxaba,所以回归直线过样本点的中心( , ) ,利用回归方程可以预测估计总体,所以 D 不正确6B【解析】样本中心点是( 3.5,42) ,则 ,所以回归方429.35.1ybx程是 ,把 代入得 9.41yx65.7乙 数学 【解析】由图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙由图可知,比丙的数学成绩排名还靠后的人比较多;而总成绩的排名中比丙排名靠后的人数比较少,所以丙的数学成
3、绩的排名更靠前,故填数学8【解析】(1)利用模型,该地区 2018 年的环境基础设施投资额的预测值为(亿元) 30.415926.1y利用模型,该地区 2018 年的环境基础设施投资额的预测值为(亿元)97.(2)利用模型得到的预测值更可靠理由如下:()从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线上下这说明利用 2000 年至 2016 年的数据建立的线性模型不能30.415yt很好地描述环境基础设施投资额的变化趋势2010 年相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2016 年的数据对应的点位于一条直线的附近,这说明从2010 年开
4、始环境基础设施投资额的变化规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模型 可以较好地描述 2010 年以后的环境基础设施投917.5yt资额的变化趋势,因此利用模型得到的预测值更可靠()从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元,由模型得到的预测值 226.1 亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理说明利用模型得到的预测值更可靠以上给出了 2 种理由,考生答出其中任意一种或其他合理理由均可得分9 【解析】 (1)由样本数据得 的相关系数为(,)1,26)ix16162218.5.780.180.1439()(.)iiii
5、irx由于 ,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变|0.5r大或变小(2) (i)由于 ,由样本数据可以看出抽取的第 13 个零件的尺寸9.7,0.21xs在 以外,因此需对当天的生产过程进行检查(3,)xs(ii)剔除离群值,即第 13 个数据,剩下数据的平均数为,1(69.72)10.5这条生产线当天生产的零件尺寸的均值的估计值为 1002,162220.1.59.34ix剔除第 13 个数据,剩下数据的样本方差为,22(59.34.10.).81这条生产线当天生产的零件尺寸的标准差的估计值为 .0.910 【解析】 ()由折线图中数据和附注中参考数据得, , ,4
6、t28)(71it 5.0)(712iiy,89.23.4.)(717171 iiii tyyt. 9064.25.08r因为 与 的相关系数近似为 0.99,说明 与 的线性相关程度相当高,从而可以用yt yt线性回归模型拟合 与 的关系. yt()由 及()得 ,31.72.9 103.289.)(712iiityb.9204.tbya所以, 关于 的回归方程为: . ty将 2016 年对应的 代入回归方程得: .9t 82190所以预测 2016 年我国生活垃圾无害化处理量将约 1.82 亿吨.11 【解析】 ()由散点图可以判断, 适宜作为年销售量 关于年宣传费ycdxy的回归方程类
7、型x()令 ,先建立 关于 的线性回归方程,由于wxyw812()108. 6iiiiid,563.cyw所以 关于 的线性回归方程为 ,因此 关于 的回归方程为1068ywyx10.8yx() ()由()知,当 时,年销售量 的预报值49=y.649576.y年利润 的预报值 z026.3z()根据()得结果知,年利润 的预报值z0.2(168)1.0.2zxx所以当 ,即 时, 取得最大值3.46z故年宣传费为 千元时,年利润的预报值最大4.12 【解析】 (I)由所给数据计算得 (1+2+3+4+5+6+7)=417t(2.9+3.3+3.6+4.4+4.8+5.2+5.9 )=4.31
8、7y=9+4+1+0+1+4+9=2821()t=71()ty(3)1.4(2)1()0.70.50.93.64, .7121()14.8ttyb .523aybt所求回归方程为 .0.53yt13 【解析】(I)由频率颁布直方图可知 ,在抽取的 100 人中,“体育迷”有 25 人,从而 22 列联表如下: 非体育迷 体育迷 合计男 30 15 45女 45 10 55合计 75 25 100由 22 列联表中数据代入公式计算,得: 2 2112()0(3145)103.7nx因为 3.0303.841,所以,没有理由认为“体育迷”与性别有关.(II)由频率分布直方图可知, “超级体育迷”为 5 人,从而一切可能结果所组成的基本事件空间 1213231(,),(,),aab121231(,),(,),abab其中 表示男性, 表示女性, 由 10 个基321(,),abiijj本事件组成,而且这些事件的出现时等可能的用 A 表示“任选 2 人中至少有 1 名是女性”这一事件,则 1212312(,),(,),(,),(,)Aabababb 7()10P