1、1变量间的相关关系_1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程1相关关系(1)定义:如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的_性,那么这两个变量之间的关系,叫做相关关系(2)两类特殊的相关关系:如果散点图中点的分布是从_角到_角的区域,那么这两个变量的相关关系称为正相关,如果散点图中点的分布是从_角到
2、_角的区域,那么这两个变量的相关关系称为负相关随机 左下 右上 左上 右下两个变量间的关系分为三类:一类是确定性的函数关系,如正方形的边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,例如,某位同学的“物理成绩”与“数学成绩 ”之间的关系,我们称它们为相关关系;再一类是不相关,即两个变量间没有任何关系2线性相关(1)定义:如果两个变量散点图中点的分布从整体上看大致在一条_附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做_(2)最小二乘法:求线性回归直线方程 x 时,使得样本数据的点到它的 _y b a 最小
3、的方法叫做最小二乘法,其中 a,b 的值由以下公式给出:2直线 回归直线 距离的平方和其中, 是回归方程的_, 是回归方程在 y 轴上的_b a 斜率 截距yx-线性回归分析涉及大量的计算,形成操作上的一个难点,可以利用计算机非常方便地作散点图、回归直线,并能求出回归直线方程因此在学习过程中,要重视信息技术的应用类型一 变量之间的相关关系的判断例 1:(1)下列变量之间的关系不是相关关系的是( )A二次函数 yax 2bxc 中, a,c 是已知常数,取 b 为自变量,因变量是判别式b 24 acB光照时间和果树亩产量C降雪量和交通事故发生率D每亩田施肥量和粮食亩产量(2)现随机抽取某校 10
4、 名学生在入学考试中的数学成绩 x 与入学后的第一次数学成绩 y,数据如下:学号 1 2 3 4 5 6 7 8 9 10x 120 108 117 104 103 110 104 105 99 108y 84 64 84 68 69 68 69 46 57 71请利用散点图判断这 10 名学生的两次数学考试成绩是否具有相关关系解析 (1)在 A 中,若 b 确定,则 a,b,c 都是常数, b24ac 也就唯一确这了,因此,这两者之间是确定性的函数关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所以 B,C,D 是相关关系故选 A.(
5、2)两次数学考试成绩散点图如图所示,3由散点图可以看出两个变量的对应点集中在一条直线的周围,具有正相关关系因此,这 10名学生的两次数学考试成绩具有相关关系练习 1:对变量 x,y 有观测数据 (xi,y i)(i1,2,10) ,得散点图(1);对变量 u,v 有观测数据(u i,v i)(i1,2 ,10),得散点图(2) 由这两个散点图可以判断 ( )A变量 x 与 y 正相关,u 与 v 正相关B变量 x 与 y 正相关,u 与 v 负相关C变量 x 与 y 负相关,u 与 v 正相关D变量 x 与 y 负相关,u 与 v 负相关答案 C类型二 回归直线方程例 2:随着人们经济收入的不
6、断增长,个人购买家庭轿车已不再是一种时尚车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限 x 与所支出的总费用 y(万元)有如下的数据资料:使用年限 x 2 3 4 5 6总费用 y 2.2 3.8 5.5 6.5 7.0若由资料,知 y 对 x 呈线性相关关系试求:(1)线性回归方程 x 的回归系数 、;y b a a b (2)估计使用年限为 10 年时,车的使用总费用是多少?解析 第一步,列表 xi,y i, xiyi;第二步,计算 , , , , iyi;x y ni 1x2ini
7、 1y2ini 1x第三步,代入公式计算 b,a 的值;第四步,写出回归直线方程(1)利用公式:Error!来计算回归系数有时为了方便常列表,对应列出 xiyi、 x ,以利于求和(2)获得线性回归方2i程后,取 x10 ,即得所求答案 (1)列表:4i 1 2 3 4 5xi 2 3 4 5 6yi 2.2 3.8 5.5 6.5 7.0xiyi 4.4 11.4 22.0 32.5 42.0x2i 4 9 16 25 364, 5, 90, iyi11x y 5i 1x2i5i 1x2.3于是 1.23;b 112.3 54590 542 12.310 b 51.2340.08.a y x
8、 (2)线性回归直线方程是 1.23x0.08,当 x10(年)时, 1.23100.0812.38( 万元),即y y 估计使用 10 年时,支出总费用是 12.38 万元练习 1:(2015石家庄高二检测) 已知回归直线的斜率的估计值是 1.23,样本点中心(即( , )为x y(4,5),则回归直线的方程是( )A. 1.23 x4 B. 1.23 x5 C. 1.23 x0.08 D. 0.08 x1.23y y y y 答案 C练习 2:某公司的广告费支出 x(单位:万元) 与销售额 y(单位:万元)之间有下列对应数据:x 2 4 5 6 8y 30 40 60 50 70资料显示
9、y 对 x 呈线性相关关系根据上表提供的数据得到回归方程 x 中的 6.5,预测销售额为 115 万元时约需y b a b _万元广告费答案 15有人统计了同一个省的 6 个城市某一年的人均国民生产总值( 即人均 GDP)和这一年各城市患白血病的儿童年数量,如下表:人均 GDP/万元 10 8 6 4 3 1患白血病的儿童数/人 351 312 207 175 132 180(1)画出散点图,并判定这两个变量是否具有线性相关关系;(2)通过计算可知这两个变量的回归直线方程为23.25x102.15,假如一个城市的人均 GDP 为12 万元,那么可以断言,这个城市患白血病的儿童一定超过 380
10、人,请问这个断言是否正确?5解析 (1)根据表中数据画散点图,如图所示,从图可以看出,在 6 个点中,虽然第一个点离这条直线较远,但其余 5 个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系(2)上述断言是错误的,将 x12 代入 23.25x102.15 得y 23.25 12 102.15381.15380,但 381.15 是对该城市人均 GDP 为 12 万元的情况下所作的一y 个估计,该城市患白血病的儿童可能超过 380 人,也可能低于 380 人练习 1:某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价 x(元 ) 8 8.
11、2 8.4 8.6 8.8 9销量 y(件 ) 90 84 83 80 75 68(1)求回归直线方程 x ,其中 20.y b a b (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是 4 元/ 件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润销售收入成本)答案 (1)由于 (x1x 2 x3x 4x 5x 6)8.5,x16 (y1y 2y 3y 4y 5y 6)80.y16所以 80208.5250,a y b x从而回归直线方程为 20x250.y (2)设工厂获得的利润为 L 元,依题意得Lx(20x250)4(20 x250)20x 2330x
12、1000 20(x8.25) 2361.25.当且仅当 x8.25 时,L 取得是大值,故当单价定为 8.25 元时,工厂可获得最大利润1下列两个变量之间的关系:角度和它的余弦值;正 n 边形的边数与内角和;家庭的支出与收入;6某户家庭用电量与电价间的关系其中是相关关系的有( )A1 个 B2 个C3 个 D4 个答案 A2下列图形中两个变量具有相关关系的是( )答案 C3设一个回归方程为 31.2x,则变量 x 增加一个单位时( )y Ay 平均增加 1.2 个单位By 平均增加 3 个单位Cy 平均减少 1.2 个单位Dy 平均减少 3 个单位答案 A4现有 5 组数据 A(1,3)、 B
13、(2,4)、 C(4,5)、 D(3,10)、 E(10,12),去掉_组数据后,剩下的 4 组数据的线性相关性最大答案 D5下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨) 与相应的生产能耗y(吨标准煤 )的几组对照数据:x 3 4 5 6y 2.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程 x ;y b a (3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤试根据(2)求出的线性回归方程,预测生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤?解析 (1)散点图,如图所示
14、(2)由题意,得 iyi32.5435464.566.5,ni 1x7 4.5, 3.5,x3 4 5 64 y 2.5 3 4 4.543 24 25 26 286,ni 1x2i 0.7,b 66.5 44.53.586 44.52 66.5 6386 81 3.50.74.50.35,a y b x故线性回归方程为 0.7x 0.35.y (3)根据回归方程的预测,现在生产 100 吨产品消耗的标准煤的数量为 0.71000.3570.35,故耗能减少了 9070.3519.65(吨标准煤) _基础巩固一、选择题1由一组样本数据(x 1,y 1),( x2,y 2),(x n,y n)得
15、到的回归直线方程 bxa,那么下面说y 法不正确的是( )A直线 bxa 必经过点( , )y x y B直线 bxa 至少经过点( x1,y 1),(x 2,y 2),(x n,y n)中的一个点y C直线 bxa 的斜率为y ni 1xiyi n x y ni 1x2i n x 2D直线 bxa 和各点(x 1,y 1),( x2,y 2),(x n,y n)的偏差 yi( bxia) 2 是该坐标平y ni 1面上所有直线与这些点的偏差中最小的直线答案 B8解析 由 a b 知 b bx ,必定过( , )点y x y y x x y回归直线方程对应的直线是与样本数据距离最小的,但不一定
16、过原始数据点,只须和这些点很接近即可2下列说法正确的是( )A对于相关系数 r 来说,| r|1,|r| 越接近 0,相关程度越大;| r|越接近 1,相关程度越小B对于相关系数 r 来说,| r|1,|r|越接近 1,相关程度越大;|r| 越大,相关程度越小C对于相关系数 r 来说,| r|1,|r|越接近 1,相关程度越大;|r| 越接近 0,相关程度越小D对于相关系数 r 来说,| r|1,|r| 越接近 1,相关程度越小;| r|越大,相关程度越大答案 C3(2015辽宁鞍山调研)两个变量成负相关关系时,散点图的特征是( )A点从左下角到右上角区域散布B点散布在某带形区域内C点散布在某
17、圆形区域内D点从左上角到右下角区域散布答案 D4(2014重庆)已知变量 x 与 y 正相关,且由观测数据算得样本的平均数 2.5, 3.5,则由x y观测的数据得线性回归方程可能为( )A. 0.4 x2.3 B. 2x2.4y y C. 2x9.5 D. 0.3x4.4y y 答案 A解析 x ,正相关则 b0,排除 C,D. 过中点心( , )(3,3.5),选 A.y b a x y5某化工厂为预测某产品的回收率 y,需要研究它的原料有效成分含量 x 之间的相关关素,现取了 8 对观测值,计算得: i52, i228, 478, iyi1849,则 y 对 x 的回归直8i 1x8i
18、1y8i 1x2i8i 1x线的方程是( )A. 11.47 2.62 x B. 11.472.62xy y C. 2.6211.47x D. 11.472.62xy y 答案 A9解析 由已知得 i 52 , i 228 ,所以 x188i 1x 18 132 y 188i 1y 18 572 b 8i 1xiyi 8x y8i 1x2i 8x22.62, 2.62 11.47,所以 2.62x11.47.1849 8132 572478 81322 a y b x 572 132 y 6为了考查两个变量 x 和 y 之间的线性关系,甲、乙两位同学各自独立做了 10 次和 15 次试验,并且
19、利用线性回归方法,求得回归直线分别为 l1、l 2,已知两人所得的试验数据中,变量 x 和y 的数据的平均值都相等,且分别是 s 和 t,那么下列说法中正确的是( )A直线 l1、l 2 一定有公共点 (s,t)B直线 l1、l 2 相交,但交点不一定是(s,t)C必有直线 l1l 2Dl 1、l 2 必定重合答案 A解析 线性回归直线方程为 bx a,而 ,即 atbs,t bsa,所以( s,t )在回y a y b x归直线上,直线 l1、l 2 一定有公共点(s ,t )二、填空题7(2011辽宁高考)调查了某地若干户家庭的年收入 x(单位:万元)和年饮食支出 y(单位:万元),调查显
20、示年收入 x 与年饮食支出 y 具有线性相关关系,并由调查数据得到 y 对 x 的回归直线方程:0.254 x0.321. 由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支出平均增加_y 万元答案 0.254解析 由于 0.254x 0.321 知,当 x 增加 1 万元时,年饮食支出 y 增加 0.254 万元y 8某单位为了解用电量 y(度) 与气温 x()之间的关系,随机抽查了某 4 天的用电量与当天气温,并制作了对照表:气温() 18 13 10 1用电量(度) 24 34 38 64由表中数据得线性回归方程 x 中 2,预测当气温为4时,用电量约为_y b a b 度答案 6
21、810解析 10, 40,因为回归方程一定过点( , ),x18 13 10 14 y 24 34 38 644 x y所以 ,则 4021060.y b x a a y b x则 2x60 ,当 x4 时, 2( 4)6068.y y 三、解答题9某种产品的广告费支出 x 与销售额 y 之间有如下对应数据( 单位:百万元)x 2 4 5 6 8y 30 40 60 50 70(1)画出散点图;(2)从散点图中判断销售金额与广告费支出成什么样的关系?解析 (1)以 x 对应的数据为横坐标,以 y 对应的数据为纵坐标,所作的散点图如下图所示:(2)从图中可以发现广告费支出与销售金额之间具有相关关
22、系,并且当广告费支出由小变大时,销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即 x 与 y 成正相关关系10一台机器由于使用时间较长,生产的零件有一些缺损按不同转速生产出来的零件有缺损的统计数据如下表所示:转速 x(转/秒) 16 14 12 8每小时生产有缺损零件数 y(个) 11 9 8 5(1)作出散点图;(2)如果 y 与 x 线性相关,求出回归直线方程;(3)若实际生产中,允许每小时的产品中有缺损的零件最多为 10 个,那么,机器的运转速度应控制在什么范围内?解析 先作出散点图,再根据散点图判断 y 与 x 呈线性相关,从而建立回归直线方程求解解:(1)作散点图如图所示(2)由散点图可知 y 与 x 线性相关故可设回归直线方程为 bxa.y 依题意,用计算器可算得: