1、线性回归方程 【目标引领】 1 学习目标: 了解非确定性关系中两个变量的统计方法;掌握散点图的画法及在统计中的作用,掌握 回归直线方程的求解方法 。 2 学法指导: 求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义否则,求出的回归直线方程毫无意义因此,对一组数据作线性回归分析时,应先看其散点图是否成线性 求回归直线方程,关键在于正确地求出系数 a、 b,由于求 a、 b 的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误 回归直线方程在现实生活与生产中有广泛的应用应 用回归直线方程可以把非确定性问题转化成确定性问题,把 “ 无序 ” 变为 “ 有序
2、 ” ,并对情况进行估测、补充因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识 【教师在线】 1 解析视屏: 1 相关关系的概念 在实际问题中,变量之间的常见关系有两类: 一类是确定性函数关系,变量之间的关系可以用函数表示。例如正方形的面积 S 与其边长 x之间的函数关系2xS(确定关系); 一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达。例如一块农田的水稻产量与施肥量的关系(非确定关系) 相关关系:自变量取值 一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。 相关关系与函数关系的异同点: 相同点:均是指两个变量的关系。 不同点:函
3、数关系是一种确定关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系。 2求回归直线方程的思想方法 观察散点图的特征,发现各点大致分布在一条直线的附近,思考:类似图中的直线可画几条? 引导学生分析,最能代表变量 x 与 y 之间关系的直线的特征:即 n 个偏差的平方和最小,其过程简要分析如下 : 设所求的直线方程为 y bx a,其中 a、 b 是待定系数。 则 ( 1, 2 , , )iiy bx a i n ,于是得到各个偏差。 ( ) , ( 1 , 2 , . )i i iy y y bx a i
4、n 显见,偏差 iyy的符号有正负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用 n 个偏差的平方和 2 2 21 1 2 2( ) ( ) . ( )nnQ y bx x y bx a y bx a 表示 n 个点与相应直线在整体上的接近程度。 记21 ()niiiQ y bx a 。 上述式子展开后,是一个关于 a, b 的二次多项式,应用配方法,可求出使 Q 为最小值时的 a, b 的值,即 xbyaxnxyxnyxb n1i22in1iii其中 1111,nniiiix x y ynn 以上方法称为 最小二乘法 。 2 经典回放: 例 1:
5、下列各组变量哪个是函数关系,哪个是相关关系? ( 1)电压 U 与电流 I ( 2)圆面积 S 与半径 R ( 3)自由落体运动中位移 s 与时间 t ( 4)粮食产量与施肥量 ( 5)人的身高与体重 ( 6)广告费支出与商品销售额 分析: 函数关系是一种确定关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系。 解:前三小题中一个变量的变化可以确定另一个变量的变化,两者之间是函数关系。 对于粮食与施肥量,两者确实有非常密切的关系,实践证明,在一定的范围内,施肥量越多,粮食产量就越高,但是,施肥量并不能完全
6、确定粮食产量,因为粮食产量还与其他 因素的影响有关,如降雨量、田间管理水平等。因此,粮食与施肥量之间不存在确定的函数关系。 人的身高与人的体重也密切相关,一般来说,一个人的身高越高,体重也越重,但同样身高的人,其体重不一定相同,身高和体重这两个变量之间并不是严格的函数关系。 广告费支出与商品销售额有密切的关系,但广告费的支出不能完全决定商品的销售额。由此可见,后三小题各对变量之间的关系是相关关系。 点评: 不要认为两个变量间除了函数关系,就是相关关系,事实是上,两个变量间可能毫无关系。比如地球运行的速度与某个人的行走速度就可认为没有关系。 例 2: 已知 10只狗的血球体积及红血球的测量值如下
7、: 45 42 46 48 42 35 58 40 39 50 y 6.53 6.30 9.25 7.50 6.99 5.90 9.49 6.20 6.55 7.72 (血球体积,),(血红球数,百万) (1)画出上表的散点图 ;(2)求出回归直线并且画出图形 。 解:()见下图 x30y51035 40 45 50 55()50.45)50394058354248464245(101x 37.7)72.855.620.649.990.599.650.752.930.653.6(101y 设回归直线为 abxy , 则176.0xnxyxnyxa n1i22in1iii, 64.0 xayb
8、所以所求回归直线的方程为 0.176 0.64yx,图形如下 : x30y51035 40 45 50 55点评: 对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数 a、 b 的计算公式,算出 a、 b由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误求线性回归方程的步骤:计算平均数 yx,;计算 ii yx与的积,求 iiyx;计算 2ix;将结果代入公式求;用 xayb 求;写出回归方程 。 【同步训练】 1 . 下列两个变量之间的关系哪个不是函数关系( ) A角度和它的余弦值 B.正方形边长和面积 C正边形的边数和它的内角和 D.人的年龄和
9、身高 2某市纺织工人的月工资(元)依劳动生产率(千元)变化的回归方程为 y=50+80x,则下列说法中正确的是 ( ) A劳动生产率为 1000元时,月工资为 130元 B劳动生产率提高 1000元时,月工资提高约为 130元 C劳动生产率提高 1000元时,月工资提高约为 80元 D月工资为 210元时,劳动生产率为 2000元 3设有一个回归方程为 y=2-1.5x,则变量 x 每增加一个单位时, y 平均 ( ) A增加 1.5单位 B增加 2 单位 C减少 1.5单位 D减少 2 单位 4正常情况下,年龄在 18岁到 38岁 的人们,体重 y( kg)依身高 x( cm)的回归方程为y
10、=0.72x-58.5。张红红同学不胖不瘦,身高 1 米 78,他的体重应在 kg左右。 5.给出施化肥量对水稻产量影响的试验数据: 施化肥量 x 15 20 25 30 35 40 45 水稻产量 y 330 345 365 405 445 450 455 (1)画出上表的散点图 ;(2)求出回归直线并且画出图形 【拓展尝新 】 6在某种产品表面进行腐蚀线试验,得到腐蚀深度 y 与腐蚀时间 x 之间对应的一组数据: 时间t(s) 5 10 15 20 30 40 50 60 70 90 120 深度y(m) 6 10 10 13 16 17 19 23 25 29 46 (1)画出散点图;
11、(2)试求腐蚀深度 y 对时间 t 的回归直线方程。 【解答】 1 D 2 C 3 C 4 69.66 5 解: (1)散点图(略) (2)表中的数据进行具体计算,列成以下表格 i 1 2 3 4 5 6 7 xi 15 20 25 30 35 40 45 yi 330 345 365 405 445 450 455 xiyi 4950 6900 9125 12150 15575 18000 20475 3.399y,30x , 7 7 7221 1 17000 , 1132725 , 87175i i i ii i ix y x y 故可得到 2573075.43.399a75.43077000 3.39930787175b 2。 6 解: (1)散点图略,呈直线形 . (2)经计算可得: 45.19y,36.46t 111i111i ii2i111i2i 13910yt,5442y,36750t 542.536.463.045.19a3.036.461136750 45.1936.461113910b 2故所求的回归直线方程为 542.5t3.0y 。