1、1第 11 章 一元线性回归分析11.1(1)散点图(略) ,产量与生产费用之间正的线性相关关系。(2) 9023.r(3) 检验统计量 ,拒绝原假设,相关系数显著。281.4.1tt11.2 (1)散点图(略) 。(2) 86.11.3 (1) 表示当 时 的期望值。0xy(2) 表示 每变动一个单位 平均下降 0.5 个单位。1(3) 7)(yE11.4 (1) %9R(2) es11.5 一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近10 个卡车运货记录的随机样本,得到运送距离(单位:km)和运送时间( 单位:天)的数据如下:运 送 距 离 x 825
2、 215 1070 550 480 920 1350 325 670 1215运 送 时 间 y 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0要求:(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态:(2)计算线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。解:(1) x运 送 距 离 ( km) 1250107550250y运送时间(天) 54321可能存在线性关系。(2)相关性x 运送距离(km) y 运送时间(天)Pearson 相关性 1 .949(*)显著性(双侧) 0.000x
3、运送距离(km)N 10 10Pearson 相关性 .949(*) 1显著性(双侧) 0.000 y 运送时间(天)N 10 10*. 在 .01 水平(双侧)上显著相关。有很强的线性关系。(3)系数(a)非标准化系数 标准化系数模型 B 标准误 Beta t 显著性2(常量) 0.118 0.355 0.333 0.7481x 运送距离(km) 0.004 0.000 0.949 8.509 0.000a. 因变量: y 运送时间(天)回归系数的含义:每公里增加 0.004 天。11.6 下面是 7 个地区 2000 年的人均国内生产总值(GDP)和人均消费水平的统计数据:地 区 人 均
4、GDP(元 ) 人 均 消 费 水 平 (元 )北 京辽 宁上 海江 西河 南贵 州陕 西22 46011 22634 5474 8515 4442 6624 5497 3264 49011 5462 3962 2081 6082 035要求:(1)人均 GDP 作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。(4)计算判定系数,并解释其意义。(5)检验回归方程线性关系的显著性(a=0.05)。(6)如果某地区的人均 GDP 为 5 000
5、元,预测其人均消费水平。(7)求人均 GDP 为 5 000 元时,人均消费水平 95的置信区间和预测区间。解:(1) 人 均 GDP( 元 ) 403020100人均消费水平(元) 201806402_可能存在线性关系。(2)相关系数:相关性人均 GDP(元) 人均消费水平(元)Pearson 相关性 1 .998(*)显著性(双侧) 0.000人均 GDP(元)N 7 7Pearson 相关性 .998(*) 1显著性(双侧) 0.000 人均消费水平(元)N 7 7*. 在 .01 水平(双侧)上显著相关。有很强的线性关系。(3)回归方程:系数(a)3非标准化系数 标准化系数模型 B 标
6、准误 Beta t 显著性(常量) 734.693 139.540 5.265 0.0031人均 GDP(元) 0.309 0.008 0.998 36.492 0.000a. 因变量: 人均消费水平(元)回归系数的含义:人均 GDP 没增加 1 元,人均消费增加 0.309 元。(4)模型摘要模型 R R 方 调整的 R 方 估计的标准差1 .998(a) 0.996 0.996 247.303a. 预测变量 :(常量), 人均 GDP(元) 。人均 GDP 对人均消费的影响达到 99.6%。(5)F 检验:ANOVA(b)模型 平方和 df 均方 F 显著性回归 81,444,968.68
7、0 1 81,444,968.680 1,331.692 .000(a)残差 305,795.034 5 61,159.007 1合计 81,750,763.714 6 a. 预测变量 :(常量), 人均 GDP(元) 。b. 因变量: 人均消费水平(元)回归系数的检验:t 检验系数(a)非标准化系数 标准化系数模型 B 标准误 Beta t 显著性(常量) 734.693 139.540 5.265 0.0031人均 GDP(元) 0.309 0.008 0.998 36.492 0.000a. 因变量: 人均消费水平(元)(6)某地区的人均 GDP 为 5 000 元,预测其人均消费水平为
8、 2278.10657 元。(7)人均 GDP 为 5 000 元时,人均消费水平 95的置信区间为1990.74915 ,2565.46399,预测区间为1580.46315,2975.74999 。11.7(1) 散点图(略) ,二者之间为负的线性相关关系。(2)估计的回归方程为: 。回归系数 表示航班正点率每增加xy7.41892.307.411%,顾客投诉次数平均下降 4.7 次。(3)检验统计量 (P-Value=0.001108 ,认为线性关系显著。,7F,F(2)回归系数的显著性检验:假设:H 0: =0 H1: 01t= = =24.721S.838=2.36, ,认为 y 与
9、 x1 线性关系显著。21tnpt27(3)回归系数的显著性检验:假设:H 0: =0 H1: 02t= = =83.62S4.756=2.36, ,认为 y 与 x2 线性关系显著。tnpt2712.4 一家电器销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。下面是近 8 个月的销售额与广告费用数据:月 销 售 收 入 y(万 元 ) 电 视 广 告 费 用 工 : x1 (万 元 ) 报 纸 广 告 费 用 x2(万 元 )96909592959494945 02 04 02 53 03 52 53 01.52 01 52.53 32 34 22
10、5要求:(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。(3)上述(1)和(2) 所建立的估计方程,电视广告费用的系数是否相同?对其回归系数分别进行解释。(4)根据问题(2) 所建立的估计方程,在销售收入的总变差中,被估计的回归方程所解释的比例是多少?(5)根据问题(2)所建立的估计方程,检验回归系数是否显著(a=0.05)。解:(1)回归方程为: 8.64+1yx(2)回归方程为: 2329.3(3)不相同, (1)中表明电视广告费用增加 1 万元,月销售额增加 1.6 万元;(2)中表明,
11、在报纸广告费用不变的情况下,电视广告费用增加 1 万元,月销售额增加 2.29 万元。(4)判定系数 R2= 0.919,调整的 = 0.8866,比例为 88.66%。2aR(5)回归系数的显著性检验:Coefficients标准误差 t Stat P-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept 83.230091.57386952.882484.57E-08 79.18433 87.27585 79.18433 87.27585电视广告费用工:x1 (万元) 2.2901840.3040657.5318990.000653 1.5085
12、61 3.071806 1.508561 3.071806报纸广告费用 x2(万元) 1.3009890.3207024.0566970.009761 0.476599 2.125379 0.476599 2.125379假设:H 0: =0 H1: 01t= = =7.531S2.934=2.57, ,认为 y 与 x1 线性关系显著。0.25tt0.25(3)回归系数的显著性检验:9假设:H 0: =0 H1: 022t= = =4.052S1.3=2.57, ,认为 y 与 x2 线性关系显著。0.5tt0.2512.5 某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下:收
13、获 量 y(kg hm2) 降 雨 量 x1(mm) 温 度 x2()2 2503 4504 5006 7507 2007 5008 25025334510511011512068 1013141617要求:(1)试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。(2)解释回归系数的实际意义。(3)根据你的判断,模型中是否存在多重共线性?解:(1)回归方程为: 12-0.592.3867.yxx(2)在温度不变的情况下,降雨量每增加 1mm,收获量增加 22.386kg hm2,在降雨量不变的情况下,降雨量每增加 1 度,收获量增加 327.672kg hm2。(3) 与 的相关系数
14、=0.965,存在多重共线性。1x212xr12.612.712.812.9 下面是随机抽取的 15 家大型商场销售的同类产品的有关数据(单位:元) 。企 业 编 号 销 售 价 格 y 购 进 价 格 x1 销 售 费 用x2l23456789101112131415l 238l 266l 2001 1931 1061 3031 3131 1441 286l 084l 1201 1561 0831 2631 24696689444066479185280490577l51150585l659490696223257387310339283302214304326339235276390316
15、要求:(1)计算 y 与 x1、y 与 x2 之间的相关系数,是否有证据表明销售价格与购进价格、销售价格与销售费用之间存在线性关系?(2)根据上述结果,你认为用购进价格和销售费用来预测销售价格是否有用?(3)用 Excel 进行回归,并检验模型的线性关系是否显著(a0.05)。10(4)解释判定系数 R2,所得结论与问题(2)中是否一致?(5)计算 x1 与 x2 之间的相关系数,所得结果意味着什么?(6)模型中是否存在多重共线性?你对模型有何建议?解:(1)y 与 x1 的相关系数=0.309,y 与 x2 之间的相关系数=0.0012。对相关性进行检验:相关性销售价格 购进价格 销售费用P
16、earson 相关性 1 0.309 0.001显著性(双侧) 0.263 0.997销售价格N 15 15 15Pearson 相关性 0.309 1 -.853(*)显著性(双侧) 0.263 0.000购进价格N 15 15 15Pearson 相关性 0.001 -.853(*) 1显著性(双侧) 0.997 0.000 销售费用N 15 15 15*. 在 .01 水平(双侧)上显著相关。可以看到,两个相关系数的 P 值都比较的,总体上线性关系也不现状,因此没有明显的线性相关关系。(2)意义不大。(3)回归统计Multiple R 0.593684R Square 0.35246Ad
17、justed R Square 0.244537标准误差 69.75121观测值 15方差分析df SS MS FSignificance F回归分析 2 31778.1539 15889.08 3.265842 0.073722残差 12 58382.7794 4865.232总计 14 90160.9333 Coefficients 标准误差 t Stat P-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept 375.6018 339.410562 1.10663 0.290145 -363.91 1115.114 -363.91 1115.
18、114购进价格 x1 0.537841 0.21044674 2.555711 0.0252 0.079317 0.996365 0.079317 0.996365销售费用 x2 1.457194 0.66770659 2.182386 0.049681 0.002386 2.912001 0.002386 2.912001从检验结果看,整个方程在 5%下,不显著;而回归系数在 5%下,均显著,说明回归方程没有多大意义,并且自变量间存在线性相关关系。(4)从 R2 看,调整后的 R2=24.4%,说明自变量对因变量影响不大,反映情况基本一致。(5)方程不显著,而回归系数显著,说明可能存在多重共线性。(6)存在多重共线性,模型不适宜采用线性模型。12.11 一家货物运输公司想研究运输费用与货物类型的关系,并建立运输费用与货物类型的回归模型,以此对运输费用作出预测。该运输公司所运输的货物分为两种类型:易碎品和非易碎品。下表给出了15 个路程大致相同,而货物类型不同的运输费用数据。每 件 产 品 的 运 输 费 用 y(元 ) 货 物 类 型 x1