1、11 下面是 7 个地区 2000 年的人均国内生产总值(GDP)和人均消费水平的统计数据:地 区 人 均 GDP/元 人 均 消 费 水 平 /元北 京辽 宁上 海江 西河 南贵 州陕 西224601122634547485154442662454973264490115462396220816082035求:(1)人均 GDP 作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。(3)求出估计的回归方程,并解释回归系数的实际意义。(4)计算判定系数,并解释其意义。(5)检验回归方程线性关系的显著性( )。0
2、.5(6)如果某地区的人均 GDP 为 5000 元,预测其人均消费水平。(7)求人均 GDP 为 5000 元时,人均消费水平 95的置信区间和预测区间。解:(1)可能存在线性关系。(2)相关系数:2系数 a非标准化系数 标准系数 相关性模型 B 标准 误差 试用版 t Sig. 零阶 偏 部分(常量) 734.693 139.540 5.265 .0031人均GDP .309 .008 .998 36.492 .000 .998 .998 .998a. 因变量: 人均消费水平有很强的线性关系。(3)回归方程: 734.690.yx系数 a非标准化系数 标准系数 相关性模型 B 标准 误差
3、试用版 t Sig. 零阶 偏 部分(常量) 734.693 139.540 5.265 .0031人均GDP .309 .008 .998 36.492 .000 .998 .998 .998a. 因变量: 人均消费水平回归系数的含义:人均 GDP 没增加 1 元,人均消费增加 0.309 元。%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。系数(a)非标准化系数 标准化系数模型 B 标准误 Beta t 显著性(常量) 734.693 139.540 5.265 0.0031人均 GDP(元)0.309 0.008 0.998 36.492 0.000a. 因变量: 人均消费
4、水平(元)%(4)模型汇总模型 R R 方 调整 R 方标准 估计的误差1 .998a .996 .996 247.303a. 预测变量: (常量), 人均GDP。人均 GDP 对人均消费的影响达到 99.6%。%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。模型摘要模型 R R 方 调整的 R 方 估计的标准差1 .998(a) 0.996 0.996 247.3033a. 预测变量 :(常量), 人均 GDP(元) 。%(5)F 检验:Anovab模型 平方和 df 均方 F Sig.回归 81444968.680 1 81444968.680 1331.692 .000a残
5、差 305795.034 5 61159.0071总计 81750763.714 6a. 预测变量: (常量), 人均GDP。b. 因变量: 人均消费水平回归系数的检验:t 检验系数 a非标准化系数 标准系数 相关性模型 B 标准 误差 试用版 t Sig. 零阶 偏 部分(常量) 734.693 139.540 5.265 .0031人均GDP .309 .008 .998 36.492 .000 .998 .998 .998a. 因变量: 人均消费水平%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。系数(a)非标准化系数 标准化系数模型 B 标准误 Beta t 显著性(常量
6、) 734.693 139.540 5.265 0.0031人均 GDP(元)0.309 0.008 0.998 36.492 0.000a. 因变量: 人均消费水平(元)%(6)某地区的人均 GDP 为 5000 元,预测其人均消费水平为(元) 。734.90.5278.693y(7)人均 GDP 为 5000 元时,人均消费水平 95的置信区间为1990.74915,2565.46399 ,预测区间为1580.46315,2975.74999。2 从 n=20 的样本中得到的有关回归结果是:SSR(回归平方和) =60,SSE(误差平方和)=40。要检验 x 与 y 之间的线性关系是否显著
7、,即检验假设: 。01:H(1)线性关系检验的统计量 F 值是多少?4(2)给定显著性水平 , 是多少?0.5F(3)是拒绝原假设还是不拒绝原假设?(4)假定 x 与 y 之间是负相关,计算相关系数 r。(5)检验 x 与 y 之间的线性关系是否显著?解:(1)SSR 的自由度为 k=1;SSE 的自由度为 n-k-1=18;因此:F= = =271SRkEn6048(2) = =4.41,8F0.5,(3)拒绝原假设,线性关系显著。(4)r= = =0.7746,由于是负相关,因此 r=-0.7746SRE.6(5)从 F 检验看线性关系显著。3 随机抽取 7 家超市,得到其广告费支出和销售
8、额数据如下:超 市 广 告 费 支 出 /万 元 销 售 额 /万 元ABCDEFGl24610142019324440525354求:(1)用广告费支出作自变量 x,销售额作因变量 y,求出估计的回归方程。(2)检验广告费支出与销售额之间的线性关系是否显著( )。0.(3)绘制关于 x 的残差图,你觉得关于误差项 的假定被满足了吗 ? (4)你是选用这个模型,还是另寻找一个更好的模型?解:(1)系数(a)非标准化系数 标准化系数模型 B 标准误 Beta t 显著性(常量) 29.399 4.807 6.116 0.0021广告费支出(万元) 1.547 0.463 0.831 3.339
9、0.021a. 因变量: 销售额(万元)(2)回归直线的 F 检验:ANOVA(b)模型 平方和 df 均方 F 显著性5回归 691.723 1 691.723 11.147 .021(a)残差 310.277 5 62.055 1合计 1,002.000 6 a. 预测变量 :(常量), 广告费支出(万元) 。b. 因变量: 销售额(万元)显著。回归系数的 t 检验:系数(a)非标准化系数 标准化系数模型 B 标准误 Beta t 显著性(常量) 29.399 4.807 6.116 0.0021广告费支出(万元) 1.547 0.463 0.831 3.339 0.021a. 因变量:
10、销售额(万元)显著。(3)未标准化残差图:广 告 费 支 出 ( 万 元 ) 20151050Unstadrize Rsdual10.5.00.-5.0-10.-15.0_标准化残差图:6广 告 费 支 出 ( 万 元 ) 20151050Standrize Rsdual1.00.-1.0-2.0学生氏标准化残差图:7广 告 费 支 出 ( 万 元 ) 20151050Studeniz Resdual2.01.00.-1.0-2.0看到残差不全相等。(4)应考虑其他模型。可考虑对数曲线模型:y=b0+b1ln(x)=22.471+11.576ln(x)。84 根据下面 SPSS 输出的回归结果
11、,说明模型中涉及多少个自变量? 多少个观察值?写出回归方程,并根据 F,s e,R 2及调整的 的值对模型进行讨论。2a模型汇总 b模型 R R 方 调整 R 方标准 估计的误差1 0.842407 0.709650 0.630463 109.429596Anovab模型 平方和 df 均方 F Sig.回归 321946.8018 3 107315.6006 8.961759 0.002724残差 131723.1982 11 11974.841总计 453670 14系数 a非标准化系数模型 B 标准 误差 t Sig.(常量) 657.0534 167.459539 3.923655 0
12、.0023781VAR00002VAR00003VAR000045.710311-0.416917-3.4714811.7918360.3221931.4429353.186849-1.293998-2.4058470.0086550.2221740.034870解:自变量 3 个,观察值 15 个。回归方程: =657.0534+5.710311X1-0.416917X2-3.471481X3y拟合优度:判定系数 R2=0.70965,调整的 =0.630463,说明三个自变量对因变量的影响2aR的比例占到 63%。估计的标准误差 =109.429596,说明随即变动程度为 109.4295
13、96yxS回归方程的检验:F 检验的 P=0.002724,在显著性为 5%的情况下,整个回归方程线性关系显著。回归系数的检验: 的 t 检验的 P=0.008655,在显著性为 5%的情况下,y 与 X1线性关系1显著。的 t 检验的 P=0.222174,在显著性为 5%的情况下,y 与 X2线性关系2不显著。9的 t 检验的 P=0.034870,在显著性为 5%的情况下,y 与 X3线性关系3显著。因此,可以考虑采用逐步回归去除 X2,从新构建线性回归模型。5 下面是随机抽取的 15 家大型商场销售的同类产品的有关数据(单位:元) 。企 业 编 号 销 售 价 格 y 购 进 价 格
14、x1 销 售 费 用 x2l23456789101112131415l238l266l200119311061303131311441286l084l120115610831263124696689444066479185280490577l51150585l659490696223257387310339283302214304326339235276390316求:(1)计算 y 与 x1、y 与 x2之间的相关系数,是否有证据表明销售价格与购进价格、销售价格与销售费用之间存在线性关系?(2)根据上述结果,你认为用购进价格和销售费用来预测销售价格是否有用?(3)求回归方程,并检验模型的线性
15、关系是否显著( )。0.5(4)解释判定系数 R2,所得结论与问题(2)中是否一致?(5)计算 x1与 x2之间的相关系数,所得结果意味着什么?(6)模型中是否存在多重共线性?你对模型有何建议?解:(1)y 与 x1的相关系数=0.309,y 与 x2之间的相关系数=0.0012。对相关性进行检验:相关性销售价格 购进价格 销售费用Pearson 相关性 1 0.309 0.001显著性(双侧) 0.263 0.997销售价格N 15 15 15Pearson 相关性 0.309 1 -.853(*)显著性(双侧) 0.263 0.000购进价格N 15 15 15Pearson 相关性 0.
16、001 -.853(*) 1销售费用显著性(双侧) 0.997 0.000 10N 15 15 15*. 在 .01 水平(双侧)上显著相关。可以看到,两个相关系数的 P 值都比较的,总体上线性关系也不现状,因此没有明显的线性相关关系。(2)意义不大。(3)回归统计Multiple R 0.593684R Square 0.35246Adjusted R Square 0.244537标准误差 69.75121观测值 15方差分析df SS MS F Significance F回归分析 2 31778.1539 15889.08 3.265842 0.073722残差 12 58382.77
17、94 4865.232总计 14 90160.9333 Coefficients 标准误差 t Stat P-valueLower 95%Upper 95%下限 95.0%上限 95.0%(常量) 375.6018339.410562 1.106630.290145 -363.91 1115.114 -363.91 1115.114购进价格x1 0.5378410.210446742.555711 0.0252 0.079317 0.996365 0.079317 0.996365销售费用x2 1.4571940.667706592.1823860.049681 0.002386 2.9120
18、01 0.002386 2.912001从检验结果看,整个方程在 5%下,不显著;而回归系数在 5%下,均显著,说明回归方程没有多大意义,并且自变量间存在线性相关关系。(4)从 R2看,调整后的 R2=24.4%,说明自变量对因变量影响不大,反映情况基本一致。(5)方程不显著,而回归系数显著,说明可能存在多重共线性。(6)存在多重共线性,模型不适宜采用线性模型。6 一家电器销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。下面是近 8 个月的销售额与广告费用数据:月 销 售 收 入 y/万 元 电 视 广 告 费 用 x1 /万 元 报 纸 广 告 费 用 x2/万 元