1、3.11研究货运总量y(万吨)与工业总产值(亿元)、农业总产值(亿元)、居民非商品支出(亿元)的关系。数据如表3-9所示。编号12345678910货运总量y(万吨)160260210265240220275160275250工业总产值x1(亿元)70756574726878667065农业总产值x2(亿元)35404042384542364442居民非商品支出x3(亿元)1.02.42.03.01.21.54.02.03.23.0(1) 计算出y,的相关系数矩阵。所以y,的相关系数矩阵为:(2) 求y关于,的三元线性回归方程。由系数表可以知道,y关于,的三元线性回归方程为:(3) 对所求得的
2、方程作拟合优度检验。由模型汇总可知,样本的决定系数为0.806,所以可以认为回归方程为样本观测值的拟合程度较好,即回归方程的显著性较高。(4) 对回归方程作显著性检验。对方差分析表可以知道p值为0.015时,就拒绝原假设,认为在显著性水平0.05下,y与,有显著的线性关系,即回归方程是显著的。(5) 对每一个回归系数作显著性检验。 由系数表可以知道,的P值分别为0.1和0.049说明回归系数较显著,的P值为0.2840.05说明的回归系数不显著,应该予以剔除。(6) 如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,作回归方程的显著性检验和回归系数的显著性检验。由系数表可以知道,重
3、新建立的回归方程:由方差分析表可知,P值为0.07说明自变量,对因变量y产生的线性影响较显著。由系数表可知,此时各个回归系数的P值均很小,说明回归系数的显著性较高。(7) 求出每一个回归系数的置信水平为95%的置信区间。由上表可知,的系数的95%的置信区间为(0.381,8.970) 的系数的95%的置信区间为(3.134,14.808)(8) 求标准化回归方程。由系数表可知,标准化后的回归方程为(9) 求当=75,=42,=3.1时的,给定置信水平为95%,用SPSS软件计算精确置信区间,手工计算近似预测区间。由上表可知,=267.8 的置信水平为95%的置信区间为(260.05895,334.12038)的置信水平为95%的近似区间估计为(241.63377,298.54556)(10) 结合回归方程对问题作一些基本分析。对于前面的分析,虽然R方的值蛮大的,但这并不能说明回归方程显著,此时还需要通过对回归方程以及回归方程系数进行检验。当一个回归方程通过显著性检验之后,并不能说明这个方程中所以自变量都对因变量y有显著影响,因此还需对回归系数进行检验。