1、 第三 节 显 著性 检验 及 预测第三章 多元线性回归模型一、拟合优度检验二、变量的显著性检验三、回归方程的显著性检验四、利用方程进行预测一、多元线性回归模型的统计检验 类似一元回归,多元回归同样可以用 拟合优度 R2度量 样本回归方程 拟合 样本观察值 的程度。 R2越接近 1,拟合的越好。拟合优度( 1)总离差平方和分解设多元线性回归模型为:样本回归方程为:可得总的离差平方和分解式为TSS=ESS+RSS(2) 拟合优度(样本决定系数,可决系数)(3) 拟合优度(样本决定系数)的计算(4) 拟合优度的特性拟合优度给出了 解释变量的改变 导致 被解释变量改变的 程度 (百分比 ),R2 越
2、大,拟合的越好。但在多元回归回归模型中,拟合优度有这样的特点:如果模型增加一个新的解释变量, TSS不会改变,但是 ESS将会增加,即 R2随着解释变量个数的增加而变大。详细证明见下页 (选讲) 命题: 残差平方和 RSS是解释变量个数 k的减函数。因此,样本决定系数 R2是解释变量个数 k的增函数。* 选讲: 残差平方和 RSS的特性k元回归模型的残差平方和证明:增加一个解释变量,残差平方和变为考虑 RSSk和 RSSk+1取得极小值的的情况。( 在利用最小二乘法求参数估计值时 ,两者都应分别达到极小值。) 而 RSSk 取到极小值相当于 RSSk+1在 的条件下取极小值。 条件极值和无条件极值的关系是 : 条件极小值大于等于无条件极小值 ; 条件极大值小于或等于无条件极大值。例:从全班同学中选出一个个子最矮的同学。在不包括班长的情况下挑选出最矮的身高,一定高于或等于班长参加挑选时最矮的身高。后者是条件极小值。因为新增加的解释变量即使和被解释变量不相关,解释变量的增加也可以导致残差的减小,从而导致拟合优度的增大,这显然不合理 。 必须对拟合优度加以调整。拟合优度的特性会给人一种 错觉 :要使模型模拟的好,只要增加解释变量即可!但是现实情况是 :在多元线性回归中,由增加变量个数引起的拟合优度增大与拟合的好坏没有直接关系。