1、2.4 一元线性回归模型的统计检验 一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间 回归分析 是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线。 尽管从 统计性质 上已知,如果有足够多的重复抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。 那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行 统计检验 。 主要包括 拟合优度检验 、变量的 显著性检验 及参数的区间估计 。一、拟合优度检验 拟合优度检验拟合优度检验 : 对样本回归直线与样本观测值之间拟合程度的检验。度量拟合优
2、度的指标度量拟合优度的指标 :判定系数 ( 可决系数 ) R22、总离差平方和的分解Y的 i个观测值与样本均值的离差由回归直线解释的部分 回归直线不能解释的部分 离差分解为两部分之和 如果 Yi=i 即实际观测值落在样本回归 “ 线 ” 上,则 拟合最好 。可认为, “ 离差 ” 全部来自回归线,而与 “ 残差 ” 无关。对于所有样本点,则需考虑这些点与样本均值离差的平方和 ,可以证明 :记 总体平方和 (Total Sum of Squares)回归平方和 (Explained Sum of Squares)残差平方和 (Residual Sum of Squares)TSS=ESS+RSS
3、Y的观测值围绕其均值的 总离差 (total variation)可分解为两部分: 一部分来自回归线 (ESS),另一部分则来自随机势力 (RSS)。在给定样本中, TSS不变,如果实际观测点离样本回归线越近,则 ESS在 TSS中占的比重越大,因此拟合优度 :回归平方和 ESS/Y的总离差 TSS3、可决系数 R2统计量 称 R2 为 (样本) 可决系数 /判定系数 ( coefficient of determination)。 可决系数 的 取值范围 : 0, 1R2越接近 1,说明实际观测点离样本线越近,拟合优度越高 。在例 2.1.1的 收入 -消费支出 例中, 注:可决系数 是一个非负的统计量。它也是随着抽样的不同而不同。为此,对可决系数的统计可靠性也应进行检验,这将在第 3章中进行。 二、变量的显著性检验Testing Significance of Variable