第五章 线性回归的定式偏差 1n 前面介绍的线性回归分析建立在模型假设成立的基础上,但这些假设并不必然成立。 n 本章讨论变量关系非线性、存在异常值、规律性扰动和解释变量缺落等,导致线性回归模型前两条假设不成立的定式偏差,包括它们对线性回归分析的影响,判断和处理的方法等。 2本章结构第一节 变量关系非线性 第二节 异常值第三节 规律性扰动 第四节 解释变量缺落 第五节 参数变化3第一节 变量关系非线性一、问题二、发现与判断三、问题处理和非线性回归 4一、问题n 线性回归模型都假设变量关系是线性随机函数关系,或者经过特定数学变换以后是线性随机函数关系。 n 但实际变量关系可能会存在偏差,存在用线性模型分析非线性关系的可能性。 n 把非线性变量关系当作线性关系处理,也可以说是违反误差项均值为0 的假设,对线性回归分析的有效性有根本性的破坏作用。 5n 例如若两个变量之间的真实关系为: n 其中 满足 =0 和线性回归模型的其他假设,但如果我们直接用: 进行回归分析,那么因为:n 因此:n 显然不可能始终为0 。6n 把非线性变量关系作为线性关系进行分析是变量关系的误识别。n 不仅会使得回归