1、第九章 模型设定与数据问题探讨一、模型设定偏误的类型 n 模型设定偏误主要有两大类 :(1)关于解释变量选取的偏误 ,主要包括 漏选相关变量 和 多选无关变量 ,(2)关于模型函数形式选取的偏误 。 1. 相关变量的遗漏( omitting relevant variables) n 例如 ,如果 “ 正确 ” 的模型为 :而我们将模型设定为 : 即设定模型时漏掉了一个相关的解释变量。这类错误称为 遗漏相关变量 。 2. 无关变量的误选 (including irrevelant variables) n 例如 ,如果Y=0+1X1+2X2+仍为 “真 ”,但我们将模型设定为 :Y=0+ 1X
2、1+ 2X2+ 3X3 +即设定模型时,多选了一个无关解释变量。 3. 错误的函数形式 (wrong functional form)n 例如 ,如果 “ 真实 ” 的回归函数为 : 但却将模型设定为 : 二、模型设定偏误的后果 n 当模型设定出现偏误时,模型估计结果也会与“ 实际 ” 有偏差。这种 偏差的性质及程度与模型设定偏误的类型密切相关 。 1. 遗漏相关变量偏误采用遗漏相关变量的模型进行估计而带来的偏误称为 遗漏相关变量偏误 ( omitting relevant variable bias)。设正确的模型为 :Y=0+1X1+2X2+却对Y=0+ 1X1+v进行回归,得 :将正确模型 Y=0+1X1+2X2+ 的离差形式 : 代入 得 :(1)如果漏掉的 X2与 X1相关,则上式中的第二项在小样本下求期望与大样本下求概率极限都不会为零,从而使得 OLS估计量在小样本下有偏,在大样本下非一致 。(2)如果 X2与 X1不相关,则 1的估计满足无偏性与一致性;但这时 0的估计却是有偏的。 2. 包含无关变量偏误采用包含无关解释变量的模型进行估计带来的偏误,称为 包含无关变量偏误 ( including irrelevant variable bias)。设 Y=0+ 1X1+v (*) 为正确模型,但却估计了Y=0+1X1+2X2+ (*)