1、第七章:回归分析的其它问题 第一节 虚拟变量 第二节 设定误差 第三节 滞后变量模型介绍 第四节 随机解释变量 第五节 时间序列模型初步第一节 虚拟变量一、虚拟变量及其作用1.定义:取值为 0和 1的人工变量,表示非量化(定性)因素对模型的影响,一般用符号 D表示。例如:政策因素、地区因素、心理因素、季节因素等。2.作用: 描述 和 测量 定性因素的影响; 正确反映经济变量之间的相互关系,提高模型的 精度; 便于处理 异常 数据。二、虚拟变量的设置原则 引入虚拟变量一般取 0和 1。 对定性因素一般取级别数减 1个虚拟变量。例子 1:性别因素,二个级别(男、女)取一个虚拟变量, D=1表示男(
2、女), D=0表示女(男)。 例子 2:季度因素,四个季度取 3个变量。 小心 “虚拟变量陷阱 ”!三、虚拟变量的应用 1、在常数项引入虚拟变量,改变截距。 对上式 作 OLS, 得到参数估计值和回归模型: (7.1.2)相当于两个回归模型: 2、在斜率处引入虚拟变量,改变斜率。 作 OLS后得到参数估计值,回归模型为: 同样可以写成二个模型: 可考虑同时在截距和斜率引入虚拟变量: 3、虚拟变量用于季节性因素分析。 取 原模型若为 则引入虚拟变量后的模型为: 回归模型可视为:例题:美国制造业的利润 销售额行为 模型: 利用 19651970 年六年的季度数据,得结果: 括号内为 t统计值。 显然,三季度和四季度与一季度差异并不明显,重新回归,仅考虑二季度,有结果: 4、引用虚拟变量处理 “时间拐点 ”问题。 常见的情况: a. 若 T0为 两个时间段之间的某个拐点,虚拟变量为: b. 用虚拟变量表示某个特殊时期的影响; 模型中虚拟变量可放在截距项或斜率处。 5、分阶段计酬问题。 若工作报酬与业务量挂钩,且不同业务量提成比例不一样(递增),设 S1、 S2为二个指标临界点 工资模型为: 作 OLS得到参数估计值后, 三个 阶段的报酬回归模型为: