1、计量经济学及应用5.模型专题内容提要虚 拟变 量离散 选择 模型滞后 变 量回 归 模型非 线 性回 归 模型面板数据回 归 模型虚拟变量 许多经济变量是 可以定量度量 的, 如: 商品需求量、价格、收入、产量 等。但 也有一些影响经济变量的因素 无法定量度量 , 如: 职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。 为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们 “量化 ”,这种 “量化 ”通常是通过引入 “虚拟变量 ”来完成的。根据这些因素的属性类型,构造只取 “0”或“1”的人工变量,通常称为 虚拟变量 ( dummy v
2、ariables),记为 D。 例如,反映文程度的虚拟变量可取为:1, 本科学历D=0, 非本科学历 一般地,在虚拟变量的设置中: 基础类型、肯定类型取值为 1; 比较类型,否定类型取值为 0。虚拟变量的引入 虚拟变量做为解释变量引入模型有两种基本方式: 加法方式 和 乘法方式 。 1、加法 方式 一个以性别为虚拟变量考察企业职工薪金的模型 : 其中: Yi为企业职工的薪金, Xi为工龄 , Di=1,若是男性, Di=0,若是女性 。 在该模型中, 如果假定 E(i)=0,则 企业 女职工的平均薪金为: 企业男职工的平均薪金为:虚拟变量的引入 假定 20,则两个函数有相同的斜率,但有不同的截
3、距。意即,男女职工平均薪金对教龄的变化率是一样的,但两者的平均薪金水平相差 2。 可以通过传统的回归检验,对 2的统计显著性进行检验,以判断 企业男女职工的平均薪金水平是否有显著差异。 2、乘法方式 加法方式引入虚拟变量,考察: 截距的不同 ,许多 情况下:往往是斜率就有变化, 或斜率、截距同时发生变化 。 斜率的变化可通过以乘法的方式引入虚拟变量来测度 。 例 : 根据消费理论,消费水平 C主要取决于收入水平 Y,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。虚拟变量的引入 这里
4、,虚拟变量 D以与 X相乘的方式引入了模型中,从而可用来考察消费倾向的变化。 假定 E(i)= 0, 上述模型所表示的函数可化为: 正常年份 : 反常年份 : 当截距与斜率发生变化时,则需要 同时引入 加法与乘法形式的虚拟变量 。虚拟变量的引入 3、临界指标的虚拟变量的 引入在经济发生转折时期,可通过建立临界指标的虚拟变量模型来反映。例如, 进口消费品数量 Y主要取决于国民收入 X的多少,中国在改革开放前后, Y对 X的回归关系明显不同 。这时 ,可以 t*=1979年为转折期,以 1979年的国民收入 Xt*为临界值,设如下虚拟变量 :则两时期进口消费品函数分别为 :当 tt*=1979年当
5、 tt*=1979年虚拟变量的设置原则虚拟变量的个数须按以下原则确定:每一定性变量所需的虚拟变量个数要比该定性变量的类别数少 1,即如果有 m个定性变量,只在模型中引入 m-1个虚拟变量。例 。 已知冷饮的销售量 Y除受 k种定量变量 Xk的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只需引入三个虚拟变量即可 :引入过多虚拟变量会产生虚拟变量陷阱,产生多重共线性问题。离散选择模型 (discrete choice models)以虚拟变量为 被解释变量 的模型被称之为离散选择模型 。 也 被称为 定性 选择模型 (Qualitative choice models)或 定性响
6、应模型 ( Qualitative response models)如果只有两个选择,我们可用 0和 1 分别表示它们,如乘公交为 0,自驾车为 1,这样的模型称为 二元选择模型 ( binary choice Models)。多于两个选择(如上班方式加上一种骑自车)的定性选择模型称为 多项选择模型 (Multinomial choice models)。国内 常用的离散选择模型有 Logit模型、 Probit模型。2000 年度诺贝尔经济学奖获得者詹姆斯 赫克曼 (J ames Heckman) 教授和丹尼尔麦克法登 (Daniel McFadden) 教授 , 其微观经济计量的成果的主要工具就是离散选择模型。在 前文讨论的定量响应回归模型中,我们的目标是通过给定回归元的值来估计回归子的期望值或均值 ,在 Y为定性的模型中,我们的目标是估计 Y为某个特定值的概率例如: 拥有一所房子的概率;家庭中一个人工作的概率因此 ,这类模型通常也被 称为 概率模型 ( Probability Model) ,比较常见 的是线性概率模型。