1、 计量经济学 理论和应用张红霞Zhanghx_ 关于定性变量的建模n 定性变量作为解释变量 虚拟变量模型n 定性变量作为被解释变量 离散选择模型虚拟变量模型n 虚拟变量的基本含义n 虚拟变量的引入n 虚拟变量的设置原则虚拟变量的基本含义n 许多经济变量是 可以定量度量 的, 如 : 商品需求量、价格、收入、产量等n 但也有一些影响经济变量的因素 无法定量度量 ,如 : 职业、性别对收入的影响,战争、自然灾害对 GDP的影响,季节对某些产品(如冷饮)销售的影响等等。n 为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们 “量化 ”,这种 “量化 ”通常是通过引入 “虚拟变量 ”来完
2、成的。根据这些因素的属性类型,构造只取 “0”或 “1”的人工变量,通常称为 虚拟变量 ( dummy variables),记为 D。n 例如, 反映文程度的虚拟变量可取为 :1, 本科学历D=0, 非本科学历一般地,在虚拟变量的设置中: 基础类型、肯定类型取值为 1; 比较类型,否定类型取值为 0。虚拟变量的基本含义概念:同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型 。一个以性别为虚拟变量考察企业职工薪金的模型:其中: Yi为企业职工的薪金, Xi为工龄,Di=1,若是男性, Di=0,若是女性。虚拟变量的基本含义n 虚拟变量做为解释变量引入模型有两种基本方式: 加法方式 和 乘法
3、方式 。企业男职工的平均薪金为:上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。在该模型中,如果仍假定 E(i)=0,则企业女职工的平均薪金为:1、加法方式虚拟变量的引入几何意义:n 假定 20,则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差 2。n 可以通过传统的回归检验,对 2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。02虚拟变量的引入例:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。教育水平考虑三个层次:高中以下,高中,大学及其以上 模型可设定如下:这时需要引入两个虚拟变量:虚拟变量的引入在 E(i)=0 的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:n 高中以下:n 高中:n 大学及其以上: 假定 32,其几何意义:虚拟变量的引入