1、习题7.1 解释概念(1)分类变量 (2)定量变量 (3)虚拟变量 ( 4)虚拟变量陷阱 (5)交互项 (6)结构不稳定 (7)经季节调整后的时间序列答:(1)分类变量:在回归模型中,我们对具有某种特征或条件的情形赋值 1,不具有某种特征或条件的情形赋值 0,这样便定义了一个变量 :D,0D具 有 某 种 特 征不 具 有 某 种 特 征我们称这样的变量为分类变量。(2)具有数值特征的变量,如工资、工作年数、受教育年数等,这些变量就称为定量变量。(3)在回归模型中,我们对具有某种特征或条件的情形赋值 1,不具有某种特征或条件的情形赋值 0,这样便定义了一个变量 :D1,D具 有 某 种 特 征
2、不 具 有 某 种 特 征我们称这样的变量为虚拟变量(dummy variable) 。(4)虚拟变量陷阱是指回归方程包含了所有类别(特征)对应的虚拟变量以及截距项,从而导致了完全共线性问题。(5)交互项是指虚拟变量与定量变量相乘,或者两个定量变量相乘或是两个虚拟变量相乘,甚至更复杂的形式。比如模型: 12345i iiiiihouseldlwagefmlearedfmalerdu就是交互项。fmar(6)如果利用不同的样本数据估计同一形式的计量模型,可能会得到 、 不同的估计12结果。如果估计的参数之间存在着显著性差异,就称为模型结构不稳定。(7)一些重要的经济时间序列,如果是受到季节性因素
3、影响的数据,利用季节虚拟变量或者其他方法将其中的季节成分去除,这一过程被称为经季节调整的时间序列。7.2 如果你有连续几年的月度数据,为检验以下假设,需要引入多少个虚拟变量?如何设定这些虚拟变量?(1)一年中的每一个月份都表现出受季节因素影响;(2)只有 2、7、8 月表现出受季节因素影响。答:(1)对于一年中的每个月份都受季节因素影响这一假设,需要引入三个虚拟变量。分别定义 、 、 如下:2D342,0如 果 为 夏 季如 果 不 为 夏 季 31,0如 果 为 秋 季如 果 不 为 秋 季 41,0D如 果 为 冬 季如 果 不 为 冬 季(2)如果只有 2、7、8 月表现出受季节因素影响
4、,则只需要引入一个虚拟变量。定义如下:D21,0如 果 受 季 节 因 素 影 响如 果 不 受 季 节 因 素 影 响7.3 一个家庭的消费支出除了受收入水平的影响之外,还与子女的年龄结构密切相关。如果家庭中有学龄子女,大笔开支会用在教育费用上。分析家庭的收入水平对消费支出的影响,并引入适当的虚拟变量,检验家庭中有学龄子女对家庭的消费支出是否产生了影响。分别考虑只影响截距;只影响斜率;二者都有影响的情形。答:设当不考虑学龄时消费支出和收入水平的模型为: 12incomeageu引入虚拟变量 ,10A, 有 学 龄 子 女, 无 学 龄 子 女当只影响截距时,模型为: 1231incomeag
5、eu当只影响斜率时,模型为: 1231i A如果既影响截距又影响斜率时,模型设定为: 123141+ageincomeage7.4 使用夏季作为参照季节,对例 7.5 重新进行分析。答:我们选择夏季为参照季节,分别定义 、 、 如下:1D341,0D如 果 为 春 季如 果 不 为 春 季 3,0如 果 为 秋 季如 果 不 为 秋 季 1,0如 果 为 冬 季如 果 不 为 冬 季设定模型为12314354t ttttsaleincomeDu其中夏季销售量方程的截距项为 。回归结果为: 13429.405.60.8. (23) (.1) (4) () 5 0.973t ttttsleiceD
6、R 从回归结果中可以看出,如果个人可支配收入不变,第一季度的平均销售量比第二季度多5.64,而且具有统计显著性,第三季度的平均销售量比第二季度少 0.008,而且不具有统计显著性,第四季度的平均销售量比第一季度的多 5.28,而且具有统计显著性。可以看出气温影响了滑雪器具的销售,一季度、四季度的销售方程没有明显差别,这两个季度都是寒冷的季节,是滑雪器具销售的旺季。二季度、三季度较为温暖,是滑雪器具销售的淡季,销售量明显少于一、四季度。7.5 我们不再定义三个虚拟变量而是只区别旺季和淡季,重新对例 7.5 进行估计。答:如果只区分淡季和旺季,则只需要添加一个虚拟变量,定义虚拟变量: 1,0S如
7、果 为 旺 季如 果 不 为 淡 季设定模型为: 1231t ttsaleincomeSu估计回归模型可得:129.5405.46(7) 32.) (9) 0.7t tsliR从显著性可以看出虚拟变量的系数是显著的,说明平均销售量和季节是有关系的。7.6 假设 为某年美国汽油的消费量,解释变量为价格(price )和收入(income) 。Y19702000 年间有三段时间汽油价格急剧上涨,导致了汽油消费行为模式的改变。第 1 阶段开始于 1974 年,在 OPEC(石油输出国组织)决定控制世界石油价格之后;第 2 阶段开始于 1979 年,在伊朗发生革命后不久;最一个阶段发生在 1990 年
8、,正值伊朗入侵科威特。我们有理由认为石油消费的价格弹性和收入弹性在这些阶段是不同的。设基本模型为 123lnlnlni i iYprcecomeu(1)如果各阶段的截距都相同,描述如何构建模型来检验不同的阶段石油消费行为是否发生了结构变化。(2)如果收入弹性在三个阶段都不变,描述如何构建模型来检验不同的阶段石油消费行为是否发生了结构变化。(3)如果三个阶段石油消费函数的截距项、石油消费的价格弹性和收入弹性可能都发生了变化,描述如何对其进行检验。答:(1)引入虚拟变量:,10D, 第 二 阶 段, 其 他 21D, 第 三 阶 段0, 其 他构建模型: 1234152lnlnlni i i iY
9、prcecomeDu(2)构建模型: 1234152llllnlni i i i ircececomecomeu(3)构建模型: 12341526172892lnlnlnlnlni i i ii i iYprcecomeDceDomDprprcu计算机习题7.7 DATA7-5 给出了未经季节调整的饰品、玩具和游戏的零售季度数据(1992 年第一季度2008 年第二季度):考虑下面的模型:。 1234tttttsaleBDBu其中,D 2=1:第二季度, 0:其他;D 3=1:第三季度,0:其他;D 4=1:第四季度,0:其他;(1)估计上述回归。Comment A1: 根据书中内容,原理上应
10、该是第一个模型比较好,可是事实上却是这个模型好,有点高步明白。(2)解释各个系数的含义。(3)给出回归结果符合逻辑的解释。(4)如何利用估计的回归结果消除季节模式? 答:(1)回归模型得:2342930.415867.18.() . (09) 6) 0.913t tttsaleDDR(2) 表示的是第一季度的零售额, 表示的是第二季度相比较第一季度的零售额增1B2B加量, 表示的是第三季度相比较于第一季度的零售额增加量, 表示的是第四季度相3 4B比较于第一季度的零售额增加量。(3)从回归结果中可以看出,第一季度的零售额是 930.41,具有统计显著性,第二季度比第一季度增加 58.67,但是
11、显著性水平不高,第三季度比第一季度增加 57.61,显著性水平也不高,第四季度比第一季度增加 1338.11且具有统计显著性。由此可以看出,在第一、四季度上对销售额的影响是比较大的。这说明在第一和第四季度是这些商品的旺季,第二、三季度是销售的淡季。这主要是因为在第一和第四季度上有像圣诞节这样的大型节日,促使了这些商品的消费。(4)利用回归结果可知,残差项和自变量是不相关的,则利用上述模型即可将季节成分去除。7.8 利用上题数据,估计下面的模型: 1234tttttsaleBDBDu在这个模型中,每个季度都赋予一个虚拟变量。(1)这个模型与上题的模型有何区别?(2)估计这个模型,是否需要加上截距
12、项?(3)比较本题与上题的回归结果,你决定选择哪个模型?为什么?答:(1)从模型中可以看到,这个模型中增加了一项 ,也就是说将第一季度也做为1tBD虚拟变量加入到了模型中。(2)估计该模型时不需要加加上截距项。(3)估计该模型可得:12342930.489.08.268.5610.tttt tsaleDDR从回归结果中可以看出,该模型的统计量都是显著的,而且拟合优度和上题中的一致。可以看出该模型比上题中的模型要好。7.9 DATA7-6 给出了 46 个中产阶级个人收入及其他相关信息的数据,自变量包括:Experience工作年限;Management1,经理;0,非经理;Education1
13、,高中;2,大学;3,研究生。(1)直接利用表中受教育程度的数据进行回归分析合适吗?会导致什么样的问题?(2)利用 Experience、Management 以及重新设定后的受教育程度变量进行线性回归。所有变量是统计显著的吗?(3)建立一个新的模型,考虑经理人和非经理人因工作经历差异可能导致的收入增量差异。写出回归结果。(4)建立一个新的模型,考虑经理人和非经理人由于教育水平的差异可能导致的收入增量差异。写出回归结果。答:(1)不合适。如果这样估计的话会导致回归结果不准确,致使不能正确估计模型。(2)引入虚拟变量:,10D, 大 学, 其 他 21=0, 研 究 生, 其 他设定模型: 12
14、34152salryExperincmagerntDu估计方程得: 122slr8305.4.6678.387.60.5 (1) (1) (192) (49) () .9riagermntDtR 由此可以看出,每个系数的估计值都是显著的。Comment A2: 显示是奇异矩阵(3)建立模型: 123 4156expexp salryrincmagntricDDtu估计模型得:slr=87.3+4.6251.975.2exp (1) (2) (0) (104).6.7 ri tmangtrinctt 0 5 .R(4)建立模型:123142567expmanget +salryrincDmagt
15、tu估计模型得: 293.50.e0.183.490.manget (28) (1) (3.) (57) ()+7.42slryricDtDangtmange (5) (.16) 0.9tt R7.10 DATA7-7是美国 1995年 3月当期人口调查的数据,抽取了 1865岁年龄段的 1289名工人,具体信息如下:Wage小时工资(美元)Age年龄;Female1,女工;Nonwhite1,非白人;Union1,工会会员Education受教育年限;Experience工作年限。(1)根据这些数据,估计下面的模型,写出回归结果: 1234567lni iWageBAFemalBNonwhi
16、teUiBEducationxpercu其中,lnWage 表示 Wage的自然对数。(2)如何解释每个回归系数?(3) 的水平下,哪些系数是显著的?0.5a=(4)平均而言,工会会员的工资相对较高吗?为什么?(5)平均而言男工比女工的工资高吗?为什么?(6)女工会员的工资比女非工会会员的工资高吗?为什么? 答:(1) Source | SS df MS Number of obs = 1289-+- F( 5, 1283) = 135.55Model | 153.064774 5 30.6129548 Prob F = 0.0000Residual | 289.766303 1283 .22
17、5850587 R-squared = 0.3457-+- Adj R-squared = 0.3431Total | 442.831077 1288 .343812948 Root MSE = .47524-lnwage | Coef. Std. Err. t P|t| 95% Conf. Interval-+-age | 0 (omitted)female | -.249154 .026625 -9.36 0.000 -.3013874 -.1969207nonwhite | -.1335351 .0371819 -3.59 0.000 -.2064791 -.0605911union |
18、 .1802035 .0369549 4.88 0.000 .107705 .2527021education | .0998703 .0048125 20.75 0.000 .0904291 .1093115exper | .0127601 .0011718 10.89 0.000 .0104612 .015059_cons | .9055037 .0741749 12.21 0.000 .7599863 1.051021(2)在其他变量保持不变时,如果一个员工比另一个员工大一岁,其工资将会高出 1.27%;女性的平均工资比男性少 24.9%;白人比非白人的工资水平高 13.3%;工会成员的
19、工资水平比非工会成员高出约 18%。另外,每多接受一年教育,工资水平大约会提高 8.7%。(3)所有变量的 P 值都几乎为零,因此所有的变量都是显著性的。(4)是的,工会成员的工资水平比非工会成员高出约 18%。(5)是的,女性的平均工资比男性少 24.9%。(6)生成一个 new 变量,代表女性与非白人虚拟变量交互项_cons .914532 .0744206 12.29 0.000 .7685325 1.060532new .1045248 .0739399 1.41 0.158 -.0405317 .2495813exper .0126885 .0011725 10.82 0.000 .
20、0103883 .0149886education .0998524 .0048106 20.76 0.000 .0904148 .1092899union .1820231 .0369629 4.92 0.000 .1095087 .2545375nonwhite -.1901418 .0546339 -3.48 0.001 -.2973235 -.08296female -.264925 .0288583 -9.18 0.000 -.3215398 -.2083103age 0 (omitted)lnwage Coef. Std. Err. t P|t| 95% Conf. Interval因为交互项的 p 值为 0.158,这意味着白人女性和非白人女性在工资率上没有明显的差别,但是白人的工资率和非白人之间仍然存在差距。(7)代表女性和工会的虚拟变量交互项是不显著的,这意味着工会女性和非工会女性在工资率上没有明显区别,但工会成员和非工会成员之间的工资率还是存在区别的。