1、1、 已知回归模型: ,为起始薪金(元),为受教育水平(年),为随机干扰分布未知: 、的含义 是否满足线性、无偏、有效? 是否可对作 t 检验? 若 E 的单位为 100元,各变量有什么变化? 解: 表示没有接受过教育的员工的平均起始薪金 ;表示每单位 N 变化所引起的 E 的变化,即每多接受一年教育所对应的薪金的增加值。 满足线性、无偏、有效性,因为这些性质的成立无需随机干扰项的正态分布假设。 ( 3)如果的分布未知,则所有的假设检验都是无效的。因为 t 检验与 F检验是建立在的正态分布的基础上的。 设表示以百元为度量单位的薪金, =+ 所以,估计的截距项与斜率项均为原回归系数的1/100
2、2、下面是根据 10组数据的 X 和 Y 的观察值得到的数据: ; ; 假定满足所有的古典线性回归模型的假设,要求: ( 1)和的估计值及其标准差? ( 2) R2的值 ( 3)对和分别建立 95%的置信区间?利用置信区间法,你可以接受零假设:吗? 解: ( 1)因为 n=10 且 所以 0.5344 =21.22 若要求标准差,则需首先求出随机干扰项方差的估计: =77.60 故 22 1 ixS =0.0484 222 0 ii xnXS 8.5913 (2) 22 )( iii YYe =620.81 2)( YYi =10090 故 TSSRSSTSSESSR 12 =0.9365 (
3、 3)对自由度为 8 的分布,在 5%的显著性水平下的临界值 2212220)()(iiiiiiiiiiiiiXXnXYXYnXXnXYXYX222nei为 t0。 025( 8) =2.306,故 0 、1的 95%的置信区间分别为 (02 0 st ,02 0 st ) =( 1.4085 ,41.0315) ),( 122 111 stst =( 0.4228 ,0.6460) 由于 1=0不在 1的置信区间内,故拒绝原假设: 1=0 2、 最小二乘法是指( D)最小 : A、 B、 ii YY C、 max ii YY D、 2)( ii YY 4、 Blue是指( ABC) A、 无
4、偏 B、有效 C、线性 D、一致 5、回归方程 ,通常假定 i 服从( C) A、 N(0, B、 t(n-2) C、 N( 0,) D、 t(n) 6、 R2 的范围是 0, 1 1.若要能得到 k 个参数估计量,所要求的最小的样本容量为( ) iii XY 10A.n k B.n k+1 C.n 30 D.n 3(k+1) 答案: A 分析:题中说的是 k 个参数估计量,而不是解释变量,若题干说有 k个解释变量,那么应该选择 B,因为还要加上 0 。 2.当 R2=1 时, F=( ) A.F=1 B.F=-1 C.F + D.F=0 答案: C 3.n=30,在一个包含 3个变量的线性回
5、归中 R2=0.85,则 2R = 答案: 0.833 解 : 22 1 3 0 11 ( 1 ) 1 ( 1 0 . 8 5 ) 0 . 8 3 31 3 0 3 1nRR nk 4.Biddle and Hameresh (1990)研究工作与休息之间关系, sleep 代表休息, work代表工作, edu 代表教育年限, age 代表年龄, 0 1 2 3s le e p w o r k e d u a g e 706 个样本回归得到:(括号为 回归样本标准差) , sleep=3638.25-0.148work-11.13edu+2.20age (112.3) (0.02) (5.8
6、8) (1.45) R2=0.11, SE2=419.4。 (1)求 2R , F,标准差 Std (2)给定 5%的检验水平,检验 3 是否显著,如果是 10%的显著水平呢?( t0.025(702)=1.65, t0.05(702)=1.28) 解 : (1) RSS=SE2 (n-k-1)=419.4 (706-3-1)=294418.8 TSS=RSS/(1- R2)=330807.6404 则: 1TSSStd n =21.6617 22 11 (1 ) 0 . 1 0 61nRR nk 22 / 2 8 . 9 2(1 ) / ( 1 )RkF R n k (2) 33 2 .2
7、0 1 .5 21 .4 5t S t0.05(702)=1.28 1.52 t0.025(702)=1.65 5%的检测水平不能拒绝原假设, 不显著 10%的检测水平应拒绝原假设, 显著 1.容易产生异方差的数据( ) A.时序列数据 B.虚变量数据 C 横截面数据 D.年度数据 答案: C 2.如果存在 异方差 ,则模型参数的 普通最小二乘法 估计量( ) A.无偏、有效估计量 B.无偏、非有效估计量 C.有偏、有效估计量 D.有偏、非有效估计量 答案: B 3.当出现异方差时,估计方法可用( ) A.加权最小二乘法 B.工具变量法 C.广义差分 D.贝叶斯估计 答案: A 4.戈里瑟 检
8、验表明 OLS回归得到 0.457i i ie X v则 加权最小二乘估计权数 为( ) A. iX B.21iXC.1iXD. 1iX答案: D 5.用 G-Q检验存在异方差 0 1 1 2 2 3 3i i i i iY X X X ,标本容量为 40, 按 iX 由大到小排序后,去掉 10 个样本,并对余下的样本 iX 按大小分为 2组,作回归得到残差 RSS1=0.36, RSS2=0.0466。写出检验步骤。( F0.05(11, 11)=2.82) 解:提出假设 :H0: i 具有同方差 H1: i 具有递增型异方差 计算 F 统计量: 211 0. 46 62 111. 29 4
9、40. 361 112TCRS S KF TCRS S K 显然 1.2944 F0.05(11, 11)=2.82 无法拒绝原假设,即 i 具有同方差。 1.D.W.统计量可用来检验( ),其中 为 0, 均值、方差均为常数且无序列相关。 A. 1t t t B. 1 1 2 2t t t t C. tt D. 2 1t t t 答案: A 分析: D.W.检验只适用于一阶自相关。 2.随即干扰项 t 具有一阶自回归形式: 1t t t ,其中 0tE , 2tVar ,则 t 的方差 tVar ( ) A. 221 B. 221 C.21D. 2221答案: A 3.研究劳动力在制造业中所
10、占比率变化趋势,据 1949-1964 年度数据得如下方程:A.Yt=0.4579-0.0041t R2=0.5484 DW=0.8052 B.Yt=0.4786-0.00127t R2=0.6692 DW=1.82 Y代表劳动比率, t 代表时间。 从 DW判断是否存在自相关 ?( 0.05 ) 解: A:由题可知: n=1964-1949+1=16 k=1 查表(书 P391)可知 dL=1.10,dU=1.37 显然, 0 DW=0.8052 dL=1.10 存在自相关。 B:由题可知: n=1964-1949+1=16 k=2 查表(书 P391)可知 dL=0.98,dU=1.54
11、显然, dU=1.54 DW=1.82 4-dU=2.46 无自相关。 分析: 4.采用 一阶差分 模型,克服 一阶线性相关 问题适用于 序列相关 =( ) A. 0 B. 1 C.-1 0 D.0 1 答案: B 正自相关 不确定 不确定 负自相关 1.存在 随机解释变量 问题, OLS 估计量 ( ) A.无偏、一致 B.无偏、不一致 C.有偏、但一致 D.有偏、不一致 答案: D 分析:通常我们讨论的都是 小样本问题 2.对 0 1 1 2 2 3 1t t t t tY X X Y ,假设 1tY 与 相关 ,为消除相关性,采用工 具 变 量 法 , 先 用 tY 关于 1tX 与 2
12、tX 回归得到 tY , 然 后 在 做0 1 1 2 2 3 1t t t t tY X X Y 回归,问:是否可以消除原模型中 1tY 与 t 的相关性? 答: 可以消除 ,因 为 1tX 、 2tX 与 t 无 关,用 tY 关于 1tX 与 2tX 回归得到的也与 ttY 无关, 从而估计的 1tY 与 t 无关。 3.在 线性回归 中,若 1X 与 2X 存在 21X kX ,k 为非零常数,则模型存在( ) A.异方差 B,多重共线性 C,序列相关 D,设定误差 答案: B 4.若检验方程 F统计量 显著,而 t统计量 不显著,则认为出现了多重共线性。( ) 答案: 5.若模型存在
13、近似的 多重共线性 ,则最小二乘估计量是 无偏、非有效的 。( ) 答案: 6.存在多重共线性时,模型无法估计。( ) 答案: 分析:只有在 完全 多重共线性时,模型才无法估计 1.对于 一元回归模型 *01t t tYX ,假设 解释变量 *tX 的 实测值 有偏误*t t tX X e,其中 te 是 0均值,无序列相关且 *tX 及 t 不相关。 (1)可否把 *t t tX X e代入原模型,使之变为 01t t tYX 后进行估计? t 为变换后的干扰项 (2)进一步假设 t 与 te 之间,以及它们之间无异期相关,则 1 0ttEX 成立吗?tX 与 1tX 相关? (3)从 (2
14、)看,用什么工具变量变换后的模型进行估计? 解: (1)由题可知: 0 1 0 1 1t t t t t t tY X e X e 0 1 1t t tXe 又 *t t tX X e tX 与 te 存在相关性 不能把 *t t tX X e代入原模型,使之变为 01t t tYX 后进行估计。 (2) *1 1 1t t t t t tE X E X e e *1 1 1 1 1 1 0t t t t t t t tE X X e e e e 成立且 tX 与 1tX 相关 (3)从 (2)看, 用 1tX 作为工具变量变换后的模型进行估计。 2012 年 11 月 21 日 如果模型中遗
15、漏了重要的 解释变量 ,且 被遗漏变量 与包含的 解释变量相关 ,则用最小二乘法得到的估计量( ) A.有偏,非一致 B.无偏,一致 C.有偏,一致 D.无偏,非一致 答案: A 解析:本题实质是 出现了随机变量问题 2012 年 11 月 23 日 一个由 209 个样本估计解释 CEO 薪水的方程1 2 1 2 3l n 4 . 5 9 0 . 2 5 7 l n 0 . 0 1 1 l n 0 . 1 5 8 0 . 1 8 1 0 . 2 8 3Y X X D D D (15.3) (8.03) (2.75) (1.775) (0.181) (-2.895) 其中 Y 为年薪水平(单位
16、万元), 1X 表示公司年收入(单位万元), 2X 表示公司股票收益(万元), 1 2 3,D D D 分别为金融业、消费品工业和公用事业。假 设对比产业为交通运输业。 (1) 解释 3 个 虚拟变量 的经济含义 (2) 保持 1X 、 2X 不变,计算公用事业和交通运输业之间薪水近似 百分比差异 (3) 消费凭工业与金融业之间估计薪水的 近似百分比 多少?写出可直接验证这个差异是否 显著的方程 。 解: (1) 1D :当 1X 、 2X 保持不变时, 金融业和交通运输业 CEO 年薪水平相差 0.158个单位; 2D :当 1X 、 2X 保持不变时,消费品工业和交通运输业 CEO 年薪水
17、平 相差 0.181个单位; 3D :当 1X 、 2X 保持不变时,消费品工业和交通运输业 CEO 年薪水平相差 0.181个单位; (2)由题有 0 .0 1/ 2 (2 0 9 6 ) 1 .9 6t 又 2.895t 0 .0 1/ 2 (2 0 9 6 ) 1 .9 6t 3D 显著 (3)0.181-0.158=0.123 方程: 0 1 1 2 2 1 2 2 3 3l n l nY X X D D t r a n s (当 1 2 3,D D D 均为零时,为金融业) 1、某商品的需求函数 Yi=0+ 1Xi+Ui , Yi为需求量, X 为价格,为了考虑地区(农村、城市),和季节(春、夏、秋、冬)两个因素的影响,加入 虚拟变量,则引入虚拟变量个数( ) A、 2 B、 4 C、 5 D、 6 2、虚拟变量 系数显著性水平检验 与其他 变量检验 是一样的。( ) 3、如果一个 回归模型 中 不 包括 截距项 ,对 m个 特征因素 做虚拟变量引入,引入个数为 m 1