1、2.1 一元线性回归模型有哪些基本假定?答:1. 解释变量 是非随机变量,观测值 是常数。1x,2,p ,1ix,2 ip2. 等方差及不相关的假定条件为jinjiEjii,0),21,(,),cov(,2这个条件称为高斯-马尔柯夫(Gauss-Markov)条件,简称 G-M 条件。在此条件下,便可以得到关于回归系数的最小二乘估计及误差项方差 估计的一些2重要性质,如回归系数的最小二乘估计是回归系数的最小方差线性无偏估计等。3. 正态分布的假定条件为相 互 独 立ni niN,21)0(21 在此条件下便可得到关于回归系数的最小二乘估计及 估计的进一步结果,2如它们分别是回归系数的最及 的最
2、小方差无偏估计等,并且可以作回归的显2著性检验及区间估计。4. 通常为了便于数学上的处理,还要求 及样本容量的个数要多于,pn解释变量的个数。在整个回归分析中,线性回归的统计模型最为重要。一方面是因为线性回归的应用最广泛;另一方面是只有在回归模型为线性的假设下,才能的到比较深入和一般的结果;再就是有许多非线性的回归模型可以通过适当的转化变为线性回归问题进行处理。因此,线性回归模型的理论和应用是本书研究的重点。1. 如何根据样本 求出 及方差),21)(;,(21 niyxipi p,210的估计;22. 对回归方程及回归系数的种种假设进行检验;3. 如何根据回归方程进行预测和控制,以及如何进行
3、实际问题的结构分析。2.2 考虑过原点的线性回归模型误差 仍满足基本假定。求 的最小二nixyii ,21,1n,21 1乘估计。答: ni niiii xyEyQ11212)()()( ni niniiii xyxyQ111211 2)(2令 即,01ninii1120解得 即 的最小二乘估计为,12niiixy1.12niiixy2.3 证明: Q ( , )= ( - - )2 01i01i因为 Q ( , )=min Q ( , )101而 Q ( , ) 非负且在 上可导,当 Q 取得最小值时,有0R2即-2( - - )=0 -2( - - ) =0yi1xi yi01xii又 =
4、 -( + )= - - =0, =0eii0ii01ieii(即残差的期望为 0,残差以变量 x 的加权平均值为零)2.4 解:参数 0,1 的最小二乘估计与最大似然估计在 iN(0, 2 ) i=1,2,n 的条件下等价。证明:因为 niNi ,.21),0(所以 ),(210XYNii 其最大似然函数为已知使得 Ln(L)最大的 , 就是 , 的最大似然估计值。 0101即使得下式最小 : niiini XYYQ121021 )()(因为恰好就是最小二乘估计的目标函数相同。所以,在 的条件下, 参数 0,1 的最小niNi ,.),0(2二乘估计与最大似然估计等价。),(2exp)2()
5、,( 20112/1210 iininini XYYf 20),(l iiin 010Q2.5.证明 是 的无偏估计。0证明:若要证明 是 的无偏估计,则只需证明 E( )= 。00因为 , 的最小二乘估计为 其中01xyL101/2222 )()( iiiix iiiiiiy xnxnxL yyyE( )=E( )=E( )=E 0y1iixi yLy11 ni ixiyL1)(=E ni iixiL110)(=E( )+E( )+E( )nixi10)(ni ixiL11)(ni ixiL1(其中= =nixiL10)(nixi1)( )(10niix由于 =0,所以 =nii1)(nix
6、iL10)(= =ni ixiL11)(ni ixii1)( )(11niiixxL= )= =0)-(11niiixL)(1又因为一元线性回归模型为 ),0(20 Nxyi ii独 立 同 分 布 , 其 分 布 为各所以 E( )=0 所以iE( )+E( )+E( nixiL10)(ni ixiL11)(ni ixiL1)(= )0(Eni ixiEL1)(= 0所以 是 的无偏估计。02.6 解:因为 , , niiy1 xy10 yLxinii1联立 式,得到 。Linixi10)()()(10 yinixiVarr)(2yiVarxi2122 (ni xinLxi因为 , ,所以n
7、ixL12)0)(1nii2121210 )()( Lxniinini xVar 2(Lxn212)(ni2.7 证明平方和分解公式:SST=SSE+SSR证明:2.8 验证三种检验的关系,即验证: niiinii yyyST1212 ()niiii iiii 12)SERyyniiinii1212)(1) ;(2))(rnt 21)2/(tLnSERFx证明:(1)因为 ,所以-SRx和 STERnSERnSEtLxx )()( 2222 又因为 ,所以TRr2 Tr21故 得证。21)(rnt(2) 22 220111111()()()()nnn ni i i i xi i i iSRyx
8、yxyxL22/()xLFtEn:2.9 验证(2.63)式:2xi -ein1var)(证明: ),()()()()(yyiiiiii cov2-varvar-varr)x-xyi1ii10i (,()()( LLxin)()(22x22in12x-i1其中: xycovi1i,-covi1ii , n1i ixiin1iii yxy-cov-cov L,22n1Lxi2n1xi注:各个因变量 是独立的随机变量yn.21,),cov()var()var()var( YXYXYX22.10 用第 9 题证明 是 的无偏估计量2-nie2证明: 1i2 yi-EEn1i2ei-nii12-var
9、2n1i xL-i-2-n12注: )()()varXEX22.11 验证2nF证明:所以有)2(*)2(nSERnS FnSRE)2(2)2(112 nnSTr以上表达式说明 r 与 F 等价,但我们要分别引入这两个统计量,而不是只引入其中一个。理由如下:r 与 F,n 都有关,且当 n 较小时,r 较大,尤其当 n 趋向于 2 时,|r|趋向于 1,说明 x 与 y 的相关程度很高;但当 n 趋向于 2 或等于 2 时,可能回归方程并不能通过 F 的显著性检验,即可能 x 与 y 都不存在显著的线性关系。所以,仅凭 r 较大并不能断定 x 与 y 之间有密切的相关关系,只有当样本量 n较大
10、时才可以用样本相关系数 r 判定两变量间的相关程度的强弱。 F 检验检验是否存在显著的线性关系,相关系数的显著性检验是判断回归直线与回归模型拟合的优劣,只有二者结合起来,才可以更好的回归结果的好坏。2.12 如果把自变量观测值都乘以 2,回归参数的最小二乘法估计 和 会发生01什么变化?如果把自变量观测值都加上 2,回归参数的最小二乘估计 和 会发生什么变化?解: 解法(一):我们知道当 , 时,用最小二乘法01iiyx01()iEyx估计的 和 分别为 当 时01 2iix有 将 带入得到当 时 2iix有 将带入得到解法(二):当 , 时,有01iiyx01()iEyx2201 01i 1
11、()=()()nniiiiiQyEyx,当 时 2iix01i ii ix01(2iiEyx2 201 10101i 1 1()=()()()nn niiiiiiii iyyx ,当 , ,2iix0 12ii iix011iiEyx由2 2201 10101i 1 1()=()()()nn niii i iii iQyEyx ,最小二乘法可知,离差平方和 时,其估计值01010)=(QQ, , ,应当有 。即回归参数的最小二乘估计 和 在自变量观测值变化时不会变。012.13 如果回归方程 相应的相关系数 r 很大,则用它预测时,预测误差一定较小。这一结论能成立吗?对你的回答说明理由。解:这
12、一结论不成立。因为相关系数 r 表示 x 与 线性关系的密切程度,而它接近 1 的程度与数据组数有关。n 越小,r 越接近 1。n=2 时,|r|=1。因此仅凭相关系数说明 x 与 有密切关系是不正确的。只有在样本量较大时,用相关系y数 r 判定两变量之间的相关程度才可以信服,这样预测的误差才会较小。2.14 解:(1)散点图为:(2)x 与 y 大致在一条直线上,所以 x 与 y 大致呈线性关系。(3)得到计算表:所以回归方程为:(4) =22ni=1()-iy310SE所以,306.(5)因为 , 的置信区间为 ;2001()(,xNnL:0t202)1(Lxn同理,因为 ,所以, 的置信
13、区间为 。211(,)x:1tx21查表知, 所以, 的置信区间为(-21.21,19.21) , 的置信区间为( 0.91,13.09) 。0 1(6)决定系数 X Y 2)(Xi2)(Yi )(YXiii2)(Yi2)(ii1 10 4 100 20 6 (-14)2(-4)22 10 1 100 10 13 (-7)2 (3)23 20 0 0 0 20 0 04 20 1 0 0 27 72 725 40 4 400 40 34 142 (-6)2和15100 和Lxx=10Lyy=600和 Lxy=70 和100SSR=490 SSE=110均3均20均 20.1732,710 101 XYLxy 08.3)()(025.2/ tnt 7.06492yLSRT