1、 多元线性回归模型案例分析中国人口自然增长分析一研究目的要求中国从 1971 年开始全面开展了计划生育,使中国总和生育率很快从 1970 年的 5.8 降到 1980 年 2.24,接近世代更替水平。此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。(3)文
2、化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。二模型设定为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均 GDP”作为经济整体增长的代表;选择 “居民消费价格指数增长率”作为居民消费水平的代表。暂不考虑文化程度及人口分布的影响。从中国统计年鉴收集到以下数据(见表 1):表 1 中国人口增长率及相关数据设定的线性回归模型为:12234ttttYXu三、估计参数利用 EViews 估计模型的参数,方法是:1、建立工作文件:启动
3、EViews,点击 FileNewWorkfile,在对话框“Workfile Range”。在“Workfile frequency”中选择“Annual” (年度),并在 “Start date”中输入开始时间“1988” ,在“end date”中输入最后时间“2005” ,点击 “ok”,出现“Workfile UNTITLED”工作框。其中已有变量:“c”截距项 “resid”剩余项。在“Objects” 菜单中点击“New Objects”,在“New Objects”对话框中选 “Group”,并在“Name for Objects”上定义文件年份 人口自然增长率 (%。 ) 国
4、民总收入 (亿元) 居民消费价格指数增长 率(CPI)% 人均GDP(元)1988 15.73 15037 18.8 13661989 15.04 17001 18 15191990 14.39 18718 3.1 16441991 12.98 21826 3.4 18931992 11.6 26937 6.4 23111993 11.45 35260 14.7 29981994 11.21 48108 24.1 40441995 10.55 59811 17.1 50461996 10.42 70142 8.3 58461997 10.06 78061 2.8 64201998 9.14 8
5、3024 -0.8 67961999 8.18 88479 -1.4 71592000 7.58 98000 0.4 78582001 6.95 108068 0.7 86222002 6.45 119096 -0.8 93982003 6.01 135174 1.2 105422004 5.87 159587 3.9 123362005 5.89 184089 1.8 140402006 5.38 213132 1.5 16024名,点击“OK”出现数据编辑窗口。2、输入数据:点击“Quik”下拉菜单中的“Empty Group”,出现“Group”窗口数据编辑框,点第一列与“obs”对应的
6、格,在命令栏输入“Y” ,点下行键“” ,即将该序列命名为 Y,并依此输入Y 的数据。用同样方法在对应的列命名 X2、X 3、X 4,并输入相应的数据。或者在 EViews 命令框直接键入“data Y 2 X3 X4 ”,回车出现“Group”窗口数据编辑框,在对应的 Y、X 2、X 3、X 4 下输入响应的数据。3、估计参数:点击“Procs“下拉菜单中的“Make Equation”,在出现的对话框的“Equation Specification”栏中键入“Y C X2 X3 X4”,在 “Estimation Settings”栏中选择“Least Sqares”(最小二乘法) ,点
7、“ok”,即出现回归结果:表 3.4根据表 3.4 中数据,模型估计的结果为:4320519.04798.03.6851. XXYt (0.913842) (0.000134) (0.033919) (0.001771)t= (17.08010) (2.482857) (1.412721) (-2.884953)930526.2R 915638. F=62.50441 四、模型检验1、经济意义检验模型估计结果说明,在假定其它变量不变的情况下,当年国民总收入每增长 1 亿元,人口增长率增长 0.000332%;在假定其它变量不变的情况下,当年居民消费价格指数增长率每增长 1%,人口增长率增长 0
8、.047918%;在假定其它变量不变的情况下,当年人均GDP 没增加一元,人口增长率就会降低 0.005109%。这与理论分析和经验判断相一致。2、统计检验(1)拟合优度:由表 3.4 中数据可以得到: 930526.2R ,修正的可决系数为 915638.02R,这说明模型对样本的拟合很好。(2)F 检验:针对 24:0H,给定显著性水平 .,在 F 分布表中查出自由度为 k-1=3 和 n-k=14 的临界值 34)1,(F。由表 3.4 中得到 F=62.50441 ,由于 F=62.50441 2.075,应拒绝原假设 0234:0,说明回归方程显著,即 “国民总收入” 、 “居民消费
9、价格指数增长率” 、 “人均 GDP”等变量联合起来确实对“人口自然增长率”有显著影响。(3)t 检验:分别针对 0H: (1,234)j,给定显著性水平0.5,查 t 分布表得自由度为 n-k=14 临界值 145.2(/knt。由表 3.4 中数据可得,与1、 2、3、 4对应的 t 统计量分别为 17.08010、2.482857 、1.412721、-2.884953除3, 其绝对值均大于 5.)(2/knt,这说明分别都应当拒绝 0H: )4,21(jj,也就是说,当在其它解释变量不变的情况下,解释变量“国民总收入” 、 “人均 GDP”分别对被解释变量“人口自然增长率”Y 都有显著
10、的影响。3的绝对值小于 145.2)(2/knt,:这说明接受 0H:03,X3 系数对 t 检验不显著,这表明很可能存在多重共线性。所以计算各解释变量的相关系数,选择 X2、X3、X4 数据,点”view/correlations”得相关系数矩阵(如表 4.4):表 4.4由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。五、消除多重共线性采用逐步回归的办法,去检验和解决多重共线性问题。分别作 Y 对X2、X3、X4 的一元回归,结果如表 4.5 所示:表 4.5 变量 X2 X3 X4参数估计值 0.000134 0.033919 0.001771t 统
11、计量 2.482857 1.412721 -2.884950.873915 0.388495 0.886412按 2R的大小排序为:X4、X2、X3以 X2 为基础,顺次加入其他变量逐步回归。首先加入 X2 回归结果为: 405397.2035.354.16 XXYt=(2.542529) (-2.970874) 9206.R当取 05.时, 13.2)8(025.)(2/ ttkn,X2 参数的 t 检验显著,加入 X3 回归得 432 9.4791.3.681. XXYt t= (17.08010) (2.482857) (1.412721) (-2.884953)056.2R 568.2 F=62.50441 当取 05.时, 14.)8(2/t,X3 参数的 t 检验不显著,予以剔除即 05397.3.34.16 XXY,这是最后消除多重共线性的结果。在假定其它变量不变的情况下,当年国民总收入每增长 1亿元,人口增长率增长 0.000332%;在假定其它变量不变的情况下,在假定其它变量不变的情况下,当年人均 GDP 没增加一元,人口增长率就会降低 0.005109%。金服 131 王亚平13019122