1、LUOYANG NORMAL UNIVERSITY2015届 本 科 毕 业 论 文我国最终消费支出与国内生产总值的关联性分析院 ( 系 ) 名 称 数 学 科 学 学 院专 业 名 称 统 计 学 ( 金 融 数 学 方 向 )学 生 姓 名 朱 媛 媛学 号 110444089指 导 教 师 朱 清 芳完 成 时 间 2015.5洛阳师范学院本科毕业论文1我国最终消费支出与国内生产总值的关联性分析数学科学学院 统计学专业 学号:110444089 指导老师:朱媛媛摘要:1978年改革开放至今,我国居民的收入水平逐渐提高,从1990年后呈现迅猛发展。收入的提高自然带动了消费支出的增长,与之带
2、动的是我国的国内生产总值提高。国内生产总值通常是用来衡量一个国家或者地区经济在一定时期内的全部产品和劳务价值,是公认的国家或地区经济情况晴雨指标。它不但可以反映一个国家的经济状况,还可以反映一个国家的国力与财富。其计算方式通常包括生产法、收入法和支出法,其中支出法以计算期内产品和劳务最终去向利用角度来计提国民经济活动成果,对实际经济效率反映较为真切,包含了最终消费支出、货物与服务净出口以及资本形成总额三个部分,本文以1978年到2003年经验数据为实证研究对象,在这里仅考虑最终消费支出与柜内生产总值的关系。关键词:最终消费支出;国内生产总值;多重共线性;异方差;多元加权最小二乘;主成分分析1
3、经济背景及研究的意义近年来,消费对国家经济的推动作用成为人们关注的焦点.在消费支出方面,食品、衣着的消费增长平稳;医疗保健和居住正在成为新的亮点;居民的支出迅速增长;交通和通讯、家庭设备用品及服务消费呈现快速增长.在现代国际社会中,发展经济是是每个国家首要的大事,对于基础较差的中国,发展经济更是义不容辞的事.在影响GDP的因素中,消费对GDP的贡献是最高的,这点从我国的历年资料中也可以看出,消费对GDP的贡献一般在 60%以上,其他因素都在50%以下 .所以,我国未来发展经济,就必须抓住消费这个着眼点,这也是我们研究最终消费支出与国内生产总值的关联性分析的意义所在。洛阳师范学院本科毕业论文22
4、 问题分析2.1 消费因素的选择1)6)影响消费的因素很多,如价格水平、消费偏好、制度模式等,其中,收入是影响消费的最重要因素.收入是消费的基础,在其他条件不变的情况下,人们的可支配收入越多,对各种商品和服务的消费量就越大.根据国家统计局的调查资料显示,不同消费群体之间的消费与投资倾向已有很大差异,受此影响,社会的消费结构也发生了较大的变化.因此,职工的工资是影响居民消费水平的一个很重要的因素,我们把地区的职工平均工资设为解释变量 .6x7)人均国内生产总值(人均GDP),是人们了解和把握一个国家或地区的宏观经济运行状况的有效工具,也是衡量各国人民生活水平的一个标准.人均GDP构成了一国居民人
5、均收入和生活水平的主要物质基础,在一定程度上直接决定和影响着我国居民收入和生活水平及其社会建设方面的投入取向、投入能力与投入水平,它对居民的消费有着不可忽视的影响.因此我们把地区的人均GDP作为解释变量 .7x2.2 相关统计理论概述2.2.1 多元线性回归分析预测多元线性回归分析预测是当两个或两个以上的自变量与因变量之间存在着线性关系时,应用普通最小二乘法建立多元线性回归方程,从两个或两个以上的自变量去预测因变量未来的数量表现的一种方法.多元线性回归模型的一般形式为,其中, , , , , 是 个未知参数012pyxx 012 p1, 称为回归常数, , , 称为回归系数 .12 p2.2.
6、2 逐步回归法逐步回归法的思想是有进有出,它是将变量一个一个引入,每引入一个自变量以后,对所引入的自变量进行检验,当引入的变量因为后面引入的变量变的不再显著时,要将其剔除.这样的过程反复进行,直到无不显著的自变量引入,也无显洛阳师范学院本科毕业论文3著的自变量被剔除为止.2.2.3 异方差在回归模型的基本假设中,假定随机误差项 , , , 具有相同的方差,且12 p相互独立,但在实际的建立模型时,经常存在与此假设相违背的情况,其中一种就是异方差,即 ,当 时.varrijij2.2.4 等级相关系数法等级相关系数法是一种检验异方差的方法.等级相关系数通常有3个步骤:第一步,作 关于 的普通最小
7、二乘回归,求出 的估计值,即 .yxiie第二步,取 的绝对值 ,把 和 按递增或递减的次序排列成等级,按ieieixie下式计算出等级相关系数22161ns ird其中,n为样本量; 为对应于 和 的等级的差数 .idixie第三步,做等级相关系数的显著性检验.在 的情况下,用下式对样本等9n级相关系数作 检验.检验统计量为t 21srt如果 ,可以认为异方差不存在;如果 ,则说明 与2tn 2tnixie之间存在异方差.2.2.5 加权最小二乘估计当误差项 存在异方差时,加权离差平方和为ie2011ni ipiQyx其中, 为给定的第 个观测值的权.加权最小二乘估计就是寻找参数 , ,ii
8、 01, 的估计值,使 达到最小. p洛阳师范学院本科毕业论文42.2.6 主成分分析设对某一事物的研究设计p个变量,分别用 , , 表示,这p个指1X2X标构成的p维随机向量为X .设随机向量X的均值为 ,协方差矩阵1,P 为 .对X进行线性变换,可以形成新的综合变量,用Y 表示,也就是说,新的综合变量可以由原来的变量线性表示,即满足下式: 11212 212PPPPYXX 主成分分析是一种降维的思想,在损失很少信息的前提下把多个指标利用正交旋转变换转化为几个综合指标的多元统计分析方法.通常把转化生成的综合指标称为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关.2.3
9、 模型的数据及符号说明由于最新数据查找不完全,本文选取了2011年中国统计年鉴我国30个省、市、自治区(西藏地区失业率数据缺失,因此从此样本中剔除西藏)2010年的数据 2.符号说明: 符号 含义1x居民的食品花费2居民的服装花费3x居民的居住花费4居民的医疗花费5x居民的教育花费6地区的职工平均工资洛阳师范学院本科毕业论文57x地区的人均GDP8地区的消费价格指数9x地区的失业率y居民家庭人均年消费支出2.4 多元线性回归模型1)本文选取9个解释变量研究城镇居民家庭的人均年消费性支出 ,解释变y量为: 居民的食品花费, 居民的服装花费, 居民的居住花费, 居民的医x2x3x4x疗花费, 居民
10、的教育花费, 地区的职工平均工资, 地区的人均GDP , 地56 78区的消费价格指数, 地区的失业率.9x2)作相关分析.用SPSS软件计算增广相关矩阵,见附录1).从相关阵看出, 与 , , , 的相关系数都在0.8以上,说明所选自变y135x6量 , , , 与 的线性相关性是很高的;相关系数 =0.581, =0.532,1x356x 2yr4yr=0.515, =-7yr8yr0.503,说明 与 , , , 是显著相关的; 与 的相关系数 =-2x478xy9x9yr0.389偏小,P 值=0.034, 是地区的失业率,符合“失业率与居民的消费支出之9间呈负相关”的一般观点;也可以
11、看出,地区的失业率对我国居民的消费支出的影响是比较小的.总体上,用 与自变量作多元线性回归是合适的.y3)用SPSS软件对数据作回归分析,部分运行结果见表2-1(其余结果见附录2).表2-1 多元线性回归分析结果模型汇总模型 R R 方调整 R 方 标准 估计的误差洛阳师范学院本科毕业论文61 .997a .994 .991 255.481a. 预测变量: (常量), x9, x8, x2, x1, x7, x3, x4, x5, x6.Anovab模型 平方和 df 均方 F Sig.回归 2.162E8 9 2.402E7 367.982 .000a残差 1305413.55620 652
12、70.6781总计 2.175E8 29a. 预测变量: (常量), x9, x8, x2, x1, x7, x3, x4, x5, x6.b. 因变量: y4)回归诊断.a)由表2-1 分析结果可知: 对9个自变量的线性回归方程为y12345271.8546.57.0.0.891yxxx808167从回归方程中可以看到: , , , , , , , 对居民的消费性1x234x5x8支出起正影响, 对居民的消费性支出起负影响,这与定性分析的结果相一致.9xb)复相关系数R=0.997 ,决定系数 =0.994,由决定系数可知,回归方程高2R度显著.c)方差分析表中:F=367.982 ,P 值
13、=0.000 ,表明回归方程高度显著,说明 1x, , , , , , , , 整体上对y有高度显著的线性影响.2x345x678x9d)回归系数的显著性检验:洛阳师范学院本科毕业论文7自变量 , , , 对 均有显著的影响,其中 居民的医疗花费的t1x28x9y4x检验P值=1.000, 居民的教育花费的t检验P值=0.075, 地区的人均GDP 的t检5 7验P值=0.083, 地区的消费价格指数的t检验P值=0.875, 地区的失业率的t 检8x 9x验P值=0.202,这5个回归系数的显著性检验不能通过 .e)多重共线性的诊断:由系数矩阵表看到, =10.746,说明自变量 地区的职工
14、平均工资与其它自变6VIF6x量之间存在严重的多重共线性 ; =9.532,接近10,说明 居民的食品花费与其余自变量之间也存在着较为2VIF1x严重的多重共线性;再回顾相关系数矩阵, 是居民的食品花费, 是居民的居1x3x住花费, 是居民的教育花费, 是地区的职工平均工资,相关系数 =0.69,5x6x 1r=0.766, =0.746, =0.724, =0.689,这几个自变量之间两两存在着一定15r16r35r5r程度的相关性.由此可以判断,该回归方程受到多重共线性的影响.2.5 模型的改进2.5.1 逐步回归1)基本思想:通过剔除一些不重要的解释变量来消除回归模型的多重共线性.2)利
15、用SPSS软件进行逐步回归.部分运行结果见表2-2.表2-2 逐步回归分析的结果Model SummaryModel R R SquareAdjusted R SquareStd. Error of the Estimate洛阳师范学院本科毕业论文81 .933a .870 .865 1006.4872 .970b .942 .937 684.7513 .987c .975 .972 457.0214 .995d .990 .988 293.9865 .996e .992 .991 262.424a. Predictors: (Constant), x1b. Predictors: (Cons
16、tant), x1, x2c. Predictors: (Constant), x1, x2, x3d. Predictors: (Constant), x1, x2, x3, x6e. Predictors: (Constant), x1, x2, x3, x6, x73)模型的诊断.a)由表2-2 可以看出:逐步回归的最优子集为模型5.回归方程为1236723987.4.78.09.780.3yxxxb)模型5的相关系数R=0.996,决定系数 =0.992,调整的决定系数 =0.991R2R,可以看出回归方程高度显著.c)方差分析表:模型5,F=626.774 ,P 值=0.000 ,表
17、明回归方程是高度显著的,说明 , , , , ,整体上对 有着十分显著的线性影响.1x236x7yd)回归系数的显著性检验:自变量 , , , , 对 均有显著的影响1x236x7y,t检验的值分别为 =0.529, =0.176, =0.207, =0.231, =0.06,对应的P 值均小1t2t3ttt于0.05,回归系数均通过显著性检验.e)异方差检验:利用SPSS软件,采用等级相关系数法 3进行异方差检验.部分结果见表2-3.表2-3 等级相关系数表x1 x2 x3 x6 x7 abse洛阳师范学院本科毕业论文9相关系数1.000 .130 .484* .552* .365* -.0
18、30Sig.(双侧). .495 .007 .002 .047 .873x1N 30 30 30 30 30 30相关系数.130 1.000 .416* .393* .289 -.070Sig.(双侧).495 . .022 .032 .122 .713x2N 30 30 30 30 30 30相关系数.484* .416* 1.000 .584* .456* -.175Sig.(双侧).007 .022 . .001 .011 .355x3N 30 30 30 30 30 30相关系数.552* .393* .584* 1.000 .302 .029Sig.(双侧).002 .032 .0
19、01 . .105 .878x6N 30 30 30 30 30 30相关系数.365* .289 .456* .302 1.000 -.412*Sig.(双侧).047 .122 .011 .105 . .024x7N 30 30 30 30 30 30相关系数-.030 -.070 -.175 .029 -.412* 1.000Sig.(双侧).873 .713 .355 .878 .024 .Spearman 的 rhoabseN 30 30 30 30 30 30从表2-3可以看出:残差绝对值与自变量的等级相关系数 =-7sr0.412,P值=0.024 ,所以认为残差绝对值 与自变量 之间存在相关性,模型存ie7x在异方差.2.5.2 采用多元加权最小二乘估计选择 构造权函数.利用SPSS 软件先确定幂指数 的最优取值,再进行加权7x m回归.部分结果见表2-4(其余结果见附录).