1、1基于因子分析的陕西 GDP 预测及政策建议摘 要:影响 GDP 的因素众多且各因素具有一定的相关性。运用因子分析法寻找出影响陕西省 6 项经济指标变动的主因子(利用 SAS 实现) ,依据每项经济指标与主因子的线性相关度达到 98%以上,拟合出每项经济指标与主因子的线性函数。同时,利用多项式拟合计算主因子与时间的函数,从而通过预测未来 4 年主因子的值计算出各项经济指标的值以及GDP 的值。最后,根据各指标对 GDP 的贡献给出具体的政策建议。 关键词:因子分析;主因子;SAS 软件;多项式拟合 中图分类号:F127;F224 文献标志码:A 文章编号:1673-291X(2013)23-0
2、090-03 引言 经济发展是关乎民生的大事,而影响 GDP 的因素众多,且各因素之间具有程度不一的相关性。本文旨在寻找影响几项重要经济指标变化的主因子,从而预测陕西省未来几年 GDP 的值。本文基于因子分析法,利用 19932007 年的陕西省经济统计数据找到影响陕西省经济发展的主因子,并利用 20082011 年的数据对因子拟合做了检验。之后,用多项式拟合预测未来几年的主因子的值,从而预测未来几年各个经济指标的值,最后给出 20132016 年陕西省 GDP 的区间。 通过分析预测结果,本文根据经济指标对经济增长贡献的不均衡性给出具体政策建议:首先,第一产业对陕西省生产总值贡献较小,但由2
3、于其在经济发展过程中表现出的稳定性,故应利用高科技手段保护农业资源,建立可持续的生态型农业;其次,针对陕西省旅游业,由于其发展空间大,应挖掘地方文化,发展文化旅游业,增强旅游产业的核心竞争力,使得陕西省经济在稳重求进的大环境下平稳快速发展。 一、综合评价方法和因子分析法 (一)综合评价方法1 在实际预测经济的过程中,一方面,由于影响 GDP 的因素众多,在实际建立预测模型的时候必然会面对哪些因素要保留、哪些因素可以舍弃的难题;另一方面,这些影响因素并不是彼此相互独立的,而是存在较高的相关性,多个指标可能共同受制于某一个因素。在这种情况下,如果将预测模型的建立假定在各个指标因素相互独立的前提下,
4、显然是不合理的。考虑到这一点,我们引入因子分析法。它能对指标间的共同因素加以测定,用公共因子代替原指标,简化分析。而且因子分析法根据主因子的方差贡献率客观地确定指标的权重,避免人为选择指标的行为对结果产生较大影响。 (二)因子分析法步骤说明2 1.样本数据标准化处理 对样本进行标准化处理后,可以消除由于量纲的不同而对分析结果的影响。对原始数据进行标准化处理的计算公式为 xij=(Xij-Xi)/i,其中 xij 标准化数据,Xij 为原始数据,Xi 为第 i 个指标的均值,i 为第个指标的标准差(i=1,2,n) 。令 x=(x1,x2,xm)T,则n 个样本标准化后的数据矩阵为 3=x11
5、x12 x1mx21 x22 x2m xn1 xn2 xnm 2.计算 m 个标准化指标的相关系数矩阵 R=r11 r12 r1mr21 r22 r2m rm1 rm2 rmm 相关矩阵是因子分析直接使用的数据,根据算出的相关矩阵进一步判断应用因子分析是否合适。 3.求相关系数矩阵 R 的特征根 相关矩阵 R 的特征方程|R-I|=0,其 m 个特征值为123m,相应的标准化特征向量为 ej(j=1,2m) 。并使F=AX,其中 F 为主因子阵 F=F1,F2,Fm X=X1,X2,Xm 4.确定因子贡献率及累积贡献率 第 i 个因子的贡献率为 g=i/i,gi 为第 i 个主成分的贡献率,该
6、值越大,则说明特征值所占比重越大,也即该主成分概括各指标数据的能力越强。 5.选取主成分个数 gi 表示前 k 个主成分的累积贡献率,即前 k 个主成分从原始变量数据中提取的信息量。若该信息量已达到全部信息量的绝大部分(一般认为85%)时,可以认为前 R 个主成分已基本反映了原始变量数据的主要信息,或者取大于等于 1 的特征根所对应的主成分。wi=gi/gi 是第 i 个主成分的权数。 6.因子载荷矩阵的变换 4对于初始因子载荷阵,如果因子负荷的大小相差不大,对因子的解释可能有困难。因此为得出较明确的分析结果,通过旋转坐标轴,使每个因子负荷在新的坐标轴中能按列向 0 或 1 两极分化,同时也包
7、含了按行向两极分化。 7.建立主因子得分模型 其因子得分模型为 fi=xj=xR-1j(j=1,2,3k) 。式中,fi 为因子得分函数,j=xR-1j 为计算因子值的系数,x 为标准化数据;R为标准化数据的相关系数矩阵,j 为负载矩阵 A 的第 j 列。 8.综合评价 以各个主成分的方差贡献率为权数,对因子得分进行加权求和,进行综合评价。其综合得分模型为 F=wifi。该得分模型以 0 为界,分值越高,说明样本可持续发展水平越高;反之则越弱。得分模型等于 0 说明可持续发展能力等于平均水平。 二、陕西省 GDP 预测方法的确定 (一)评价指标体系1 为了全面预测陕西省 GDP 的发展,本文选
8、择以下 6 项经济指标:第一产业生产总值(x1) 、第二产业生产总值(x2) 、第三产业生产总值(x3) 、人均生产总值(x4) 、社会消费品零售总额(x5) 、旅游收入(x6)进行分析。本文数据来源:陕西统计年鉴 2012 。 (二)预测的基本步骤 步骤 1:输入 19932007 年上述 6 项经济指标的值4,寻找影响这些指标变动的主因子(利用 SPSS 实现) ; 5步骤 2:拟合主因子与标准化的六项经济指标的线性关系,从而可以计算出 F1 的真实值; 步骤 3:分别计算各项经济指标与主因子的线性相关度,从而计算各项经济指标与主因子的线性关系 xi=kiF1+bi; 步骤 4:利用多项式
9、拟合主因子与时间的函数关系,从而通过预测出的主因子的值,计算出 20082011 年各经济指标以及 GDP 的值,并与真实值对比,给出 GDP 的平均相对误差; 步骤 5:将 20082011 年的数据加入模型,根据上述步骤预测20132016 年各经济指标的值,再计算出 GDP 的预测区间。 (三)模型建立与求解 1.求解主因子 根据陕西省 19932007 年3的各项经济指标数据,利用 SAS4实现,得到如下结果: 表 1 方差极大正交旋转因子载荷阵 数据来源为陕西统计年鉴 2012 ) 由表 1 知第一个因子方差贡献率为 0.9901,也即第一个因子反映的信息量占总信息量的 99.01%
10、,信息损失只有 0.99%。因此,为了简化问题,仅选择第一个因子来分析各项经济指标。 2.求解因子 记 y1=(i=1,6)则由表 1 的第一行数据可得 F1 与 y1 至 y6 的线性关系: F1=0.405 624y1+0.408 862y2+0.409 282y3+0.410 23y4+0.407 896y5+ 60.407 787y6 依次可以求得该因子从 19932007 年 F1 的值。 3.因子与各经济指标的相关性 利用 SAS 软件求得主因子与各指标的相关性(见表 2 第一行数据) ,可以看出因子 F1 与各指标的相关性都达到了 99%以上,因此,我们有理由相信因子与各指标有线
11、性关系。根据 19932007 年每年各指标的真实值与 F1 的值,拟合出 x1 与 F1 的线性关系 xi=kiF1+bi,系数见表 2,从而通过预测因子 F1 随时间变化的值来预测各指标的值。 表 2 因子 F1 与各指标的相关性 4.多项式拟合及各指标检验 (1)多项式拟合 利用 Excel 做出主因子 F 关于时间 t 的三次多项式拟合图像(如图1 所示)及函数关系: F1(t)=0.006 2(t-1 992)3-0.103 5(t-1 992)2+0.774 8(t-1 992)-3.565 0 解释残差平方和比率 R2=0.998 0,说明拟合效果精度达到 99.8%。将 200
12、82011 带入上式可得各年份 F1 的预测值(见表 3) 。 图 1 对因子 F1 的多项式拟合 (因子 F1 关于时间的多项式拟合,其中 F1 为 t 年份的预测值) 表 3 20082011 年的预测值 (2)多项式拟合检验 为了检验各经济指标及 GDP 的拟合水平,我们根据各年份 F1 的预测7值(见表 3)以及 F1 与 xi 的线性关系 xi=kiF1+bi 可计算出各指标的值,从而根据生产法(GDP=第一产业生产总值+第二产业生产总值+第三产业生产总值)计算出相应年数 GDP 的值(见表 4) 。 根据表 4 最后一列数据计算出 20082011 年 GDP 的真实值与预测值的平
13、均相对误差为 2.80%。因此,各经济指标与公共因子的线性关系反映出数据的真实变化趋势。 三、预测陕西省未来四年 GDP 走势 (一)预测准备 将 20082011 年各个指标的数据加入模型,方法同第三部分。得到因子与所有指标的线性关系为: 表 4 各指标的真实值和预测值 (x4 单位:元;其余变量单位:亿元) F1=0.408 02y1+0.325 688y2-0.701 029y3+0.457 368y4+0.139 518y5+ 0.085 76y6 以及因子与各指标的相关性(见表 5) 、因子 F1 关于时间的多项式拟合图像及方程(见图 2) 。 表 5 因子 F1 与各指标的相关性
14、图 2 对主因子 F1 的多项式拟合 (二)预测步骤 1.根据 F1 随时间的变化预测 20132016 年对应的 F1 的值; 2.根据 F1 与 xi 的线性关系 xi=kiF1+bi 计算出各指标8xi(i=1,6)的值; 3.根据生产法计算出相应年数 GDP 的值,并由原始模型 GDP 的平均相对误差计算出 GDP 的预测区间。 (三)预测结果: 表 6 主因子 F1 及未来 4 年各指标的预测值 (x4 单位:元;其余变量单位:亿元) 预测结果如表 6 所示。将预测所得的生产总值加上第一个模型得到的真实值与预测值的相对误差(2.80%)可得未来 4 年生产总值的预测区间,如表 7 所
15、示。 表 7 未来四年生产总值预测区间 由预测结果可知,至 2016 年,陕西省生产总值将是 2011 年的 2.5倍,包括人均生产总值在内的各项经济指标都有显著飞跃。 四、模型分析与政策建议 (一)模型分析 陕西省的经济指标包括第一产业生产总值(x1) 、第二产业生产总值(x2) 、第三产业生产总值(x3) 、人均生产总值(x4) 、社会消费品零售总额(x5) 、旅游收入(x6)在内在大程度上受一个共同因素的影响,并且这个因素与这些经济指标呈现出线性相关关系。从图 1 中可以看出该因子呈现出快速增长的趋势,也就是陕西省的经济正在快速发展。 从表 2 中的线性拟合斜率可以看出,人均生产总值增长
16、速度最快;而第一产业生产总值和旅游收入增长相对缓慢;第二产业和第三产业对经济增长的贡献较大;社会消费品零售总额的增长速度较快。说明随着9收入增加,人们的消费需求也在增加,但增加速度相对于收入增加速度较为平缓。 从表 4 中可以看出,用该因素预测的各经济指标值与其真实值的误差较小,也就是在经济社会中各项经济指标关系紧密,在相当大的程度上受到国家政策和经济大环境的影响5。 (二)政策建议 由模型分析可知,第一产业以及旅游业对陕西省生产总值贡献较小,因此,具有发展潜力。陕西省作为一个农业大省,第一产业对 GDP 的贡献却占比较小,因此农业问题必须得到高度重视,发展经济的同时应减少对环境的破坏,克服农
17、业在经济发展中的障碍和问题,合理规划现有资源6。在经济全球化的背景下,可以利用高科技手段,寻找新的路径,保护农业资源,建立可持续的生态型农业,为经济发展做贡献,造福子孙后代。 胡锦涛总书记在十八大上提出,要扎实推进社会主义文化强国建设。而旅游业是文化产业的重要载体。陕西作为历史文化名城,具有得天独厚的自然优势。所以,我们应转变经济发展重点,挖掘地方文化,发展文化旅游业,增强旅游产业的核心竞争力,充分挖掘文化旅游产业的发展潜力,使之成为陕西省新的经济支柱。相信在合理规划和发展具有地方特色的生态农业和文化旅游业的情况下,陕西省经济将在全国“稳中求进”的大环境下迅速腾飞。在未来几年,我们将一起见证幸
18、福陕西的发展与振兴! (三)模型评价 该模型预测出陕西省多项经济指标,揭示出各项经济变量之间的相10依关系以及陕西省经济的发展趋势。但是,有些经济指标可能独立地受某个因素的影响,如果需要更准确地预测该经济指标,可以把该因素作为特殊因子加入模型。此外,因子分析法就是试图用较少的且相互独立的变量来描述数据之间的关系,因此有广阔的应用范围。在经济领域,我们可以用此方法对陕西省各地区经济发展进行评估和预测,从而采取合理的经济调控手段使各地区经济均衡平稳发展,也可以用它来度量某一政策对经济的影响程度。 参考文献: 1 韩秀兰.山西区域经济发展的不平衡性分析基于因子分析的实证研究J.经济问题,2008,
19、(2):114-115. 2 Richard A.Johnson,Dean W.Wichern.实用多元统计分析M.北京:清华大学出版社,2008:374-409. 3 国家统计局.陕西调查总队.陕西统计年鉴 2012M.北京:中国统计出版社,2012:67-93. 4 董大钧.SAS 统计分析应用M.北京:电子工业出版社,2008:406-415. 5 Wanzy Wang.Chinas Economy in the Year of 2012 Chinas Economy achieved a stabilized and accelerated development.China Textile, 2013, (2):43-45. 6 LU Yan.Strategies for Development of Shaanxis Agricultural Insurance Industry.Asian Agricultural
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。