1、1基于主成分分析法的沿海 11 省市综合经济实力评价摘要:利用 2013 年中国统计年鉴数据,选择 8 项经济指标,采用主成份分析对我国沿海 11 个省市的经济实力进行综合评价排序,并按照主成份分析得分值的高低进行进一步分类和阐释。 关键词:经济发展;综合实力;主成分分析;沿海 一、引言 辽宁、河北、天津、山东、江苏、上海、浙江、福建、广东、广西、海南是我国大陆的沿海省、市。自 20 世纪 80 年代实施改革开放以来,沿海地区先后通过设立经济特区、沿海开放城市、开发开放上海浦东等重大政策,使该地区成为中国经济最活跃、吸引外资最多、经济总量最大、对国家贡献最大、对外影响力最大的区域。但区域经济差
2、异是经济发展过程中不可避免的现象,地区发展不平衡也是我国的基本特征之一。沿海各省、市有着比较相似的自然环境和资源等客观条件,经济发展水平依然存在较大的差异。沿海地区的经济发展对中国的经济发展起着领头羊的作用,是中华民族崛起不可缺少的强劲动力,只有客观、准确地评价沿海各省、市的综合经济实力,分析各地区经济发展的差异,然后提出有针对性的政策和意见,才最终实现推动沿海各省、市经济的协调稳定发展。 二、研究方法 (一) 主成分分析简介 2主成分分析方法(Principal Component Analysis)简称(PCA) ,是一种解决最终问题的“中间过程” 。在社会经济研究中经常会遇到多指标的问题
3、,这些指标间往往存在一定的相关,直接纳入分析不仅复杂,使变量之间难以取舍,而且可能因多元线性而无法得出正确结论。主成分分析的目的就是运用线性变换,将原来的多个指标组合成相互独立的少数几个能充分反映母体信息的指标,从而在不丢掉主要信息的前提下,避开了变量之间共线性的问题,便于进一步分析。 在主成分分析中,提取出的每个主成分都是原来多个指标的线性组合,比如有两个原始变量 x1 和 x2,则一共可提取出如下两个主成分: PCA1=a11x1+a21x2PCA2=a12x1+a22x2 原则上如果有 n 个变量,则最多可提取出 n 个主成分,但如果将它们全部提取出来就失去了该方法简化指标的实际意义。多
4、数情况下提取出前 23 个主成分就已包含了 90%以上的信息,其他的可以忽略不计。提取出的主成分只要能包含主要信息即可,不一定要有准确的实际含义。所以对于某一问题同时要考虑几个因素时,并不对这些因素单个处理,而是将它们综合起来处理,用数据的本身来寻找对全部方差最有影响力的方向、第二有影响力的方向等,当然希望能够找到一两个方向能解释大部分数据中的变异,从而得到“降低原始数据中的维数”的效果,这就是主成分分析的核心概念。 主成分分析的目的是提取信息,对样本量没有太严格的要求。除了样本量以外,既然要从许多变量中提取“主成分” ,有一个默认的前提条件就是各变量间必须有相关性,否则各变量间没有共享信息,
5、就不应当3有“公因子”需要提取,自然也谈不上使用该方法。这是主成分分析最为严格的前提要求。具体在该条件的判断上,除了根据专业知识来估计外,还可以使用 KMO 统计量和 Bartletts 球形检验加以判定。 (二)数学模型 主成分分析旨在利用降维的思想,把多指标转化为少数几个综合指标。设有 n 个地理样本,每个样本共有 p 个变量,构成 np 阶的地理矩阵: X=x11 x12 K x1px21 x22 K x2p xn1 xn2 xnp 如果 p 值较大或者变量之间存在明显的相关关系时,在 p 维空间中考察问题比较繁琐,并且需要作出“去相关”处理,需要通过较少的、同时又是相互独立的指标尽量多
6、地反映原来较多变量指标所反映的信息。这些较少的代表性指标选择需要取原来变量的线性组合,适当调整组合系数,使新的变量之间相互独立且代表性较好。 如果原来变量指标为 x1,x2xp,它们的综合指标即新变量为z1,z2zm(mp) ,则: z1=l11x1+l12x2+l1pxpz2=l21x1+l22x2+l2pxpzm=ln1x1+ln2x2+lnpxp 系数 lij 的确定原则: 1. zi 与 zj(ij;i,j=1,2,m)相互无关; 2. z1 是 x1,x2,xp 的一切线性组合中方差最大者;z2 是与 z1不相关的 x1,x2,xp 的所有线性组合中方差最大者; zm 是与4z1,z
7、2,zm-1 都不相关的,x1,x2,xp 的所有线性组合中方差最大者。则新变量指标 z1,z2,zm 分别称为原变量指标x1,x2,xp 的第 1,第 2,第 m 主成分。从以上的分析可以看出,主成分分析的实质就是确定原来变量 xj(j=1,2 , p)在诸主成分zi(i=1,2,m)上的荷载 lij(i=1,2,m; j=1,2 ,p) 。从数学上可以证明,它们分别是相关矩阵 m 个较大的特征值所对应的特征向量。 三、实证研究 (一)建立指标体系 选取合理的指标构建指标体系是进行实证研究的关键,而一个地区的社会经济发展状况是多方面的,任何单项指标都无法全面而客观地反映该地区的社会、经济、文
8、化发展水平,需要构建一套合理的指标体系对地区综合经济实力进行全面的评价,该指标体系即是利用多个指标从不同侧面,全方位、多角度地对地区综合经济实力进行评价。在构建指标体系时,应遵循科学性、综合性、独立性、主导性、可操作性、因地制宜等原则。 根据上述原则,结合我国沿海 11 个省市的经济发展特征,文章选取了以下 8 项指标构建指标体系:X1 地区生产总值(代表该地区的经济总量水平) 、X2 固定资产投资总额(代表该地区的基础设施建设水平) 、X3地方财政一般预算收入(代表该地区财政能力) 、X4 商品出口总额(代表该地区的国际开放程度) 、X5 资本形成总额(代表该地区经济发展潜力) 、X6 人均
9、地区生产总值(代表该地区综合经济水平) 、X7 居民消费水平、5X8 居民人均储蓄存款(指标 X7 和 X8 代表该地区人民生活水平) 。 (二)主成分分析 根据上面确定的指标体系,本文采用 2012 年我国沿海 11 个省市的指标值作为样本数据(数据来源于 2013 年中国统计年鉴) 。首先将对数据进行标准化处理,从而消除数据的量纲和单位的影响。进而得到各指标之间的相关系数矩阵(表 1) ,从相关系数矩阵来看,各个变量的相关性很强,呈高度的线性关系,说明主成分的效果显著。根据主成分分析原理 ,将标准化后的样本数据输入 SPSS19.0 软件进行主成分分析得出如表 1(各项经济指标相关系数矩阵
10、) 、图 1(碎石图)及表 2 (相关系数的特征值、贡献率、累计贡献率) 。 根据主成分分析特征值(Eigenvalue)大于 1 作为主成分选择依据,由图 1 和表 2 可知,成分 1,成分 2 的特征值大于 1,其他 6 个成分的特征值都远远小于 1。可以看出满足条件的 2 个特征值所对应的信息量已经到达 90.845%,因此可以利用这 2 个特征值对应的特征向量作为新的综合指标对沿海各省市的综合经济实力进行评价。 从表 3 中,我们可以看出变量 X1 地区生产总值、X2 固定资产投资总额、X3 地方财政预算收入、X4 商品出口总额、X5 资本形成总额在第一主成分上有较大的载荷,反应研究区
11、域的生产与贸易能力。变量 X6 各地区人均生产总值、X7 居民消费水平、X8 居民人均储蓄存款在第二主成分上有较大的载荷,反应研究区域的人均地区生产总值与人民生活水平状况。确定主成分之后,运用 SPSS19.0 可得到沿海各省市各主成分的得分,分别以 FAC_1 和 FAC_2 表示,但要对沿海各省市经济实力做出综合的评价,6需要结合主成分综合模型。首先计算各主成分的权重,以每个主成分所对应的特征值占所提取主成分总的特征值之和的比例作为权重,由此得出 FAC_1 的权重 w1=0.633,FAC_2 的权重 w2=0.367。再将 FAC_1、FAC_2和他们的权重进行加权求和计算,则沿海各省
12、市的综合经济实力的评价模型可表示为:Z=FAC_1*0.633+FAC_2*0.367。通过计算,得到各地区的综合经济实力得分,如表 4。 (三)结果分析 由表 4 可见,沿海 11 省市的综合经济实力同样存在较明显的差异。上海市、广东省、江苏省和浙江省的综合经济实力得分较高,说明这些地区的综合经济实力在沿海省、市中相对较强。 上海市的综合经济实力位于沿海 11 省市的首位,反应人均地区生产总值与人民生活水平状况的第二主成分得分以绝对优势位于榜首,反应区域生产与贸易能力的第一主成分分值较低。这意味着上海市的地区生产总值、固定资产投资总额、地方财政预算收入、商品出口总额、资本形成总额在沿海 11
13、 个省市中并不突出。上海市 2012 年地区生产总值、固定资产投资总额和资本形成总额分别为 20181.72 亿元、28047.83 亿元和 7674.82 亿元,远远低于沿海 11 省市这三类指标的平均值,地方财政预算收入和商品出口总额虽略高于沿海 11 省市平均值,但其值也仅位于11 省、市的中等水平。上海市 2012 年人均地区生产总值、居民消费水平和居民人均储蓄存款均位于沿海地区的前列,其指标值分别为 85373 元、36892.85 元和 36737.98 元,反映出上海市人民的生活质量较高、生活水平较好。根据协调概念,居民消费水平越高,居民人均储蓄存款越多,7说明居民的收入越高而且
14、稳定,市场持续健康发展,经济潜力大,整体产业结构优势明显,核心竞争力强。同时,上海市产业结构由传统的第一产业和第二产业为主逐渐向以服务业为主的第三产业转型,这一点可以通过上海的消费水平总体较高体现出来。上海综合经济实力排在第一位是理所应当的。 广东省、江苏省和浙江省的综合经济实力较强,三省的第一主成分分值较为突出,说明三省的生产与贸易能力较强,广东省、江苏省和浙江省的地区生产总值均位于沿海地区的前列,分别为 57067.91 亿元、54058.22 亿元和 34665.33 亿元;依托优越的地理位置和历史条件,广东省、江苏省和浙江省自古对内对外都拥有频繁的贸易往来,2012 年三省商品出口总额
15、分别达到 63622169.2 万美元、33424029.2 万美元和24466542.7 万美元,远远高于沿海省市平均值;另外,广东省和江苏省的固定资产投资总额、地方财政预算收入和资本形成总额均居沿海省市的前列,远远高于沿海地区的平均水平。广东省和江苏省的第二主成分分值均为负数,两省的人均地区生产总值、居民消费水平和居民人均储蓄存款都在沿海地区平均值左右。 天津市和山东省的综合经济实力分值居于沿海地区中等水平,但两省市的主成分构成有较大的差异。天津市第二主成分分值位于沿海地区第二位,说明天津市人民生活质量较高,2012 年天津市人均地区生产总值、居民消费水平和居民人均储蓄存款均位于沿海地区首
16、位;而其第二主成分分值较低,原因在于天津市坚持制造业和沿海都市型农业发展方向,第三产业发展相对滞后,2012 年商品出口总额仅 3124774.2 万美元,8地区生产总值仅 12893.88 亿元。山东省的第一主成分分值和第二主成分分值反映该地区生产与贸易能力较强。山东省的人均地区生产总值、居民消费水平和居民人均储蓄存款为 51768 元、15094.99 元和 11810.16 元,均低于沿海地区三指标的平均值。 海南省、广西省、河北省、福建省和辽宁省的综合经济实力处于沿海地区的中下水平,第一主成分分值和第二主成分分值都比较低,其中广西省、海南省和福建省的各项指标值均远远低于沿海省市各指标的
17、平均值。这五个省虽都地处沿海,地理位置优越,但经济基础相对较为薄弱,产业结构不尽合理,经济发展正处于全面振兴的新阶段,市场竞争力有待进一步提升。 参考文献: 1冯利华,马未宇.主成分分析法在地区综合实力评价中的应用J.地理与地理信息科学,2004(06). 2彭玉宝,覃成林.河南县域经济实力评价及空间差异分析J.地域研究与开发,2007(01). 3邓艳红,李容.重庆市社会经济发展的实证分析J.数理统计与管理,2002(06). 4王淑芬,崔秀珍.主成分分析法在天津市经济实力综合评价中的应用J.天津工业大学学报,2002(02). 5丛明珠,欧向军,赵清等.基于主成分分析法的江苏省土地利用综合分区研究J.地理研究,2008(03). 6殷克东,李兴东.我国沿海 11 省市海洋经济综合实力的评测J.9统计与决策,2011(03). (作者单位:辽宁师范大学城市与环境学院)