基于拓展聚类模型的区域创新能力层级划分研究.doc

上传人:99****p 文档编号:1432617 上传时间:2019-02-27 格式:DOC 页数:10 大小:32KB
下载 相关 举报
基于拓展聚类模型的区域创新能力层级划分研究.doc_第1页
第1页 / 共10页
基于拓展聚类模型的区域创新能力层级划分研究.doc_第2页
第2页 / 共10页
基于拓展聚类模型的区域创新能力层级划分研究.doc_第3页
第3页 / 共10页
基于拓展聚类模型的区域创新能力层级划分研究.doc_第4页
第4页 / 共10页
基于拓展聚类模型的区域创新能力层级划分研究.doc_第5页
第5页 / 共10页
点击查看更多>>
资源描述

1、基于拓展聚类模型的区域创新能力层级划分研究摘要:为了对中国创新能力科学划分以深层次挖掘区域之间创新能力的有机联系,笔者在剖析现有层级划分方法优点与不足的基础上进行模型拓展,应用拓展的聚类模型对我国的区域创新能力进行静态与动态分类,并对分类结果的显著性进行检验。对比分析不同地区创新发展模式发现,创新能力东强西弱的阶梯分布格局仍存在,必须分集团而不是整齐划一的制定和实施创新政策。 关键词:区域创新能力; 聚类分析; 主成分分析; 面板数据; 层级划分 基金项目:国家社会科学基金项目(11BTJ001) ;国家自然科学基金青年项目(710201139) ;全国统计科学研究计划重大项目(2012LD0

2、01) 。作者简介:王德青(1983-) ,男,山东青岛人,博士,主要从事统计理论与方法,数据挖掘研究;朱建平(1962-) ,男,河南浚县人,教授,博士生导师,主要从事数理统计与数据挖掘研究。 中图分类号:F061.5;C81 文献标识码:A 文章编号:1006-1096(2014)01-0008-06 收稿日期:2013-01-15 一、问题的提出 随着世界经济全球化的不断发展和科技进步的日新月异,区域创新能力已成为区域综合竞争力的主要标志和提升地区经济国际竞争力的必然途径。与发达国家创新协调发展的格局相比,我国的创新能力存在悬殊的不平衡区域化特征。技术创新是政府、企业、科研机构等多主体参

3、与、多要素互动的复杂系统工程。作为国家创新系统的子系统之一,区域创新的运行状态和对经济的驱动机制直接影响到国家创新总系统的质量和效率。有鉴于此,如何审视区域之间技术创新能力的不平衡发展状态?如何深层次剖析导致创新差异的原因?如何制定针对性的创新激励政策以缩小区域之间创新的巨大差异?这些问题的回答,对于促进区域之间、国家创新子系统之间的协调发展具有重要的理论价值和现实意义。针对区域创新能力的评价与分析,国内外学者和机构做了诸多有益的探讨。Freeman(1987) 、梁小珍等(2011)理论层面构建了创新的评价指标体系,并采用熵权法、灰色关联度法、主成分分析法对比分析了区域经济发展与自主创新能力

4、之间的协同机制;柳卸林等(2002) 、周立等(2006)基于中国区域创新能力报告的数据,集成因子分析与聚类分析定量评估了 31 个省级区域的创新能力地区差异;魏守华等(2010) 、王锐淇等(2012)沿袭我国按东中西三大地带的划分习惯,基于省级面板数据实证检验了创新能力地区差异扩大化的影响因素。综观近年来关于区域创新能力的研究成果,存在一些明显的共有缺陷,主要表现在:(1)宏观理论层面的研究结论难以满足地区差异化的要求;(2)现有方法论框架下的创新能力层级划分研究,直接套用现成模型进行静态排序和定性评价则缺乏系统的动态作用机制研究,对创新能力区域性差异形成原因挖掘的不够;(3)不加验证地沿

5、袭东中西三大地带的划分习惯,忽略了创新过程的相对特殊性和空间依赖性,依此制定的政策建议缺乏针对性。 为了对中国的创新能力科学划分以深层次挖掘区域之间创新能力的有机联系,本文在综合剖析现有层级划分方法优点与不足的基础上,融合多种经典统计分类模型的优点,提出创新能力静态层级划分的加权主成分聚类模型,拓展用于创新能力动态层级划分的面板聚类模型,并从理论上论证上述两模型的合理性和有效性。最后,应用拓展的聚类模型对中国省际创新能力进行静态与动态层级划分,对比分类结果的差异,依据实证结论给出提升区域创新能力的初步政策建议。 二、 模型拓展与研究框架 创新水平的科学划分是挖掘创新能力区域差异的关键环节,也是

6、制定针对性创新战略的先决条件。现有的东中西部划分,一是缺乏科学的定量分析基础,二是存在同类地区内部创新能力差异较大的问题。如果就每个省(区)市分别进行研究,结果只能反映单个省(区)市的个例特征,难以从总体上把握区域之间创新发展的不平衡分布状态,同时也忽略了相关省(区)市之间创新能力的有机联系。尽管也有一些关于我国创新能力定量层级划分的研究成果,但多是对现成统计分类模型的直接应用,或是机械地集成不同种统计分类方法,其合理性和有效性缺乏理论论证。因此,本文首先在梳理现有层级划分方法优点与不足的基础上进行模型拓展。 (一)加权主成分聚类模型 其中:q 为距离参数,要求 dij(q)满足正定性、对称性

7、和三角不等式(张尧庭 等,2006) 。 样本之间的亲疏关系不仅取决于聚类统计量中指标之间的远近程度,还依赖于指标间重要性的内在差异。不难发现,(1)式定义的相似性统计量要求指标之间相互独立,并且指标的重要程度相同。然而,系统层次结构的指标体系中各指标重要性相差悬殊,指标之间也不可避免地重叠信息。如果忽略上述两个问题直接聚类, (1)式定义的距离将同类指标重复计算,过于放大共线性指标的作用而淹没独立性指标的贡献。为了避免上述问题,通常是定性分析指标之间的关系,力图在指标筛选过程中达到增加指标独立性的目的,同时通过专家打分赋予不同指标相应的权重以体现指标重要性的差异。显然,定性地筛选指标和主观赋

8、权需要对数据的实际意义有深入的了解,并且要求分析者具有相关的领域知识,这在实际应用中难以保证。由于主成分分析能在基本不损失原始指标信息的基础上,提取出彼此信息不重叠的主成分,因此可以先对原始指标体系进行主成分分析,然后将主成分代替原始指标进行聚类(柳卸林 等,2002;周立 等,2006) 。需要注意的是,主成分聚类克服了传统聚类分析不能处理指标高度共线性的缺点,但是当各主成分的方差贡献率相差悬殊时,忽略不同主成分重要程度(方差贡献率)的差异,则必然会影响主成分聚类分析的准确性(王德青 等,2012) 。 指标之间的高度共线性和重要性的客观差异是限制经典聚类模型广泛应用的两个方面,对经典聚类模

9、型的改进必须综合考虑以上两个缺点。本文定义加权主成分距离为聚类统计量对主成分聚类分析聚类模型进一步拓展。 (二)面板数据动态聚类模型 面板数据兼具空间和时间两个维度,横截面上是由若干个体在某一时刻的静态截面数据,纵剖面上是多个指标时间序列的动态数据。传统的聚类分析多是基于固定时期的截面数据,不能满足面板数据时序动态分类问题的需要。针对如何对面板数据进行聚类分析,国内外学者做了诸多探索(朱建平等,2013) 。综合来看,现有面板数据聚类分析文献多是直接从面板数据指标值出发,探讨优化的聚类算法(Bonzo et al,2002) ,或是在相似性的测度中未考察面板数据的动态数字特征(郑兵云,2008

10、;肖泽磊 等,2009) ,或是只能处理单指标面板数据的聚类问题(朱建平 等,2007) ,或是相似性的定义存在主观随意性(李因果 等,2010) ,实际上并未达到面板数据有效聚类的目的。 (三)研究框架 目前尚未建立统一的区域创新分析框架,理论基础和研究视角的不同对创新指标体系构建和创新水平层级划分具有重要的参考价值,在不产生实质性影响的前提下,本文以中国科技发展战略研究小组公布的中国区域创新能力报告 (下文称报告 )为理论研究和实证分析的基础。该报告将创新界定为将知识转化为新产品、新工艺和新服务的过程,在参考美国创新指标 、瑞士国际竞争力报告以及世界经济论坛全球竞争力报告基础上,从知识创造

11、、知识获取、企业创新、创新环境和创新绩效 5 个方面表征地区的整体创新能力。 需要说明的是,不同于报告中专家打分人为设定权重的主观评价和定性分类方法,本文仅以报告的创新综合数据为研究支撑平台,应用加权主成分聚类模型对区域创新能力进行静态层级划分,应用拓展的面板聚类模型对区域创新能力进行动态层级划分。选择上述层级划分模型主要基于以下考虑:(1)衡量区域创新能力的指标共 100 余项,指标之间重要性相差悬殊且不可避免地重叠信息,经典聚类模型处理上述分类问题失效;(2)创新是动态的发展过程,面板聚类模型综合考虑数据截面的静态特征和时序的动态特征,层级划分更全面细致。最后,对分类结果的显著性进行统计检

12、验,对比分析不同地区创新发展模式的差异,并依据实证结论为进一步提升区域能力提供针对性的政策建议。 三、实证结果与分析 (一)数据来源及预处理 本文采用的数据为 31 个省(区)市 2002 年2011 年的相关数据,原始数据来自相关年份的中国统计年鉴 、 中国科技统计年鉴和地方统计年鉴,部分数据由国家科技部政策法规司和研究中心政策部的官方资料换算求得。由于上述指标数据均已统计在 2002 年2011 年的中国区域创新能力报告中,本文直接调用上述原始数据。依据表 1 中数据资料主成分分析的适用性检验结果可知,10 年截面数据的 KMO 值均大于 0.7,Bartlett 球形检验统计量对应的 P

13、 值均小于 0.05,说明创新指标体系之间存有高度的信息重叠,满足主成分因子分析的前提条件。表2 报告了主成分分析及距离权重的计算结果,由表 2 可知,各截面数据的前两个主成分累计方差贡献均超过 85%,已能够代表原始数据的核心信息,故为简化数据结构,下文提取前两个主成分因子展开计算与分析。依据表 3 的方差分析值及公式(7) ,计算“绝对量”距离和“增长速度”距离的权重分别为 0.553 和 0.447,以式(2) 、式(7)为相似性测度便可有效地对创新能力进行静态与动态层级划分。 (二)层级划分结果的对比分析 理论上和实践中的最佳聚类数目没有明确定论(张尧庭 等,2006;李因果 等,20

14、10) ,借鉴报告和现有研究文献(周立 等,2006;毕亮亮 等,2008)将 31 个省(区)市的创新能力划分为 5 类的思路,本文选取 q=2 的欧氏距离为相似性测度,采用离差平方和法(Ward)将静态截面和动态面板的 31 个省(区)市统一聚为 5 类,结果如表 4 所示。 由于没有预先定义的类别标准来表明数据集中哪种期望关系是有效的,聚类模型的分类质量必须要经过定量分析的统计检验。显然,如果模型分类效果显著,则同一类内样本之间的指标离差较小,而类与类之间样本的指标离差较大。考虑到面板数据受截面和时序两个维度因素的影响,其聚类结果的稳定性波动更大,本文以面板数据的聚类结果为方差分析基准,

15、以 10 年的各项指标均值为分析对象,结果如表 5 所示。 表 5 的结果显示,在 0.01 的显著性水平下,5 类省(区)市之间创新指标的差异显著,说明本文拓展的面板聚类模型切实有效,依此所做的结论建议更客观可信。对比表 4 中静态与动态的层级划分结果可以发现,除了江苏、广东和北京的类属结果始终保持一致外,其他省(区)市的所属类别 10 年中相差较大。出现上述情况的原因在于:江苏、广东和北京三省市不仅初始的创新水平领先于其他省(区)市,而且后期的科技创新投入也远远高于其他省(区)市(中国科技发展研究战略小组,2002 年2011) 。初始的“绝对量”领先和后期“相对量”投入的优势使得上述三省

16、市的创新水平始终遥遥领先,与其他省(区)市创新水平的类别界限明显。反观其他 28 个省(区)市的初始创新水平和后期的创新投入并无明显的规律,表现在静态截面聚类结果的类别差距大,所属类别稳定性差。综合考虑静态截面和动态面板的聚类结果可以发现,我国的区域创新能力大致呈现长江三角洲、珠江三角洲和京津地区极化竞争的格局,表明创新能力与经济发展存在显著的正向反馈机制。 表 4 区域创新能力静态与动态层级划分结果 四、结论与建议 本文的研究结果验证了我国省域创新能力的不平衡性。尽管集群创新的区域多元化竞争格局已基本形成,但创新能力东强西弱的阶梯分布格局仍存在。由此得到的政策建议为:进一步增强我国整体的创新

17、能力,必须分集团而不是整齐划一的制定和实施创新政策。一方面,采取适宜措施强化创新能力较强的领先型区域,把提高原始性创新能力和培育战略性新兴产业作为创新建设的重点,鼓励市场化的高新技术企业参与全球的创新竞争;另一方面适度加大创新能力相对较弱地区的科技教育投资,有效整合内外科技资源,加强技术创新的外溢扩散效应,构建功能定位明确、优势互补的集成创新体系。需要强调的是,由于第一主成分的方差贡献最大,体现了创新能力水平的主要方面,在条件受限的情况下,落后区域应该集中精力优先发展第一主成分的影响因素方面,从而带动其它方面的发展,这也是抓住了工作的重心。 参考文献: 毕亮亮,施祖麟.2008.长三角城市科技

18、创新能力评价及“区域科技创新圈”的构建J.经济地理(6):946-951. 李因果,何晓群.2010, 面板数据聚类方法及应用J.统计研究(9):73 一 78. 梁小珍.2011.基于城市金融竞争力评价的我国多层次金融中心体系J.系统工程理论与实践(10):1847-1857. 柳卸林,胡志坚.2002.中国区域创新能力的分布与成因J.科学学研究(5):550-556. 王德青,朱建平,谢邦昌.2012.主成分聚类分析有效性的思考J.统计研究(11): 84-87 王锐淇.2012.我国区域技术创新能力空间相关性及扩散效应实证分析基于 1997-2008 空间面板数据J. 系统工程理论实践(

19、11): 2419-2432. 魏守华, 吴贵生,吕新雷. 2010. 区域创新能力的影响因素J.中国软科学(9):76-85. 肖泽磊,李帮义,刘思峰.2009.基于多维面板数据的聚类方法探析及实证研究J.数理统计与管理(5):831-838. 杨屹, 薛惠娟. 2010. 产业技术自主创新能力的区域差异性研究J.中国工业经济(11):68-76. 张尧庭,方开泰.2006. 多元统计分析引论M.北京:科学出版社. 郑兵云. 2008, 多指标面板数据的聚类分析及其应用J.数理统计与管理(3):265-270. 周立,吴玉明.2006.中国区域创新能力:因素分析与聚类研究-兼论区域创新能力综

20、合评价的因素分析替代方法J.中国软科学(8):96-103. 朱建平, 陈民恳. 2007, 面板数据的聚类分析及其应用J.统计研究(4):11-14. 朱建平,王德青,方匡南.2013.中国区域创新能力静态分析基于自适应赋权主成分聚类模型J.数理统计与管理(5):761-768. BONZO D.C, HERMOSILLA A.Y.2002. Clustering panel data via perturbed adaptive simulated annealing and genetic algorithms J. Advances in Complex Systems 5(4):339-360. FREEMAN C. 1987. Technology Policy and Economic Performance: Lessons from Japan M. London: London Pinter. (编校:育川)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。