1、创新集聚效率实证研究收稿日期:2012-10-20 基金项目:国家自然科学基金项目“从外生性到内生性:基于“双向嵌入观”的跨国公司主导型产业集聚演进研究” (71073018) 作者简介:邱国栋(1960-) ,男,山东潍坊人,教授,博士,博士生导师,主要从事企业管理与创新管理等方面的研究,E-mail: 摘 要:近年来,我国的经济发展取得了举世瞩目的成就,经济发展的一个明显趋势就是创新在经济增长中的作用越来越大。新经济增长理论也已经表明,创新是促进经济增长的重要因素。已有的研究证实创新在地理分布上呈现不均匀状态,表现出空间集聚的趋势。本文利用20002010 年的省域面板数据,根据区位熵指数
2、衡量创新集聚,使用迭代 3SLS 方法估计面板数据联立方程,研究基于创新集聚与经济增长之间双向作用关系的创新集聚效率问题。在此基础上,提出创新集聚效率提升的政策。 关键词:创新集聚;产业集聚;技术创新 中图分类号:F224 文献标识码:A 文章编号:1000-176X(2013)02-0102-07 一、问题提出 自从熊彼特于 1966 年提出创新理论以来,与创新相关的理论与实证研究引起了国内外学者的普遍关注。随着经济地理学的发展,空间视角的创新研究逐渐成为热点领域。在产业集聚的框架内研究创新和创新集聚成为近年来的研究趋势1-2。但是,创新集聚与产业集聚既有关联,又有不同。产业集聚主要强调以生
3、产要素(资本、劳动、技术)为纽带,使相互关联的产业链条相互交织在一起,且在空间上形成平均成本、平均收益的区位优势。张丽华和林善浪指出:生产集中所带来的生产要素的集中并不总是有利于技术创新,当区域的生产集中是由于某一个或几个大型企业的存在所造成的,那么生产的集中并不一定会带来大量的创新产出。创新集聚主要是由于知识溢出与技术扩散在其中发挥作用,知识溢出与技术扩散内核是非关联企业相互协作和相互反馈形成共用效果、互补效果和协同效应,从而形成地域上的集中3。一些传统产业因追求成本收益优势吸附相关企业加盟,在时间的坐标上逐步膨胀,形成产业集聚。但是,由于这些大型企业经营管理过程中的惯性、所属行业的特征和企
4、业自身的创新偏好等原因,并没有形成与其规模相符的创新能力。目前,我国各个行业都面临产业的转型升级和技术革新,因此,在现阶段强调创新集聚及其效率比产业集聚似乎更有必要。 大量的理论和实证研究显示出空间与技术创新存在密切联系。Amin和 Robins 基于大型跨国公司为主体的视角,认为“大型跨国公司占据主导的研发活动和由此带来的技术创新会在特定的区域内集中”4,Simmie 从单体企业的角度,认为企业研发的持续和深入必然促使企业创新行为变得频繁和丰富,使得企业之间的分工和专业化变得重要,协同创新也必然要求持续的研发建立和维持活动在特定区域内5。刘璐认为特定的空间区域是技术创新的环境,也是影响技术创
5、新的重要因素,空间与创新的关系将成为创新理论中研究的前沿问题6。在国内外理论研究基础上,很多学者开始利用实证研究的方法研究创新集聚问题。李志刚等采用 OLS 方法以专利授权量度量了我国创新行为的不均衡性7。张明倩采用空间基尼系数测度了我国制造业创新活动的区域聚集程度,发现制造业创新活动具有很强的区域不均衡性8。张玉明和李凯利用专利数据,使用区位基尼系数和 MoranI 指数反映出我国省域区域创新产出呈现空间集聚和空间依赖的特点,并非随机分布9。余泳泽运用空间面板计量方法研究了创新要素集聚、政府支持与科技创新效率之间的关系,结果表明:我国科技创新效率具有明显的空间相关性。因此,创新在地理分布上呈
6、现出不均匀状态,表现出空间集聚的趋势10。 创新集聚之所以备受关注,主要是由于创新对于一个国家而言能够促进经济快速健康发展,提升产业结构升级改造,带来经济活力。创新集聚更是能够加速经济增长的步伐,洪名勇11从新经济增长理论的视角将经济增长和科技创新整合为一个理论分析框架, 通过建立计量分析模型对我国大陆 30 个省市区做了实证分析,因西藏自治区数据不全未包括在内。并从研究结果中发现科技创新的差异是我国区域经济非均衡增长的重要因素之一。区域经济增长可能存在着多个稳态,影响经济增长稳态的多因素的耦合、技术扩散的空间效应等有可能使得一定区域组内部各区域之间的经济增长逐步走向趋同。范柏乃等以国家统计局
7、发布的19532002 年度统计数据为基础,采用广义差分回归分析,并建立了相关的数学模型,揭示科技投入与经济增长之间存在十分明确的单向因果关系12。Solow 将科技进步从生产函数中分离出来,进一步揭示了科技进步与经济增长的关系13,郭新力以 20002003 年表征区域经济水平及技术创新能力的相关数据为基础进行回归分析, 研究了我国区域创新能力对区域经济增长的贡献14。 综合关于创新集聚的现有文献来看,虽然创新集聚促进经济增长成为理论界和实业界的共识,但是,现有文献存在两个方面的不足:(1)很少研究创新集聚效率问题;(2)多数文献将科技作为外生变量,仅考虑创新对经济增长的单向促进作用,鲜有文
8、献将创新集聚与经济增长作为一个系统研究二者之间的关系。创新集聚与经济增长双向影响机制被大多数研究者忽略了,导致创新集聚效率估计的结果产生偏误,这也是此类文献因存在着理论上的局限性而受到的主要质疑之处。基于此,本文将创新集聚与经济增长作为一个整体来研究创新集聚效率问题,研究创新集聚与经济增长之间存在的双向作用关系,在此基础上提出创新集聚效率提高的路径。 二、研究设计 目前,用于衡量单体集聚的指标主要包括:赫芬达尔指数(HI) 、区位熵(LQ) 、空间基尼系数(G)和 Ellison-Glaeser 指数(E-G 指数) ,空间集聚主要集中在后三个指数。本文参照张丽华和林善浪3的做法,采用 LQ
9、指数来衡量某一地区技术创新集聚水平。之所以没有选择 G 指数和 E-G 指数,其主要缘于(1)创新是一个综合性的指标,仅仅依靠某一个指标来度量,如专利申请授权数量,有失偏颇。LQ (Location Quotient)指数因消除了量纲的影响,从而可以利用多个指标取算数平均值的做法构建综合 LQ 指数,反映技术创新集聚水平;(2)G 指数和E-G 指数只能从产业层面反映全国创新集聚水平,不能反映单个地区相对于全国的创新集聚程度,这使面板数据分析难以进行,这也是本文没有使用其衡量创新空间集聚的主要原因。但为了证明创新集聚的存在,本文从全国整体来考量,使用 E-G 指数来反映创新集聚的存在和趋势。其
10、公式如下: EG=Mi=1(si-xi)2-(1-Mi=1x2i)H(1-Mi=1x2i) (1-H) 其中Mi=1(si-xi)2 为空间基尼系数;xi 代表 i 地区考察参数(就业人数、工业产值、销售收入或固定资产等)占全国对应考察参数的比例,H 代表衡量市场集中度的赫芬达尔指数。E-G 指数需要使用企业数据来计算市场集中度,然后计算得到市场占有率的平方和。但目前除了微观层面的调查数据以外,我们无法从现有公开公布的数据中得到衡量高技术企业市场集中度的详细数据,因此无法直接运用上式计算 E-G指数。本文遵从 Paulo 以及国内学者詹宇波和张卉修正 E-G 指数的做法15-16,对 EG 指
11、数进行修正。修正后的 E-G 指数用 EG 表示,公式如下: EG=Mi=1(nin-xi)2-(1-Mi=1x2i)1n(1-Mi=1x2i)(1-1n) 为了使 E-G 指数体现创新集聚的异质化,本文选取 20002010 年高技术产业作为主要研究对象,其中 ni 代表 i 地区高技术产业企业数,n代表全国高技术产业企业数,其他指标含义同 EG 公式。根据 EG指数,2000 年该指数为 0.04,2010 年为 0.12,基本呈现上升趋势,根据 Ellison 和 Glaeser 对系数的分类可知,EG0.02 为低度集聚,0.02EG0.05 为中度集聚,EG0.05 为高度集聚,由此
12、可知,目前,我国技术创新的空间集聚呈现高度集聚状态,具体集聚趋势如图 1所示。 LQ 指数是指一个地区特定产业的度量指标在地区总指标中所占的比重与全国该产业度量指标在全国总度量指标中所占比重之间的比值。LQ经常用于衡量一个地区指标和全国平均指标之间的差异,以此来评价该地区的专业化水平和优势度,LQ 值越大,专业化水平和优势度越高,一般来讲,如果产业的 LQ 值大于 1.50,则该产业在当地就具有明显的比较优势。本文利用 20002010 年的省域面板数据,根据考察参数构建 LQ指数,衡量创新集聚。本文采用兼具截面数据(各省份)和时序数据(20002010 年)的面板数据,原因主要有两个方面:一
13、方面,就样本数据量而言,面板数据包含较多数据点,因而带来较大的自由度,截面变量和时序变量的结合信息能够显著地减少因缺省域变量所带来的异质性问题;本文用面板数据的数据结构,主要是为了控制个体异质性。因为每个省份都有自身的创新行为,这些行为对创新决策过程有影响,但又无法观测,利用面板数据,可以降低因异质性所导致的实证结果参数偏误。另一方面,更为重要的是,创新集聚与经济增长不仅具有时序维度特征,同时也具有截面特征,即不仅单个省域创新集聚与经济增长关系将随着经济发展水平的变化而改变,而且不同发展水平的省域创新集聚与经济增长也存在双向反馈机制。因此,结合时序和截面两维信息的面板数据,利用 3SLS 方法
14、对建立的联立方程进行估计处理的实证研究中必然存在内生性问题,能够反映出经济增长差异和地区异质性对创新集聚的综合影响。 三、数据与模型 1.数据与样本 本文选取的样本为 20002010 年 30 个省市自治区省域面板数据。数据主要来自中国科技统计年鉴 (19992011 年) 、 中国高技术产业统计年鉴 (19992011 年) 、 中国统计年鉴 (19992011 年) 。为消除价格因素的影响,对相关指数进行了价格平减处理:以各年按当年价格计算的国内生产总值(名义 GDP)和各年 GDP 的实际增长率折算出以2000 年为基期的实际分地区各年度国内生产总值(实际 GDP) ,用同样的方法,固
15、定资本投资用固定资本投资价格指数进行调整,折算出以 2000年为基期的实际固定资本投资额;劳动力用各年从业人员来衡量,由于年鉴上提供的是人口和从业人员各年底的数据,因而本文选取的人口和从业人员相邻两年年末数据平均值来计算分地区各年度人口和从业人员数。对于创新集聚指数 tinnit 的计算,本文按照 LQ 指数的算法,用区域高技术产业总产值占全国比重/区域 GDP 占全国比重代表省域创新集聚指数(tinnit ) 。 2.描述性统计 为了反映数据的各种特征,以便于描述测量样本的各种特征及其所代表的总体特征,本文对样本数据进行了描述性统计分析,为了增加变异,dGDP 取百分数,具体统计分析结果如表
16、 1 所示。 通过描述性统计,本文使用的是平衡面板数据,共有 330 个观测值,两个关键变量 tinn 和 dGDP 都有足够的变异。 图 1 中国 20002010 年度创新集聚与 GDP 增长趋势图表 1 创新集聚变量描述性统计 3. 模型介绍 本文主要应用的是新经济增长理论,采用的模型由 CD 函数改进,建立如下联立方程模型: tinnit=i+1dGDPit+2lnpatit+3lntpit+4rdfinit+it(1) dGDPit=i+1tinnit+2lnkit+3lnlit+uit(2) 在联立方程模型中,方程(1)代表创新集聚方程,方程(2)代表产出方程。下标 i 代表横截面
17、,t 代表时间。其中 dGDP 表示各个区域的国内生产总值增长速度;tinn 表示创新集聚指数;在创新集聚影响因素的选择中,本文遵从 Audretsch 和 Feldman 的研究结论,知识和技术的溢出能够形成独特的区位优势,从而吸附相关高技术产业形成集聚,也就是知识和技术的溢出影响创新集聚17,选择 pat、tp、rdfin 三个变量,以代表知识溢出和技术溢出。pat 为三种专利(发明、实用新型和外观设计)申请授权数量;tp 为高技术企业科技活动人员数量;rdfin 为研发经费投入占财政支出的比重。为减少异方差,变量 pat、tp 取对数。k 表示各区域的固定资本投资;l 表示区域的人力资本
18、投入;i 和 i是联立方程的特定截面效应;uit 和 it 是联立方程的特异误差项。 四、实证结果及分析 1.内生性问题 内生性问题是实证研究中普遍存在的问题,根据计量经济学理论,如果创新集聚与经济增长是单向因果关系,即若 tinnit 是外生的,联立方程估计量因具有较大的标准误,而使估计结果不如 OLS 估计量有效。因此,检验 tinnit 的内生性便非常必要,同时也印证了创新集聚与经济增长是单向还是双向因果关系。本文通过面板数据部分解决了模型遗漏变量所导致的估计参数偏误,但仍旧可能存在解释变量和被解释变量相互作用、相互影响、互为因果的情况导致的内生性问题。对此,本文利用 Hausman 检
19、验来判别内生性问题在本模型中是否存在。首先,使用tinnit 对 lnkit、lnlit、patit、tpit、rdfinit 进行 OLS 回归,得到残差 Vit;然后将 Vit 作为解释变量加入方程(1)中,并用 OLS 回归方法检验 Vit 的显著性,结果发现 Vit 的系数在 1%的显著性水平上显著异于零。所以,tinnit 确实是内生的,使用联立方程进行估计是合理有效的。在内生性问题处理的估计方法选择方面,联立方程估计方法有单一方程估计法和系统估计法,单一方程估计法因为忽略了模型中方程之间的联系,这种联系即包括变量之间的联系,也包括方程扰动项之间的联系。所以不如所有方程作为一个整体进
20、行估计,即系统估计法更有效率。因此,对联立方程的单一方程估计法必然是有偏的。基于此,本文选择既考虑了模型解释变量和被解释变量互为因果,又考虑了特异误差项 uit和 it 相关的处理方法 3SLS。3SLS 将 2SLS 和 SUR(似不相关回归)方法相结合,很好地规避了联立方程存在的内生性问题。 2.联立方程估计结果 为了进行对比分析,本文使用了四种估计方法,分别是普通最小二乘法(OLS) 、两阶段最小二乘法(2SLS) 、三阶段最小二乘法(3SLS)和迭代三阶段最小二乘法(3SLS_ITR) 。OLS 因忽略了模型中方程间创新集聚与经济增长的交互联动以及误差项的相互影响,所以估计结果并不可信
21、,从表 2 各列的比较分析看被估参数存在较大差距,而且 lnk 和 lnl的贡献有为负的情况,这明显与理论预期不符,这些都证实了创新集聚与经济增长双向影响机制一旦被大多数研究者忽略,导致创新集聚效率估计的结果存在明显的偏误,据此得出的结果也会受到严重质疑。这也进一步证实了本文从创新集聚与经济增长相互影响的角度研究二者之间的关系是合理的。对于表 2 的 2SLS 估计方法因忽略了模型中 uit 和 it两个特异误差项的相关性,这也导致了 2SLS 估计方法不是最有效率的。本文的估计结果选择综合考虑了联立方程系统因素的 3SLS 估计方法。对于 3SLS 估计方法,本文在以后部分中,采用统一使用多次迭代直至收敛的迭代 3SLS 方法(3SLS_ITR)得到的数据进行结果分析,如表 2 所示。 表 2 创新集聚与经济增长相互影响的估计结果说明:其中*、*、*分别代表 1%、5%、10%的显著性水平。T_Year 表示年度虚拟变量的联合显著性检验的 t 值。R2 为联立方程估计结果的拟合优度。3.创新集聚方程估计结果分析 对于创新集聚方程估计结果而言,本文主要考虑两个方面:(1)经济增长对创新集聚作用是否具有统计上显著的正效应;(2)创新集聚对经济增长是否具有统计上显著的正效应。