1、对天津市科技型中小企业数量基于时间序列的预测摘 要:大力发展科技型中小企业,是天津市十二五期间的一个重要的战略举措。三年多以来天津市科技型中小企业快速发展,目前总数累计已达 5 万家。在看到企业数量不断增长的同时,把握这种发展内部所存在的统计规律,并利用这种规律指导今后的工作,对于天津市科技型中小企业未来一段时间更好的发展大有益处。故本文针对我市科技型中小企业数量,使用时间序列模型进行拟合,并基于拟合的模型对未来天津市科技型中小企业的数量进行预测。 关键词:科技;中小企业;预测 1 研究的目的与意义 2010 年 9 月,市委、市政府召开了加快科技型中小企业发展动员大会,颁布了市委、市政府关于
2、加快科技型中小企业发展的若干意见 ,启动实施了天津市科技小巨人成长计划。三年多以来,全市上下形成合力,各区县、各单位、各部门积极行动、认真落实,科技型中小企业呈现出蓬勃发展态势。 截至 2013 年底,我市科技型中小企业累计达到 49212 家,从不同阶段的企业数量分布来看,初创期企业是我市科技型中小企业的主体,共38851 家,占全市科技型中小企业总数的 78.95%;成长期企业 7867 家,占全市总数的 15.98%;壮大期企业 2494 家,占全市总数的 5.06%。 (以上数据来源为科服网,科服网为整合政府和社会资源的网络信息平台,现已成为科技型中小企业发展工作的在线管理平台、数据统
3、计监测平台和企业综合服务平台。 ) 天津市科技型中小企业在启动的三年多以来,科技型中小企业一直呈现出蓬勃发展的态势,科技型中小企业的数量一直在不断的增长。但是目前普遍缺少对我市科技型中小企业数量增长规律的研究,如何对这种增长的规律用合适的模型进行适当的分析,用科学的的手段掌握发展的内在规律,基于这一规律对科技型中小企业今后一段时间的发展做出预测,以便相关部门更好的针对预测出的结果安排工作,有着重要的意义。故本文使用自 2010 年 9 月科技型中小企业发展工作启动以来的科服网数据库资料,基于时间序列模型,首次拟合和预测了天津市科技型中小企业在初创期、成长期和壮大期的科技型中小企业数量。 2 时
4、间序列模型 时间序列模型是由 Box 和 Jenkins 于 70 年代初提出的著名预测方法1,几十年来,时间序列模型方法在应用中不断成熟和进步,在经济学、商学、工程学、自然科学以及社会科学等诸多领域都有着广泛的应用,为人类生产力的发展做出了巨大的贡献。目前,时间序列模型在预测人口、GDP、空气污染、能源消费和火灾风险等多方面得到了广泛而成功的应用2-6。 移动平均法、加权移动平均法、指数平滑法和回归预测法是目前比较常用的预测方法。移动平均法受计算期数影响,预测值仅与近期有关,与计算期以前的数据无关,与客观情况不尽相符;加权移动平均法需要预测者对序列进行了解和分析;指数平滑法预测值受数值大小的
5、影响较大,取值不当,预测值出现的偏差就大;回归预测法比较机械,不易灵活掌握,对信息资料质量要求较高。相比于这几种方法,使用时间序列模型进行预测可以充分利用所有的数据,充分反映数据的自相关关系,能更好的贴近数据的真实情况,达到更加准确的预测效果。 时间序列模型是由自回归移动平均(ARMA)模型组成,包括纯自回归(AR)和纯移动平均(MA)模型作为特例。 在自回归模型中,过程的当前值为由有限的过程先前值的线性组合和一个冲击 所构成。由 来记等间隔时间 上的值,且记 为关于 的序列偏差,所以有: (1) 被称为 p 阶自回归过程,记为 AR(p) ,因为式(3-1)是变量 X 对其自身过去值的回归,
6、所以称为自回归模型。 当 还表示为 的无线加权和时,模型就变为移动平均模型,使 线性依赖有限的 q 个 的过去值,于是有: (2) 称为 q 阶移动平均模型,记为 MA(q) ,其中乘在 上的权数 不必综合为 1,也不必是正的。 为了使实际中拟合的时间序列有更大的灵活性,可以将自回归和移动平均项一起纳入模型中,这就是自回归移动平均混合模型: (3) 此模型记为 ARMA(p,q) 。 3 数据分析 图 1 所示的三张图分别为从 2010 年 9 月至 2013 年 12 月初创期、成长期和壮大期天津市科技型中小企业的数量,从图中可以看出三个时期的企业数量在三年多的时间中一直呈现快速增长的趋势。
7、由于 2010 年 12月的数值存在一定程度的突发性,当时是由于各区县科委处于集中申报时期,与其他数值的相关性不强,故从序列中删除 2010 年 12 月的数值。从图中可以直接看出,三个序列均为非平稳序列,故分别对其进行一阶差分,差分后的序列见图 2。 从图 2 中可以看出,三个序列都始终在一个常数值附近随机波动,而且波动的范围有界,若观察值序列的时序图显示出该序列有明显的趋势性或周期性,那它通常不是平稳序列,故可以认为差分后的序列为平稳序列。使用 Minitab 软件分别计算三个序列的自相关和偏相关函数,结果见图 3。 (a)初创期 (a)初创期 (b)成长期 (b)成长期 (c)壮大期 (
8、c)壮大期 图 1 2010.9-2013.12 图 2 差分后的 科技型中小企业数量 科技型中小企业数量 (a)初创期 (b)成长期 (c)壮大期 图 3 三个不同时期天津市科技型中小企业数量差分序列的自相关和偏相关函数 从图 3 中可以看出,三个序列均存在一定程度的自相关性,故可以使用 ARIMA 时间序列模型对其进行拟合。使用 JMulti 软件分别对三个序列的模型阶数进行检验,结果显示三个序列为一阶自回归模型 AR(1) 。使用 Minitab 软件分别对三个序列进行拟合,结果如下: 初创期:Xt=542.25+0.3844Xt-1+t 成长期:Xt=89.27+0.3918Xt-1+
9、t 壮大期:Xt=17.54+0.6128Xt-1+t 处于三个时期的科技型中小企业数量都存在一定程度的自相关性,说明了我市科技型中小企业数量的增加与之前的企业数量有着一定程度的关系,并非独立的数值。故基于拟合的时间序列模型对我市今后三年时间每季度的科技型中小企业数量进行预测,结果见表 1: 表 1 三个不同时期天津市科技型中小企业数量的预测值 (a)初创期 (b)成长期 (c)壮大期 从表 1 中可以看出,预计到 2014 年年底我市的初创期科技型中小企业可以达到 49081 家,成长期科技型中小企业可以达到 9560 家,壮大期科技型中小企业可以达到 2989 家,总数可以达到 61630
10、 家。2015 年年底初创期科技型中小企业可以达到 59653 家,成长期科技型中小企业可以达到 11324 家,壮大期科技型中小企业可以达到 3529 家,总数可以达到74506 家。2016 年年底初创期科技型中小企业可以达到 70225 家,成长期科技型中小企业可以达到 13088 家,壮大期科技型中小企业可以达到4069 家,总数可以达到 87409 家。 2014 年 1 月底,我市初创期科技型中小企业达到 39111 家,成长期7824 家,壮大期 3168 家,总数 50103 家。基于时间序列模型的预测值分别是 39525 家、7972 家和 2520 家,总数 50017 家
11、。从结果可以看出,预测值与实际值相差并不大,此方法具有一定的可信度,可以用来对今后一定时间的科技型中小企业数量进行预测,且预测结果可以用来指导相关部门的工作,可以更早的对发展趋势进行把握。 4 总结与发展建议 对我市科技型中小企业数量使用时间序列模型进行预测是基于数据内部的纯统计规律进行的分析,抛开了政策因素和组织因素等外部影响条件,在使用上会存在一定的误差,但是其揭示的数据内部的规律是客观存在的,我市科技型中小企业的数量存在着自相关性,而利用这一自相关性进行的预测具有一定的科学依据,是可以用来指导今后一定时期的工作的。模型的建立是基于 2010 年 9 月至 2013 年 12 月的历史数据
12、的基础上,随着今后数据的不断积累,基于时间序列模型的预测会更加准确。 从计划启动开始的三年多以来,我市科技型中小企业共提供了 50 万个就业岗位,在科技型中小企业就业的人数占全市就业总人口的 25%,从业人员年均收入达到 6 万元,比全市企业职工平均工资高出 40%。科技小巨人成长计划实施取得显著成效,对我市经济发展、产业结构调整、创新能力提升和社会事业进步等方面做出了重要贡献。因此,科学的分析方法和务实的工作对于进一步发展我市科技型中小企业有着十分重要的作用,基于成熟的统计模型的数据分析的方法值得进一步研究和推广。 参考文献: 1BOX G,JEKINS G M,REINSEL G C.时间
13、序列分析预测与控制M.顾岚, 范金城译.北京:中国统计出版社,1997. 2杨君哲,吴静,王娟. 中国人口数量的时间序列分析J. 科技信息,2012,32:139-140. 3徐世香. 对我国 1978 年-2009 年的 GDP 时间序列分析基于1978 年不变价格J. 中国商界,2013,3:193. 4鲍玉星,晓开题依不拉音,吴文华. 乌鲁木齐大气污染与呼吸系统疾病日住院人数的时间序列分析J. 新疆医科大学学报,2013,4(36):537-542. 5胡俊娟. 中国能源消费的时间序列分析J. 浙江科技学院学报,2013,25(3):164-167. 6姜立平,张晓琚. 城市火灾风险的时间序列分析J. 消防技术与产品信息,2013,8:8-12.