1、ARIMA 模型在区域人口预测的应用分析摘要:通过时间序列的推移以及人口相应年龄段的死亡变化情况,对人口数量、结构等方面的数据进行预测是人口学常用方法之一,也就是人口年龄移算,这种方法主要运用的是 ARIMA 模型的推演。本文将以Q 市数据为例,主要以六普静态数据为基础,结合六普之前五年人口变化趋势,进行 ARIMA 模型的实例分析。这在“两孩政策”全面放开的背景下,对政策效果实施前后效果变化进行评估等方面具有非常重要的借鉴意义。从人口的机械变动方面看区域人口数量变化:人口变化主要受内部推力和外部拉力的作用。区域经济、文化等方面发展现状对区域人口流出与流入产生有重大影响,把区域人口自然变动与区
2、域机械变动综合考虑,最终做出科学的区域人口预测。 关键词:人口预测;年龄别死亡率;分性别死亡率;育龄妇女;预期寿命 2015 年 10 月底,党的十八届五中全会召开,最引人注目的就是十八届五中全会公报允许普遍二孩,这就意味着我国将会全面放开二胎政策,对人口的变化态势有一个清楚的认识或者科学的预测是非常重要的,这关系着国计民生的发展,这意味着不仅在宏观上对人口结构做出调整,影响着整个经济社会的发展态势,也与千千万万个家庭生命周期的变动息息相关。 人口预测就是根据现有的人口状况并考虑影响人口发展的各种因素,按照科学的方法,测算在未来某个时间的人口规模、水平和趋势。ARIMA模型全称为“自回归移动平
3、均模型” (Autoregressive Integrated Moving Average Model) ,该模型充分考虑时间序列下人口数量的变化的一项综合分析技术。因为全面二孩的放开必然会引起出生水平的变化,同时对于相应的妇幼保健等社会保障体系也提出相应的高要求。本文以人口的自然变动为对象,在 Q 市 2010 年六普常住人口数据基础上对未来十年的人口数据进行预测,通过 Excel 表格统计,预测内容包括未来十年的出生人口、分性别分年龄人口数量,以及人口分性别预期寿命等数据。 一、人口自然变动预测所需数据简述 因为在十八届五中全会公报中提出了普遍二孩政策,也可以通过以后生育水平的变化来对比
4、政策变动前的人口结构等方面的变化,也能为新的人口政策的效果评估提供相应的支持。在 ARIMA 模型的应用中,将会用到 Q 市六普人口年龄别死亡率 Dn (右下角标 n 代表相应年龄) 、六普人口分年龄分性别死亡率(男性为 Dnm,女性为 Dnf) 、分年龄人口数Nn、分性别分年龄人口数(男性为 Nnm,女性为 Nnf) ,分年龄性别比,另外还有育龄期女性数量(NB)以及育龄期女性总体生育率(Bn ,n 代表相应年龄) 。 1、人口年龄别死亡率 Dn 与人口分年龄分性别死亡率 人口分年龄别死亡率是人口预测的基本要素,它决定着预测人口群体的预期寿命,影响着社会的社会幼儿抚养比与老年抚养比这两个社会
5、重要负担指数。具体来讲,人口分年龄别死亡率就是某一年龄阶段的死亡人口数量占相应年龄阶段人口总数的比例,按千分数来计。例如 Q 市在六普中,01岁人口数 6140 人,其中男性 3318 人女性 2822 人,男性死亡人数为 22 人女性死亡人数为 31 人。那么就可以计算出男性在此年龄段的死亡率 D0m 为 6.63,女性在此年龄段的死亡率 D0f 为10.99,在此年龄段的总死亡率 D0 为 8.63。从数据中可以看出 Q 市的出生性别比(只考虑活产婴儿数)是 117.6,远高于合理的出生性别比范围上限 107,另外在此年龄段女婴死亡率要高于男婴,综合这两方面因素可以看出,这是非常不利于本地
6、人口结构中的男女比例走势的。 2、分年龄人口数 Nn 与分性别分年龄人口数 在人口自然变动中,分年龄人口数的按年数序列走势变动情况是每个年龄段死亡率直接后果。单纯考虑生命周期因素,处于相同年龄的人口数量是递减的,这就形成了总体人口的死亡率。但是由于处于育龄期的女性这一人口再生的承担者,人口就可以得以源源不断的延续下来。 本文在 Q 市人口数据推演中,以六普静态数据为基础,假定人口以当前的再生速度逐年变化来计算处于某一年龄段未来十年的变化。 例如在上面提到的六普数据:男性在 0 岁段的死亡率 D0m 为6.63,女性在 0 岁段的死亡率 D0f 为 10.99,在 0 岁段的总死亡率D0 为 8
7、.63,另外 0 岁断男性 3318 人,0 岁段女性 2822 人。上述数据为六普统计的在 2010 年的静态的数据,0 岁段人口在 2011 年按照时间序列来看,自动变为 1 岁段人口,1 岁段人口正是 0 岁段人口数量减去 0 岁段人口死亡数量,也就是 0 岁段人口能存活至下一年的数量就是我们所要预测的在人口自然变动下 1 岁段人口数量。 同样的,2011 年的 2 岁段人口我们用 2010 年的 1 岁段人口来计算,也就是 2010 年的 1 岁人口减去相应的岁数群体的死亡数量。后面年龄的人口数量以此类推,最终止于 100 岁年龄段,100 岁以上年龄段由于人口很少,本文在预测中将 1
8、00 岁以上的人口划归为一组。 3、育龄期女性数量 NB 以及育龄期女性总体生育率 Bn 在上面的人口推移中,我们很容易发现一个问题,那就是 2011 年的新生人数从何计算,到后面 2012 年 0 岁和 1 岁人口数量也是不知道的,后面的 2013 年、2014 年直至 2020 年 1-9 岁的分年龄段人口数量都不存在的,这部分人口又怎样计算呢?这就需要我们看育龄期女性的数量以及这一群体的生育率水平了。 育龄期数量和生育率水平仍是根据六普静态数据来看的,人口学对育龄期妇女的年龄规定是 15-49 岁,在本文中,我们按照人口学规定来计算以及预测。在 Q 市的六普数据中,15-49 岁的育龄期
9、妇女总数为131901 人,而 2010 年活产婴儿数为 6140 人,这样生育率水平就得出为46.55。我们将假定 2010 年未来十年生育率水平稳定不变,那么通过对后面相应年份的育龄期妇女进行预测,我们将得到 2011 年的 0 岁婴儿数量为 2011 年 15-49 岁育龄期妇女数量乘以 46.55,2011 年 15-49 岁人口数量为 152049 人,那么 2011 年的 0 岁组人口数量为 7078 人,同样2012 年缺失的 0 岁组与 1 岁组人口也可以相应的求出来,以此类推将会得到 2013 年 0-2 岁人口数据、2014 年 0-3 岁人口数据2020 年 0-9岁人口
10、数据。 二、人口自然变动在人口预测应用 在根据 Q 市六普数据进行人口预测后,还可以对分年龄分性别人口数量进行预测,当完成分年龄分性别人口数量预测后就能对 Q 市人口预期寿命以及分性别预期寿命进行预测了。 首先是分性别人口预测,难点在于怎样对新生人口性别作出预测。在这里本文将不再单纯采用六普静态数据,而是借鉴 2006-2010 年五年的性别比,性别比数据均来自 Q 市的人口统计数据。通过对五年的分年龄性别比进行加权求平均值,最终确定新生婴儿的出生性别比。例如从06 年至 10 年,Q 市 0 岁人口性别比分别为 121、120、109、116、117,那么进行加权求均值以后出生性别比为 11
11、6.6。所以本文按照 116.6 的性别比,结合分性别分年龄死亡率来推算随后几年的男女人数。 当利用 ARIMA 模型完成上述预测步骤时,我们就可以利用人口学平均寿命计算公式来预测预期寿命了,平均寿命计算逻辑是某一固定群体他们存活的总年数闭上这一群体的数量。本文上面所做的人口预测就是看某年出生的那群人经过逐年的死亡概率最终全部死亡的过程,最后超过一百的人口因为数量较少,且不会超过一百岁太多,在计算过程中暂且按照 100 岁来计算。具体公式如下(1.1): 简单来讲就是活一年而死亡的人数乘以 1,活两年而死亡的人数乘以2活一百年而死亡的人数的乘以 100。一百年以上的因为数量少,为了方便计算也乘
12、以一百。这样全体人口能够存活的年龄总和再除以相应年份死亡人口的总数,就得出这一年的人口平均寿命。因为我们可以通过 ARIMA 模型对相应年份的人口数据作出预测,包括分年龄分性别死亡数量,我们就能计算出预期总体平均寿命和分性别预期平均寿命。 三、人口机械变动预测所需考虑因素 人口在社会经济发展过程中起着决定作用:人口的数量、质量等因素是区域发展重要考虑的问题,在 Q 市近年来的发展中,很难留住高素质人才以及大量劳动力的流失一直制约着本地区的发展。新的社会规划中就将重点提到人口这一因素,提出相应人口变化指标。人口机械变动和自然变动是完全不同的两个概念,自然变动是依靠相对稳定的人口出生率与死亡率,而
13、机械变动就要看之前几年的人口变化趋势结合经济发展趋势,找出机械变动与经济等因素的相关性规律。区域经济的发展、生活水平的提高等因素不仅可以留得住人口,也能起到吸引人口的作用。奥肯对美国经济发展的研究,得出奥肯定律。奥肯定律是指随着经济发展,社会失业率有规律下降,并且指出相关指数关系。但是这在我国是不适应的,我国经济发展与失业率的关系表现为经济发展速度是大大高于失业率的降低幅度的。因为后发的中国经济发展所走的资本不断深化道路,伴随着劳动生产率的提高,实际上对于劳动力的需求并没有预期中那么大,甚至有个别企业行业会缩减行业从业人口。另外,产业结构调整带来的产业区域转移必然会影响人口动态:Q 市因为把生
14、态保护放在重要位置,所以在经济发展过程中对于重工业的迁入是持非常谨慎的态度。对于传统的农耕区采取了引导当地村民发展旅游业,通过服务行业来创收。但是也有学者对于区域经济与人口的关系研究,研究指出在 SPSS 分析结果中,生产总值与人口数量存在着 0.825 的强相关关系。环境社会学家陈阿江曾经对“不可持续发展”做出如下判断:以破坏生态环境为代价来换取经济效益是不可持续发展道路,但是以贫穷状态持续下去也是一种不可持续发展。Q 市马上出台新的五年规划,从政府办公室获悉,在这五年规划当中,对经济发展、生态保护以及人口指标都将提出具体要求。生态环境政策在 Q 市也影响着人口的发展,生态政策会引导甚至是带
15、有强制色彩的行政命令,造成区域人口的迁移,可能在短期可能会造成一些人口的经济收入下降,但是对于区域经济的长远发展是非常有利的。这对于政府也提出了相应的高要求:在政策制定与实施中,要与政策承受者进行换位思考,不仅能考虑到区域的发展,也能兼顾到群众的切身利益。 Q 市近年来人口流动情况是流出大于流入,但是流出趋势是减缓的,一方面是因为本地区的产业发展留住了很多劳动力,另一方面 Q 市开始重视人才的培养与吸引。对于人口的迁移状况,可以根据近年来的流动趋势,结合未来将要发展的产业数量、产业规模,考察劳动力吸纳情况。四、讨论 单纯的依靠年龄推移来计算区域人口虽然符合生命走势展规律,但是因为人口个体是具有
16、自主意志决定自身空间区位的,所以要相对区域人口的变动做出预测,一定要结合未来可能的机械变动,而机械变动某种程度上也是可预见的。一个区域将要调整的产业结构、将要发展的项目都是有规划的,这会带来多少人口新的就业、将会吸引多少人口都是可以预测的。另外,由于区域规划的需要,或许出于经济发展考虑,或许出于环境保护的考虑,人口的动向都应是政府实时掌握以及提前预见到的。Q 市由于在新的规划中,将会迁移一个生态保护区的全体人口来保护生他环境、发展旅游业,另外引入新的铝厂、火电厂等实业来发展经济。如果在未来几年,相应的工作规划能够达到的话,那么再结合人口的自然变动,人口预测将会对社会发展具有重要风向标作用。 十
17、八届五中全会公报允许普遍二孩,这是我国计划生育政策的重大调整。人口预测必须以事实为依据,重新考察以往数据的适用性,做出人口学具有学科背景的理性判断。通过科学方法对人口做出预测不仅对于经济社会的发展做出导向作用,也为政策的评估提供科学依据。 注释 安和平:中国人口预测的自回归分布滞后模型研究 , 统计与决策2005 年第 16 期,第 47 页。 在此处 0-1 岁人口统计为活产婴儿数量,死亡婴儿数量为出生以后未满一岁的婴儿数量。 李晓嘉,刘鹏:我国经济增长与就业增长关系的实证研究 ,国民经济管理2005 年第 5 期 2528 页 参考文献 1 安和平.中国人口预测的自回归分布滞后模型研究J,
18、统计与决策,2005,16:47. 2 王婷,王国梁.清徐县人口的时空变化特点及原因分析J.山西师范大学学报,2015,1:123128 3 涂雄苓,徐海云.ARIMA 与指数平滑法在我国人口预测中的比较研究J,统计与决策,2009,16:2123. 4 马晓红,侯亚非.北京未来 50 年人口变动趋势预测研究J,市场与人口分析,2004,2:4649. 5 田飞.21 世纪初人口场景预测研究回顾J,人口与发展,2010,2:4851. 6 李晓嘉,刘鹏.我国经济增长与就业增长关系的实证研究J,国民经济管理,2005,5:2528 7 温勇,尹勤,帅友良.人口统计学M.南京:东南大学出版社,2006:285295. 8 陈阿江.次生焦虑太湖流域水污染的社会解读M.中国社会科学出版社,2010 (责任编辑:梁 蒙)