1、基于 ARIMA 模型的贵州省农业总产值预测分析摘要:贵州省农业总产值是反映贵州省农业生产的总规模和总水平的重要指标。文章利用时间序列分析理论,对 1978 年至 2010 年的贵州省农业总产值进行了分析,建立了 ARIMA 模型并以此对贵州省农业总产值做了分析与短期预测。 关键词:贵州省;农业总产值;ARIMA 模型;短期预测 一、引言 农业总产值反映的是一个国家或地区农业生产的总规模和总水平。随着改革开放的深入,农业问题一直都是我国政府工作的重中之重。时间序列分析是用一段时间的一组属性数值发现模式从而来预测未来值,ARIMA 模型是较为常用的用来拟合平稳序列的预测模型。 二、ARIMA 模
2、型简介 ARIMA 模型全称为差分自回归移动平均模型,又被称为 Box-Jenkins模型或博克思-詹金斯法。模型的基本思想是:预测对象会随着时间推移而形成的数据序列被视为一个随机序列,用数学模型来近似描述这个序列,并认为该序列会按蕴含的规律遵循下去。这个模型被识别后就可以从时间序列的过去值及现在值进行外推,以此来预测未来值。而 ARIMA模型在实证研究中被研究人员广泛运用于时间序列分析和模型预测领域。ARIMA 模型研究的对象是平稳时间序列,因此对一个离散的时间序列进行建模时,应当首先考察其平稳性,再分析和判断时间序列的生成过程。根据生成机制的不同,ARIMA 模型实包含 3 种类型的模型:
3、 (一)AR 模型 AR 模型也称为自回归模型。它是通过过去的观测值和现在的干扰值的线性组合预测, 它是仅用时间序列Yt的不同滞后项作为解释变量的模型,其数学形式为: Yt=?覬 1Yt-1+?覬 2Yt-2+?覬 3Yt-1+.+?覬 pYt-p+et 式中:p 为自回归模型的阶数;?覬 i(i=1,2,.p)为模型的自回归系数,et 为误差,Yt 为一个时间序列。 (二)MA 模型 MA 模型也称为移动平均模型。它是通过过去的干扰值和现在的干扰值的线性组合预测,它是仅用误差的不同滞后项作为解释变量的模型,其数学形式为: Yt=et-1et-1-2et-2-3et-3-.-qet-q 式中:
4、p 为模型平均移动阶数;j(j=1,2,.q)为模型的移动平均系数;et 为误差; Yt 为观测值。 (三)ARMA 模型 ARMA 模型是自回归模型(AR)和移动平均模型(MA)的组合,构成了用于描述平稳随机过程的自回归滑动平均模型 ARMA,数学形式为: Yt=?覬 1Yt-1+?覬 2Yt-2+?覬 3Yt-1+.+?覬 pYt-p+et-1et-1-2et-2-3et-3-.-qet-q 三、ARIMA 模型的建立 (一)数据的选取 本研究选用贵州省 1978 年至 2010 年农业总产值的统计数据,数据来源于贵州省统计年鉴 ,经整理后见表 1。 令进出口总额为 Xt,根据贵州省 19
5、78 年至 2010 年农业总产值数据,在 Eviews 软件中建立时序图(见图 1)可以看出,该折线图是向右上方倾斜的,表明此时间序列存在增长的趋势。所以贵州省 1978 年至 2010年农业总产值的时间序列数据是不稳定的。 进一步对该时间序列进行单位根检验,从输出结果可知 ADF 检验 p的值为 0.9996,没有通过检验,因此Xt序列是非平稳的,因此先对数据做平稳化处理。 (二)数据平稳化处理 对贵州省 1978 年至 2010 年农业总产值时间数据取对数得,并进行二阶差分。并对二阶差分的数据作单位根检验。 对贵州省 1978 年至 2010 年进农业总产值时间序列数据取对数并进行二阶差
6、分后,得到的 ADF 检验 p 的值为接近零,因此能通过检验,拒绝原假设。对处理后的数据作时序图(见图 2) ,可知此图围绕某条水平线上下波动,数据无明显的上升或下降趋势,说明处理后的数据已经是平稳的,且 d=2。 (三)参数的估计与模型的定阶 对处理后的数据作滞后 16 期的自相关(autocorrelation function,ACF)图和偏相关(partial autocorrelation function,PACF)图,如图 3。 从该图可以看到,自相关函数在 12 步后截尾,所以 q=12;偏自相关函数在 12 步后截尾,所以 p=12。 对模型进行检验,由于常数项 C 没有通过
7、显著性检验,即 C 对模型没有显著性影响故舍掉。AR(12)的 p 值为 0.008,MA(12)的 p 值接近于零,均能通过单个系数的显著性检验;且拟合优度 R2=0.827,拟合情况还算是可以的。因此,p=12,q=12,d=2 处理后数据的模型为。由此得到的估计方程为: DD(logXt)=-0.4353DD(logXt-12) -0.9408t-12+t (四)模型的检验 如果残差序列是白噪声序列即纯随机序列,则表明所建立的模型包含原序列的所有趋势,模型用于预测是合适的。反之,残差序列不是白噪声,说明残差序列中还有某种信息即还有规律,所建模型不合适,应重新建模。可以利用残差的自相关分析
8、图直观判断,其准则是:残差序列的自相关与零无显著不同,或者说基本落入随机区间,残差序列为白噪声;反之残差序列不是白噪声。 由图 4 可以看出,所有 Q 值都小于检验水平为 0.05 的卡方分布临界值,最后得出结论:模型的随机误差序列是一个白噪声序列。 建立模型的目的之一是对未来值进行预测。对未来贵州省农业总产值进行预测前, 先检验模型的预测能力。模型的预测能力一般用平均绝对百分比误差(mean absolute percentage error, )度量, 它的计算公式如下: MAPE=100% 通过计算 MAPE=1.10610,说明模型的预测精度较高。通过实际值与预测值的拟合图可以看出(见
9、图 5) ,拟合情况是比较理想。 (五)对贵州省农业总产值的预测 通过估计方程对 2011 年贵州省农业总产值的预测值为:DD(logX2011)=09,925234,经计算得出 X2011=670.63 亿元(2011年的实际值为 655.30 亿元) ,误差为 2.33%。同时预测贵州省 2012 年农业总产值为 773.85 亿元。 四、总结 本文构建的贵州省农业总产值自回归预测模型,经统计检验估计方程整体显著性很好,由此证实了 ARIMA 模型是一种很好的短期时间序列农业总产值的预测方法,适用于贵州农业总产值的预测研究,可以为贵州农业经济发展规划提供决策依据。 值得注意的是,ARIMA 模型的短期预测效果好,长期预测效果不好,尽管如此,与其他的预测方法相比,其预测的准确度还是比较高的。 参考文献: 1徐国祥,统计预测与决策(第二版)M.上海:上海财经大学出版社,2005. 2张晓峒.计量经济学(第三版)M.天津:南开大学出版社,2007. 3易丹辉.时间序列分析方法与应用M.北京:中国人民大学出版社,2011. 4王燕.应用时间序列分析M.北京:中国人民大学出版社,2005. (作者单位:贵州大学经济学院)