1、基于 SARIMA 的我国汽车销量预测分析摘要汽车工业在国民经济中占有重要地位,准确预测汽车销量具有十分重要的意义。由于假日及其他因素影响,汽车的月度销售数据表现出季节性的特征。文章选用我国 2004 年 1 月2015 年 1 月的汽车月度销售数据为研究对象,构建了具有季节调整的 ARIMA 模型并用于销量预测,预测结果的平均相对误差可控制在 3%以内,模型合理有效,具有良好的参考价值。 关键词ARIMA 模型;汽车销量;SARIMA 预测 DOI10.13939/ki.zgsc.2016.01.071 1 引 言 随着我国经济的快速发展和居民生活水平的提高,汽车在人群中开始逐渐普及,成为许
2、多人的生活必需品。与此同时,汽车工业迅速发展,在国民经济中也扮演着越来越重要的角色,与机械电子、石油化工和建筑业一道构成了我国经济的四大支柱产业,因而如何对汽车销量进行准确的预测具有重要意义。 ARIMA 模型是 20 世纪 70 年代由博克斯和詹金斯提出的时间序列方法12,所以又被称为博克斯-詹金斯法,其全称是自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model) ,包含移动平均过程(MA)和自回归过程(AR)两个部分。ARIMA 模型发展至今理论已非常成熟,在实践中应用广泛。如龚承刚,王梦等人将 ARIMA 模型运用到了对湖北
3、省城乡居民收入差距的预测中,预测到未来三年湖北省的城乡居民收入差距比仍处在较高水平。3薛蓓蓓运用 ARIMA 模型对安徽省固定资产投资总额进行了建模和预测,借助 Eviews 软件给出了短期的预测值。4张丽,牛惠芳将 SARIMA 模型运用到了对我国 CPI 的分析预测中,对 CPI 月度数据的变化趋势和季节性进行了分析。5虞安和王忠采用引力模型和 ARIMA 模型对旅游人群进行了预测,对城市管理和旅游秩序的维护工作提供了意见和建议。6 本文将以汽车工业协会公布的汽车销量月度数据为研究对象,根据月度数据同时具有长期趋势效应、季节效应和随机波动的特点,选取具有季节调整的 ARIMA 模型对汽车销
4、量进行预测。 2 模 型 3 建模过程 建模的过程主要分为以下四步: 第一步:序列平稳化。所研究的数据如果是非平稳的,则不满足建模的条件,需要先对数据进行处理,在应用中差分 x=xt-xt-1 是常用的方法,差分后还需要通过 ADF 检验验证序列是否已经平稳化。 第二步:模型识别。在这个过程中,绘制样本的自相关函数图(ACF)和偏自相关函数图(PACF) ,然后观察时间序列样本的自相关系数和偏相关系数的特征确定 ARMA 模型的阶数,模型阶数的判断标准如下:第三步:模型拟合。在确定模型的阶数后,需要对模型中的参数进行估计,这一步中常用的方法是最小二乘法,在实际的应用中,可通过统计软件求得拟合值
5、。 第四步:模型诊断。为保证模型的有效性,需要对模型进行残差的白噪声检验。残差的 LB 统计量近似服从自由度为 m 的卡方分布,若统计量的 P 值大于显著性水平,可认为残差序列是纯随机序列,说明信息已被模型完全提取;反之则说明有些信息未能被提取,模型还需改进。为了保证模型的精简性,还要对参数的显著性进行检验,剔除不显著为零的参数。 4 实例分析 本文选取的研究数据为中国汽车工业协会公布的 2004 年 1 月2015年 1 月全国汽车销量月度数据,原始数据如表 2 所示。在建模过程中,将 2004 年 1 月2014 年 3 月的销售数据用于构建模型,而将剩余数据将用于检验模型的预测效果。 绘
6、制汽车销量走势图,如图 1 所示。从图中可以看出,我国的汽车销量同时表现出波动趋势和增长趋势。由于春节假期因素的影响,每年2 月都是全年的销售淡季,与其他月相比较 2 月的汽车销量大幅下滑。而从长期趋势来看,汽车的销量在逐年增长。 下一步对模型进行识别,首先绘制zt的自相关图(ACF)和偏自相关图(PACF) ,如图 3 所示。图像表明在延迟 12 阶处,自相关系数和偏自相关系数都显著非零;在延迟 24 阶处,自相关系数完全落入了 2 倍标准差范围以内,但是偏自相关系数仍然显著非零。因此在季节自相关特征上,自相关系数截尾,而偏自相关系数拖尾。为了提取差分后序列的季节信息,可以使用 ARMA(0
7、,1)12 模型。 然后再考虑模型的短期相关性,自相关系数和偏自相关系数在延迟2 阶后均快速衰减到 2 倍标准差之内,可以尝试对 p 和 q 取不同的值,再根据 SBC 准则选出相对最优模型。在模型 ARIMA(p,d,q)(P,D,Q)12 中,现在已知 P=1,Q=1,以及 d=1,D=1。在保持这四个参数不变的条件下,分别取 p=1,2 和 q=0,1,2,SBC 信息量的计算结果如表 4 所示。结果表明,当 p=1,q=0 时,SBC 信息量相对最小。 5 结 论 在每月销量的预测中,除了 2014 年 12 月的预测值与实际值偏差较大外,其余月份的预测偏差都控制在了 3%以内,其中
8、2014 年 6 月、7 月和 10 月的预测偏差更是控制在了 1%以内,而预测值的平均绝对百分比误差为 MAPE=2.36,预测效果良好。 在年初由于春节假期的影响,汽车销量往往较低,而在年末因汽车经销商为完成销售指标而开展各种促销活动,汽车销量出现高峰,汽车的销售表现出明显的季节性变化,选用具有季节调整的 ARIMA 模型是非常合理的。事实上在本例中 SARIMA 模型的预测偏差能够控制在合理的范围之内,该模型对汽车销量预测活动具有良好的参考价值。 参考文献: 1博克斯,詹金斯,格雷戈里,等.时间序列分析:预测与控制M.4版.北京:机械工业出版社,2011. 2王燕.应用时间序列分析M.3 版.北京:中国人民大学出版社,2012. 3龚承刚,王梦,谢航.基于 ARIMA 模型的湖北省城乡居民收入差距的预测J.统计与决策,2014(15):94-97. 4薛蓓蓓.基于 ARIMA 模型:全社会固定资产投资总额预测J.统计与决策,2014(15):141-143. 5张丽,牛惠芳.基于 SARIMA 模型的居民消费价格指数预测分析J.数理统计与管理,2013(1):1-6. 6虞安,王忠.基于 ARIMA 模型与时间序列的城市旅游倾向预测J.统计与决策,2014(13):86-89.