时间序列大作业.docx

上传人:sk****8 文档编号:3102315 上传时间:2019-05-21 格式:DOCX 页数:21 大小:435.71KB
下载 相关 举报
时间序列大作业.docx_第1页
第1页 / 共21页
时间序列大作业.docx_第2页
第2页 / 共21页
时间序列大作业.docx_第3页
第3页 / 共21页
时间序列大作业.docx_第4页
第4页 / 共21页
时间序列大作业.docx_第5页
第5页 / 共21页
点击查看更多>>
资源描述

1、应用时间序列大作业课题:基于 ARIMA 模型的全国1980-2013 年邮电业务函件数量时间序列分析及预测。姓名:贾县委学号:1203650055编号:48基于 ARIMA 模型全国 1980-2013 年邮电业务函件数量时间序列分析及预测 一.摘要时间序列就是按照时间的顺序记录的一列有序数据。对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势。时间序列分析在日常生活中随处可见,有着非常广泛的应用领域。邮政与我们息息相关,他已经成为社会经济生活不可或缺的通信手段。在世界上,函各国都以件量来衡量一个国家的邮政发展水平,而我国的函件量增长却不容乐观,这勾起了我研究的兴趣,加上我本人

2、又有集邮的爱好,因此我选用了函件量进行分析研究。本文用时间序列分析方法,对一段时间序列进行了拟合。通过对 1980 至2013 年全国邮电业务函件量序列进行观察分析,建立合适的 ARIMA 模型,对未来五个月的全国邮电业务函件量序列进行预测。然后对预测值和真实值进行比较,得出结论,所建立的模型有较好的拟合效果,从而提供了一个行情预测的有效方法。关键词:时间序列 函件量 ARIMA 时间序列分析 预测 二.前言邮政的最初发展史从人们的信函寄送需要开始的,现在邮政的众多业务也是借助经营函件业务而衍生出来的。目前,函件业务的主要包括为用户传递书面通信、文件资料和书籍等。他已经成为社会经济和生活不可缺

3、少的通信手段。如果的函件业务搞不好,邮政其他业务也就失去了赖以生存的基础,这将严重削弱邮政在社会中的地位和作用。当前,世界各国都以函件量来衡量一个国家邮政发展水平,然而几十年随着经济建设的飞速发展,邮电业务的需求量迅猛增长,唯有函件业务增长不容乐观,与发达国家和甚至一些发展中国家相比还有很大差距。原因何在?因此,本文就以以我国 1980-2013 年全国邮电业务函件量的数据为研究对象,做时间序列分析。首先,对全国 33 年来全国邮电业务函件量的发展变化规律,运用 SAS 软件进行分析其发展趋势。再则,通过检验说明模型拟合效果的好坏,再利用模型对下一年进行预测。最后,从国家经济、政策和社会发展等

4、方面对全国邮电业务函件量变化规律及未来走势进行分析。ARIMA 模型建模思路(一)模型介绍:ARIMA 模型( p, d, q) 又称为自回归移动平均模型。其中 AR 指自回归; p 为模型的自回归阶数; MA 为移动平均; q 为模型的移动平均阶数; I 指积分; d 为时间序列成为平稳之前必须取差分的次数。其一般的表达式为: qtttptytytyty 210210(二) 建模思路:ARIMA 建模思路是: 假设所研究的时间序列是由某个随机过程产生的, 用实际统计序列建立、估计该随机过程的自回归移动平均模型, 并用此模型求出预测值。(三) 建模步骤:1. 观察时间序列。根据时间序的散点图自

5、相关函数( ACF) 图和偏自相关函( PACF) 图以及 ADF 单位根检验观察其方差、趋势及其季节性变化规律, 识别该序列的平稳性。2. 对序列进行平稳化处理。如果数据序列是非平稳的, 并存在一定的增长或下降趋势, 则需对数据进行差分处理; 如果数据序列存在异方差性, 则需对数据进行对数转换或者开方处理, 直到处理后数据的自相关函数值和偏相关函数值无显著地异于零。3. 模型识别。若平稳时间序列的偏相关函数是截尾的, 而自相关函数是拖尾的, 则可断定此序列适合 AR 模型; 若平稳时间序列的偏相关函数是拖尾的, 而自相关函数是截尾的, 则可断定此序列适合 MA 模型; 若平稳时间序列的偏相关

6、函数和自相关函数均是拖尾的, 则此序列适合 ARMA 模型。4. 对 ARIMA( p, d, q) 模型定阶, 估计参数。5. 模型检验。进行假设检验, 诊断白噪声检验假设模型残差的 ACF 值和PACF 值在早期或季节性延迟点处不得大于置信区间, 同时残差应理想化为 0 均值。可观察残差的 ACF 图、PACF 图, 并辅以 Dw 值、t 值等检验法。6. 预测分析。时间序列分析包括以下步骤: 分析时间序列的随机特性; 用实际统计序列构造预测模型; 根据所得模型做出最佳的预测值。ARIMA 模型建模流程图(四)ARIMA(p,d,q)模型:在 ARIMA 模型的识别过程中,我们主要用到两个

7、工具:自相关函数(ACF),偏自相关函数(PACF)以及它们各自的相关图。对于一个序列Xt来说,它的第i 阶自相关系数定义为它的 i 阶自协方差除以它的方差,它是关于 i 的函数,因此我们也称之为自相关函数,通常记 ACF(i)。偏自相关函数 PACF(i)度量了消除中间滞后项影响后两滞后变量之间的相关关系。 自相关系数和偏自相关系数这两个统计量来识别 ARIMA(p,d,q)模型的系数特点和模型的阶数。并用游程检验经过处理的序列是否为平稳化的序列。模型定阶 自相关系数 偏自相关系数AR(p) 拖尾 P 阶截尾MA(q) q 阶截尾 拖尾ARMA(p,q) 拖尾 拖尾三 数据预处理及具体模型(

8、建模)1.数据录入:1980-2013年全国邮电业务函件量时间 函件数(亿件) 时间 函件数( 亿件)1980 年 33.13 1997 年 68.551981 年 33.88 1998 年 65.511982 年 33.94 1999 年 60.521983 年 35.21 2000 年 77.711984 年 39.48 2001 年 86.931985 年 46.78 2002 年 106.011986 年 49.59 2003 年 103.841987 年 54.79 2004 年 82.811988 年 59.77 2005 年 73.511989 年 57.28 2006 年 71

9、.311990 年 54.87 2007 年 69.501991 年 52.11 2008 年 73.631992 年 57.18 2009 年 75.321993 年 68.70 2010 年 74.011994 年 76.50 2011 年 73.781995 年 79.55 2012 年 70.741996 年 78.68 2013 年 63.412 绘制时序图程序如下:data a;input a;time=1980+_n_-1;cards;33.13 33.88 33.94 35.21 39.48 46.78 49.59 54.79 59.77 57.2854.87 52.11 57

10、.18 68.70 76.50 79.55 78.68 68.55 65.51 60.5277.71 86.93 106.01 103.84 82.81 73.51 71.31 69.50 73.63 75.3274.01 73.78 70.74 63.41;Proc gplot;plot a*time;symbol1v=star i=join c=black;run;原时序图由时序图可以看出,序列具有有递增长期趋势,为非平稳时间序列。因此,先进性一阶差分,程序如下:data a;input a;difa=dif(a);time=1980+_n_-1;cards;33.13 33.88 33.

11、94 35.21 39.48 46.78 49.59 54.79 59.77 57.2854.87 52.11 57.18 68.70 76.50 79.55 78.68 68.55 65.51 60.5277.71 86.93 106.01 103.84 82.81 73.51 71.31 69.50 73.63 75.3274.01 73.78 70.74 63.41;procgplot;plot a*time difa*time;symbol1v=star i=join c=black;run;一阶差分时序图直观检验,一阶仍不具有明显的平稳性,因此再进行二阶差分检验。二阶差分程序如下:d

12、ata a;input a;difa=dif(dif(a);time=1980+_n_-1;cards;33.13 33.88 33.94 35.21 39.48 46.78 49.59 54.79 59.77 57.2854.87 52.11 57.18 68.70 76.50 79.55 78.68 68.55 65.51 60.5277.71 86.93 106.01 103.84 82.81 73.51 71.31 69.50 73.63 75.3274.01 73.78 70.74 63.41;procgplot;plot a*time difa*time;symbol1v=star

13、 i=join c=black;run;二阶差分时序图经过直观检验,二阶差分时序图明显具有平稳性,因此可以进行纯随机性检验。3 纯随机性检验程序如下:proc arima;identify var=a(1,1);run;由二阶差分时序图和白噪声检验,可以直观看出,可知 P 值0.05,该时序图平稳,未通过白噪声检验,故对差分序列进行拟合 ARMA 模型。4 定阶:4.1 根据相对最优定阶:程序如下:proc arima;identify var=a(1,1) nalg=8 minic p=(0:5) q=(0:5);run;分析结果如下根据最优模型定阶,BIC最小原则。程序如下:proc arima;identify var=a(1,1) nalg=8 minic p=(0:5) q=(0:5);run;estimate p=3 ;run;p=3,时,分析结果如下:本例有参数不显著,残差的自相关检验通过检验,因此拟合仍然失败。所以排除用此模型的可能。4.2 根据自相关图和偏自相关图定阶:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 精品笔记

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。