1、1第八章 SPSS 的应用本节将介绍在时间序列分析中,如何通过 SPSS 软件的操作建立指数平滑模型和 ARIMA模型,以及进行季节性分析。一、指数平滑模型我们以某地 19762003 年的人口自然增长率为例,通过上机练习熟练掌握运用SPSS18.0 软件建立指数平滑模型预测的问题。例 8-15:某地 19762003 年的人口自然增长率如表 822,试建立该地人口自然增长率指数平滑预测模型,并对 2004 年的人均生活能源消费进行预测。表 8-22 19762003 年的人口自然增长率表年度 人口净增长 年度 人口净增长 年度 人口净增长1976 12.66 1986 15.57 1996
2、10.421977 12.06 1987 16.61 1997 10.061978 12 1988 15.73 1998 9.141979 11.61 1989 15.04 1999 8.181980 11.87 1990 14.39 2000 7.581981 14.55 1991 12.98 2001 6.951982 15.68 1992 11.6 2002 6.451983 13.29 1993 11.45 2003 6.011984 13.08 1994 11.211985 14.26 1995 10.55首先,根据表 8-22 中数据在 SPSS 中新建数据文件,定义变量并在输入表
3、中的数据。 在 SPSS 的“数据视图”界面,依次选择:分析预测创建模型,首先弹出的是定义时间变量的对话框如图 822。图 822 定义时间变量对话框单击“定义日期(E)”按钮,设置数据的开始时间,选择个案为“年份”,在右侧“第一个个案”对话框中输入 1976,如图 823 所示。2图 823 定义日期对话框点击“确定”,再次进入时间序列建模器对话框,将变量“人口净增长”移入“因变量(D)”框,在“方法(M)”的下拉菜单中选择“指数平滑法”如图 824 所示。图 8-24 时间序列建模器单击“条件(C)”按钮,弹出如图 828 所示的对话框。在此对话框中选择“Holt线性趋势”,对因变量不进行
4、任何改变。因为该时间序列不含有季节性变化,所以季节性模型类型选项都为灰色不可选。点击“继续”按钮返回主面板。图 828 指数平滑条件对话框在主对话框中单击“统计量”按钮,打开如图 825 所示的对话框,进行输出统计量3设置。依次勾选“按模型显示拟合度量、Ljung-Box 统计量和离群值的数量(D)”、 “平稳的 R 方(Y)”、“拟合优度(G)”、“参数估计(M)”、“显示预测值(S)”选项。图 825 输出统计量对话框单击“图表”按钮,进入如图 826 所示的图标输出选择对话框进行图形输出设置,在“每张图显示内容”框中依次勾选“观察值(O)”、“预测值(S)”和“拟合值(I)”。图 826
5、 图表输出对话框单击“选项”按钮,进入如图 827 所示的预测时间对话框。在预测阶段中选择第二项“模型评估期后的第一个个案到指定日期之间的个案(C)”,并在日期框中输入2004,表示输出 2004 年的预测结果。4图 8-27 预测时间对话框单击“确定”按钮,在 SPSS 查看器窗口输出如图 828 所示的模型基本统计信息、图8-29 所示的残差的相关函数序列图和图 830 的预测结果及图形。图 828 模型的基本统计信息5图 829 残差的相关函数序列图图 830 预测结果及图形在图 828 模型的基本统计信息中,模型描述表格给出了当前模型所使用的分析变量和方法,分别时“人口净增长”变量和“
6、Holt”模型。在模型拟合表格中,给出了包括平稳的 R 方在内的 8 个拟合优度统计量。从模型统计量表格看出,平稳 R 方统计量的取值为0.245,大于 0,说明当前 Holt 线性模型要优于基本的均值模型。在图 829 残差的自相关(ACF)和偏相关(PACF)序列图中,两个图形都没有显著的趋势特征(拖尾或截尾),故而可以初步判断本例所用的模型是比较恰当的。6在图 830 预测结果及图形中,预测表格给出了分析变量在 2004 年的预测值及置信区间,分别为 5.76 和(3.68,7.84)。图形则描绘了实际观测序列、模型拟合序列的变化趋势,并添加了 2004 年的预测数据。从图中可以看出,观
7、测序列,拟合序列在图中近似,因此本例使用的模型较为合理。二、ARIMA 模型我们以某地 19502003 年的中国人口数为例,在 SPSS18.0 中建立 ARIMA 模型对人口数进行分析。例 816,19502003 年我国人口数量如表 823 所示,要求建立 ARIMA 模型分析中国人口数量之间的关系。表 8-23 我国人口数量表 单位:亿人年份 人口数年份 人口数年份 人口数年份 人口数年份 人口数1950 5.52 1961 6.59 1972 8.72 1983 10.28 1994 11.991951 5.63 1962 6.73 1973 8.92 1984 10.34 1995
8、 12.111952 5.75 1963 6.92 1974 9.09 1985 10.5 1996 12.241953 5.88 1964 7.05 1975 9.24 1986 10.65 1997 12.361954 6.03 1965 7.25 1976 9.37 1987 10.81 1998 12.481955 6.15 1966 7.45 1977 9.5 1988 10.96 1999 12.591956 6.28 1967 7.64 1978 9.63 1989 11.12 2000 12.671957 6.57 1968 7.85 1979 9.75 1990 11.43
9、2001 12.761958 6.6 1969 8.07 1980 9.87 1991 11.58 2002 12.851959 6.72 1970 8.3 1981 10.01 1992 11.72 2003 12.921960 6.62 1971 8.52 1982 10.16 1993 11.85首先,根据表 8-22 中数据在 SPSS 中新建数据文件,定义变量并在输入表中的数据。 然后定义时间变量,方法与例 8-15 相同。在 SPSS 的“数据视图”界面,依次选择:分析预测创建模型,进入时间序列建模器对话框,将变量“人口数”移入“因变量(D)”框,将已经定义的“年份(Year)”移
10、入“自变量(I)”框,在“方法(M)”的下拉菜单中选择“ARIMA”如图 824 所示。7图 31 时间序列建模器单击“条件(C)”按钮,弹出如图 832 所示的对话框。在模型选项卡中设置p、d、q,其值都必须是大于或等于 0 的整数,本例选 1、0、0。即自回归参数 p 选择为1,平稳时间序列的查分次数 d 选择为 0,移动平均的阶数 q 为 0,并勾选在模型中包括常数。在离群值选项卡中选中“自动检测离群值(E)”,在“要检测的离群值类型”框中勾选“加法(A)”和“移位水平(L)”,如图 8-33 所示。点击“继续”按钮返回主面板。图 8-32 ARIMA 条件8-33 离群值检测在“图表”
11、选项卡多勾选“残差自相关函数(ACF)(U)”,其余选项与例 8-15 相同。单击“确定”按钮,在 SPSS 查看器窗口中输出的结果如下图。8图 8-34 滞后 124 年的 ACF 残差图 835 模型拟合表图 836 模型统计量和模型参数表9图 837 离群值表首先输出的是如图 834 所示的滞后 124 年的 ACF 残差,从图中可以看出,在滞后1214 年该残差为最小。其次,图 8-35 给出了模型拟合包括稳定的 R 方、决定系数 R 方、正态化的 BIC 等在内的 8 项拟合优度情况。再次输出的是模型统计表和 ARIMA 模型参数表,如图 8-36 所示。前者表示模型的拟合效果满意,
12、模型发现有 4 个奇异点;后者表示回归系数和显著水平,计算证明,包括常数在内的回归系数效果明显。最后输出的是 4 个奇异点的位置,如图 8-37,发现四个点分别是 1957、1960、1961 和 1990 年,前三个点就是我国自然灾害附近,1990 年是由于我国计划生育运动导致人口增长事态得到有效控制。三、季节性分析在第四节的例 813 中,我们以某市某种商品销售量为例,在 SPSS18.0 中用同期平均法计算测定出了季节变动。通过定义日期变量的设置,季节性分析的设置以及对主要结果的分析得出结论:由于季节性的影响,各月份的销售额有很大不同,可看出 6 月、7 月、8月、9 月为旺季。 具体实现方法在此不再赘述。