1、 本科毕业论文 ( 20 届) 时间序列预测在股市预测中的应用 所在学院 专业班级 信息与计算科学 学生姓名 学号 指导教师 职称 完成日期 年 月 1 摘要 股票市场在中国社会经济生活中起着越来越重要的作用 , 而股民投资时所带来的风险也随之增加 , 而 时间序列预测股票 走向能为股民投资是减少风险 . 本文叙述了时间序列的背景及发展史 . 并阐述了时间序列的理论知识 和 时间序列预测的 几 个重要方法 . 本文主要用时间序列的 简单移动平均法 对股票走向 做了案列分析 , 并取得了较好成果 . 关键词 : 时间序列 ; 预测 ; 简单移动平均法 2 Abstract The Stock m
2、arket is playing more and more vital role in China social economy life, but time investor investment brings the risk also increases along with it, but that the time series forecast the stock trends can reduces the risk for the investor investment. This article narrated the time series background and
3、 the history, and elaborated the time series theoretical knowledge and several important methods of the time series forecast. This article mainly uses the simple moving average method of the time series to analysis the trend of the stock , and gets a good result. Keywords: Time series; Forecast; Sim
4、ple moving average method 3 目录 摘要 . I Abstract . 2 1 前言 . 4 2 时间序列的相关理论 . 6 2.1 时间序列的定义 . 6 2.2 时间序列 主要 的应用 方面 . 6 2.3 时间序列预测方法 . 6 3 时间序列对 股票 的 预测研究 . 10 4 小结 . 13 参考文献 . 14 致谢 . 错误 !未定义书签。 4 1 前言 时间序列是指某种统计指标的数值 , 按照时间先后顺序排列起来的数列 . 在 时间序列发展的过程中 , 它慢慢的受到各领域的 广泛应用 . 例如证券市场中股票的交易价格与交易量 、 外汇市场上的汇率 、 期
5、货和黄金的交易价格以及各种类型的指数等 , 上述 这些 领域内所生成的 数据都形成 为 一个 接着一个 的时间序列 1 . 追 溯时间序列 分析方法 的起源可以追溯到 1927 年 , 为了预测市场变化的规律,科学 家耶尔 (Yule)提出建立自回归 (AR)模型 . 接着 , 到 1931 年 , 另一位数学家瓦尔格 (Walker)在 耶尔所提的理论基础下 , 建立了 当时主要应用在经济分析和市场预测的模型 : 滑动平均 (MA)模型和自回归、滑动平均 (ARMA)混合模型 , 并且在当时 初步奠定了时间序列分析方法的 基石 . 到1960 年代 , 时间序列分析 的 理论 及 方法 进入
6、 了一个新阶段 , 有人证明 AR 模型的功率谱估计与最大熵谱 (MES)估计是等效的 , 并称之为现代谱估计 , 而这个理论来源于科学家 伯格 (Burg)在研究 地震信号时提出最大熵谱估计理论 . 经典谱分析有分辨率不高和频率漏泄严重等缺点 , 而 现代谱估计 则很好的克服了这些缺点 , 这样很好的使时间序列分析方法不仅在频率域内得到应用 , 而且扩展到时间域内 , 在各种工程领域内得到广泛的应用 . 到 1970 年代 , 随着别的技术 (如 : 信号处理技术等 )的发展 , 时间序列分析方法在理论上也得到了快速发展 , 特别在参数估计算法、定阶方法及建模过程等都得到改进 , 迈向了实用
7、化 2 . 时间序列分析方 法经过多年的发展变得日趋成熟 , 它的应用领域也随之变得广泛 , 主要集中在预测气象、预测市场、预测地震、预测人口、预测汛情、预测产量等预测领域 . 而在别的很多领域也用到了时间序列预测的方法 , 如精密仪器测量、精密机械制造、航空航天轨道跟踪和监控 , 遥控遥测 , 精细化工控制 , 安全检测 , 质量控制 , 还可在工程施工中及早发现故障并及早解决 . 以上仅仅列举了某些应用领域 , 在实际中还有许多应用领域 4,3 . 股票市场在中国社会经济生活中起着越来越重要的作用 . 截至 2006 年 底 , 沪深两市总市值为 89403.89 亿元 , 市值规模上升至
8、全球第 10 位 , 亚洲第 3 位 . 由于中国股票市场在国民经济中的地位和作用不断提高 , 无论是从政府宏观决策层面还是从具体投资者微观层面对股票市场价格行为进行深入研究的需求都显得尤为迫切 . 股票市场价格行为一是指股票市场价格如何变化 , 即价格是上涨还是下跌 ; 二是指价格变化的波动 , 根据资本资产定价模型 , 股票风险是决定其价格的重要因素 , 在现代财务理论里面也常以波动来代表风险 , 并以股票收益的方差或者标准差来度量 . 对股票市场价格行为进行研究 , 在宏观 和微观方面都有重要的现实5 意义 . 从宏观 上 来看 , 政府制定干预市场政策的基础 是 深刻理解股票市场的行为
9、与波动特征 ; 从微观 上 来看 , 能 影响 包括投资者在内的市场参与者 的市场投资策略 . 研究股票行为的方法或理论多种多样 , 而用时间序列预测方法来研究股票的行为是非常合适的 , 因为我们可以通过一组股票价格的时间序列观测值来预测未来股票的走向 , 从而为我们对控制股票的行为得到理论依据 5 . 6 2 时间序列的相关理论 2.1 时间序列的定义 时间序列是经过某种统计指标后所得到的 数值 , 然后按照时间先后顺序排列起来得到一个数列 . 例如 , 某工厂商品的总产值按年度顺序排列起来的数列 ; 股票价格按月度排列起来的数列等等都是时间序列 . 时间序列一般用 , 21 tyyy 表示
10、 , t 为时间 , 这种也称为动态数据 . 这样的动态数据在自然 、 经济及社会等领域都是很常见的 . 2.2 时间序列 主要 的应用 方面 时间序列分析主要用于 : 1. 系统描述 : 用曲线拟合的方法结合对系统观测得到的时间序列数据对系统进行客观的描述 . 2. 系统分析 : 比如 观测值可能 会有 多个变量 , 可以用分析 多个 时间序列之间的 变化 关系 , 即 用 某个 时间序列的变化去分析另一个 时间序列的 变化 . 3. 预测未来 : 如要预测某个时间序列的未来值可用 ARMA 模型拟合时间序列 . 4. 决策和控制 : 如要使某时间序列的发展保持不偏离目标值 , 可通过调整输
11、入值来进行控制 . 2.3 时间序列预测方法 时间序列预测方法很多 , 本文研究了简单移动平均法 , 加权移动平均法 , 趋势移动平均法等方法 . 1. 简单移动平均法 6 设时间 序列为 : , 21 tyyy ; 简单移动平均公式为 : N yyyM Ntttt 11 , Nt . (2.1) 式中 : tM 为 t 期移动平均数 ; N 为移动平均的项数 . 这公式表明当 t 向前移动一个时期 , 得到一个新的平均数 . 由于它不断地 得到新的 平均数 , 逐期向前移动 , 所以称为移动平均法 . 由 (2.1)式可知 N yyyM Ntttt 211 , 因此 7 NyN yyyNyM
12、 NtNtNtttt 11 , NyyMM Ntttt 1. (2.2) 这是它的递推 公式 . N 越大 , 递推公式就越方便 . 由于移动平均可以 去除 周期变动和不规则变动 带来 的影响 , 使长期趋势显示出来 , 因而可以用 来做 预测 . 预测公式为 tt My 1 . (2.3) 即 用 第 t 期 的 移动平均数作为第 1t 期的预测值 . 2. 加权移动平均法 7 在简单移动平均公式中 , 每期数据在平均中的作用是等同的 . 但是 , 每期数据所包含的信息量并不一样 , 近期数据包含着更多关于未来情况的信息 . 因此 , 把各期数据等同看待是不尽合理的 , 应考虑各期数据的重要
13、性 , 对近期数据给与较大的权重 , 这就是加权平均移动法的基本思想 . 设时间序列为 : , 21 tyyy ; 加权移动平均公式为 : Ntwww ywywywM N NtNtttw ,21 1121 . (2.4) 式中 : twM 为 t 期加权移动平均数 ; tw 为 1iyy 的权数 , 它体现了相应的 y 在加权平均数中的重要性 . 利用加权移动平均数来做预测 , 期预测公式为 : twt My 1 , (2.5) 即以第 t 期加权移动平均数作为第 1t 期的预测值 . 3. 趋势移动平均法 8 前面介绍的简单移动平均法和加权移动平均法 , 在时间序列没有明显的趋势变动时 ,
14、能够准确反映实际情况 . 但当时间序列出现直线增加或减少变动趋势时 , 用简单移动平均法来预测就会出现滞后偏差 . 因此 , 需要进行修正 , 修正的方法是作二次移动平均 , 利用移动平均滞后偏差的规律来建立直线趋势的预测模型 . 这就是趋势移动平均法 . 8 一次移动平均数为 : N yyyM Ntttt 11)1( . 在一次移动平均的基础上再进行一次移动平均就是二次移动平均 , 其计算公式为 : N MMMM Ntttt1 11 11)2( , (2.6) 它的递推公式为 : NMMMM Ntttt11212 . (2.7) 下面讨论如何利用移动平均的之后偏差建立直线趋势预测模型 . 设
15、时间序列 ty 从某时期开始具有直线趋势 , 且认为未来时期亦按此直线趋势变化 , 则可设此直线趋势预测模型为 : Tbay ttTt , ,2,1T . (2.8) 其中 : t 为当前时期数 ; T 为由 t 至预测期的时期数 ; Tty 为第 Tt 期预测值 ; ta 为截距 ; tb 为斜率 . ta , tb 又称为平滑系数 . 现在 , 我们根据移动平均值来确定 ta 和 tb . 由模型 (2.8)可知 : 由于 tt ya , ttt byy 1 , ttt byy 22 , ttNt bNyy )1(1 . 所以 N yyyM Ntttt )1(1)1( N bNybyy ttttt )1()( 9 N bNN ty t )1(21 tt bNy 2 1. 因此 ttt bNMy 2 1)1(1 . (2.9) 由 (2.8)式有 ttt bNMy 2 1)1( 11 , (注意 tb 是常数 ), 所以 ttttt bMMyy )1( 1)1(1 . 类似 (2.9)式的推导 , 可得 : ttt bNMM 2 1)2()1( . (2.10) 于是 , 由 (2.9)和 (2.10)式可得 ta 和 tb 的计算公式 : ).(12,2)2()1()2()1(ttttttMMNbMMa (2.11)