1、 1 基于 GARCH模型对上证指数收益率的实证分析 于梦梦 西南财经大学统计学院 统计学 学号: 214020208022 摘 要 本文 本文选取上海综合指数在 2013 年 1 月 4 日至 2014年 12 月 19 日期间共 475 个上证综合指数每日收盘价数据,并处理成对数收益率,在此基础上对中国股市收益率波动性特征进行了分析。利用 ARCH 类模型对上海股票市场的波动性进行了检验,发现中国股市具有明显的 ARCH效应,结合 ARCH模型和 GARCH模型的特点,最终筛选出适合的 GARCH(1, 1)模型对沪市收益率序列的波动做拟合。本文最后针对中国股市的现存问题,借鉴成熟股市的经
2、验,提出了加快发展中国股市的政策建议。 关键词:上证综合指数; ARCH 效应; ARCH; GARCH 模型;波动性 2 目 录 摘 要 . 1 一、引言 . 3 二、文献综述 . 3 三、中国股市波动特征 . 4 四、 ARCH 类模型概述 . 5 (一) ARCH 模型 . 5 (二) GARCH 模型 . 6 五、上海股市收益率的 ARCH 效应检验 . 7 (一)数据来源和处理 . 7 (二)上证综合指数日对数收益率序列 tr 的统计性描述 . 7 (三)上证综合指数收益率序列 tr 的平稳性性检验 ADF 单位根检验 . 9 (四)上证综合指数收益率序列 tr 的相关性检验 . 1
3、0 (五)均值方程的确定及残差序列自相关检验 . 10 (六) 异方差性检验 . 11 六、建立 GARCH 类模型 . 13 (一)模型阶数的确定 . 13 (二)对所建立的模型进行残差 ARCH 效应检验 . 15 (三)建立 GARCH(1, 1)模型 . 15 七、实证结论分析 . 16 参考文献 . 16 3 一、引言 作为国际金融市场的一部分,我国股票市场的成长历程还不算漫长。自从 1990 年成立以来的 20 多个年头里,经过几次大起大落已经不断完善和发展。尤其是近几年来,随着市场规模的大幅度增加,沪深证券市场与国民经济的相关程度也逐步增强。金融环境动荡的加剧促使人们研究股票价格
4、波动的内在规律。美国次贷危机的爆发带来了一场史无前例的金融危机,并在全球蔓延。中国也难逃灾难,我国的上证综合指数也从最高点 6, 124.04 点暴跌至 1, 664.93 点,这一切让我们认识到防范和应对风险的重要性。也让我们深刻的明白了:在中国这样一个尚未发展 成熟的股票市场中,我们不仅要定性的把握股票价格的走势,更应该定量的研究其内在规律,这样才能使我们在危机来临之际不至于手足无措。 由于股市内部规律非常复杂,变化周期无序,而我国资本市场个人投资者的比例高达99%,投资者个人心理状态不同,同时经济、政治等因素对其影响较大,使股价走势变化莫测,难以把握。鉴于此,对股市进行合理分析和预测,对
5、于指导投资者合理投资,维护证券交易市场稳定进而促进经济发展有重大意义。 二、文献综述 一直以来,国内外运用 ARCH 族模型对金融时间序列的研究已经得到了数不胜数的成果。Engle 和 Mustafa(1992)对单个股票收益率序列的研究证实了 ARCH 效应是显著的。有关条件均值与条件方差的关系, FrenchNchwert 和 Stambaugh(1987), Glosten, Jagaannathan 和Rumkle(1992)的研究结果认为两者是负相关的,且是统计显著的。 1993 年他们用 EGARCH-M模型对纽约股市的股价指数月度收益进行实证分析,结果也表明存在杠杆效应 :负残差
6、往往引起方差的增长,而正残差则 导致方差的减少。 在对国内股市的研究中,张思奇 (2002)运用 ARMAARCH-M11 模型对 1992 年 1 月 2 日到1998 年 6 月 3 日的上证综指成分股进行实证研究,结果表明,我国股市的有效程度已经得到明显提高,市场已具备某些弱势有效市场特征;吴齐华等 (2001)从持股集中度的角度探讨了实力投资者对股票收益率的 ARCH 效应的影响,他们采用单因素模型,将所选样本的市场收益率作为因变量,将持股集中度变化额作为自变量,考察持股集中度变化对股票的市场收益率的影响程度。他们认为,导致我国股票市场剧烈波动的主要原因在于政策干 预、投机资金的干扰以
7、及上市公司的结构不合理。钟蓉萨等深入分析了沪、深市场部分股票收益率序列的各阶矩的特征。张芳 8发现了收益率序列本身一般不呈现自相关性,但收益率序列的平方却具备较强的自相关性,反映了不同时间上的观测存在着非线性关系。丁华通过对上海证券市场的 A 股指数进行分析,得到了股价指数中的 ARCH 现象,并以此得出了 ARCH(1)和ARCH(2)模型。张永东、毕秋香采用上证综合指数每日收盘价数据,应用常用的波动性预测4 模型预测上海股市的周波动性并比较其样本的预测效果。结果表明,当采用不同的预测误差统计量作 预测模型的预测精度的评价准则时,会导致评价结果的排序不同。宋逢明、李翰阳建立了股票总体波动性的
8、分解模型和市场波动以及市场个别波动的度量、估计方法,同时对不同的成分趋势进行分析和检验;得出了不同波动性成分随时间变化的确定性趋势。魏巍贤首次应用广义自回归条件异方差模型及其两种非线性修正模型,该论文是用 ARCH 族模型分析中国股市波动性的较早的一篇尝试性文章,给研究国内股票市场的价格波动提供了很好的思路。 从以上研究的可以看出:一、国内研究者的数据多选用 2007 年以前的股票指数和其他股市变量指标,且近年来我国股市波 动程度增大,因而其结论可能是有偏差的。二、样本范围明显偏小,多数研究采用的是 5 年之内的数据,这不能准确反映中国股市的发展变化情况。本文用实证研究方法对我国上海股票市场价
9、格频繁剧烈波动的情况进行分析,从而得出一些有益的结论和启示。 三、中国股市波动特征 中国股市的发展很快,从 20 世纪 80 年代中后期一些国有企业自行发行企业职工内部股票,到 1990 年至 1991 年规范化的上海、深圳证券交易所的成立,中国股市在过去十多年的发展过程中逐渐自我完善和发展壮大,市价总值从 1992 年的 1048.13 亿元上升 1999 年的 26471亿元,占 GDP 比例从 1992 年的 3.93%上升到 1999 年的 32%, 1999 年流通市值占 GDP 比例达到 10%左右。股票市场的建立和发展对解决国有企业筹集资金起到了积极的作用,有利地推动了中国经济体
10、制改革的深入发展。虽然中国股票市场取得了长足的发展,但与成熟的证券市场相比,仍存在较大差距,突出的表现是证券市场功能以筹资为主,优化资源配置功能相对薄弱;上市公司的股本结构中,占总股本 60%的国家股及法人股不能流通;市场投资主体结构不合理,个体投资者比例过大;上市公司普遍存在重筹资、轻转制的倾向,规范运作程度不 高,多数公司还没有形成有效的内部制衡机制;市场规模较小;相关法规不完善;监管力量薄弱和监管滞后等。具体来讲,我国股市波动具有以下特征 : 1、股市波动大,股价指数走势难以按牛、熊市划分,时常发生暴涨暴跌行情,熊市中常发生暴涨行情,牛市中常发生暴跌行情。在中国股市发展过程中,经历了多次
11、大起大落,沪深股市近几年的股价指数几乎每年发生一次暴涨暴跌行情,大部分的涨跌行情在几天或几周内完成,时间短,涨跌幅度大,最高日涨幅达 33%,最高年振幅达 400%,如上证综合指数从 1994 年到 2000 年 22 日在 325.89 点至 2114.52 点间波动。股市的剧烈波动对投机者产生巨大诱惑力,助长了市场投机行为,使中国股市中靠股价波动投机的股民占大多数。政策、消息、扩容,企业经营状况的好坏、机构大户操纵、各种非正常途径的谣传等因素都是引起中国股市波动的原因。 5 2、二级市场大部分日子成交量很少,在股市发生较大波动时成交量急剧增大。从沪深股市成交量来看,大部分日子两个市场的日成
12、交量只有几亿元,只在“ 94.8”行情、“ 5.19”行情与 1996 年行情期间成交量才达几十亿元至几百亿元。 3、股市上中小散户投资者众多,股票换手率非常高。国际上成熟股市的 年换手率通常在 30-50%,甚至更低,即投资者平均持股时间在 2-3 年以上。作为新兴股市,大体上以不超过 100%为宜,而中国股票市场历年换手率都高达 100%以上,最高为 1996 年深圳股市换手率 902%。这说明中国股票市场投机氛围浓于投资氛围,如此频繁的买进卖出,直接导致股市价格剧烈波动。 4、上市公司经营业绩欠佳,股息率不太高。相对于其他成熟股市而言,中国股市平均净资产收益率较低,表明中国上市公司运行质
13、量不稳,资源配置和资金使用效率不高,资产获利能力还处于较低的水平。另外,上市公司的亏损情况有逐年上升的趋势。 由于上市公司经营业绩普遍欠佳,使很多上市公司股票在分红派息时,股息率很低,一般在 5%以下,有的根本没有。虽然对股民而言,股息率的重要性已退居于股价之后,但一旦发了股息,股民心理及其股市行为就发生了变化,股息增长持续时间的长短以及股息增长率的高低对股价的涨落具有直接影响。 5、每一次暴涨暴跌后面都有明显的政策影响 .中国股市波动性特征,说明了中国股市的市场机制还不完善,投机性太强,市场主体行为非理性。那么我国新兴股票市场价格的波动与成熟市场经济国家的股票市场相比有哪些不同,我国股票市场
14、价格的波动性特征适合用什么 样的模型来描述,产生这些波动性特征的原因是什么,这些问题都值得我们研究。 四、 ARCH 类模型概述 (一) ARCH 模型 传统的经济计量模型假设样本方差不随时间改变。为了改进这些模型, Engle(1982)提出了一类新的随机过程模型,称为自回归条件异方差模型,即 ARCH 模型( autoregressive conditional heteroskedasticity,自回归条件异方差),用以捕捉金融数据的时变性与聚类特征。该模型一般用于对金融时 .间序列数据进行集聚性、方差波动性、回归和预测分析,实证效果良好。 ARCH 模型的一个假设是 :观测数据方差的
15、统计性描述呈现出自相关的特点,即滞后值函数包括观测误差的方差。该模型的核心思想是随机扰动项 tu 的条件方差依赖于干扰项的前一期残差平方的大小,以 ARCH (1)模型为例,该模型在 t 时刻时的条件方差依赖于前一时刻 (t-1)的残差平方 ut21 的大小。 ARCH 模型的形式如下: 6 t t ty x 式( 1) t 的无条件方差是常数,但是其条件分布为: 21| (0 , )t t tN 2 2 211t t q t q 式( 2) 其中 1t 是信息集。 方程( 1)是均值方程。其中, 2t 为条件方差,含义是基于过去信息的一期预测方差。 方程( 2)是条件方差方程,由二项组成。
16、ARCH 项 2ti 为滞后的残差平方。 ARCH(P)过程可以写为 : tptpttt uauaauVa r 22 1102 . . . . . .)( ,.2,1t式 (3) 其中, t 服从独立同分布且满足 E(t )=0, Var(t )=2 ,称 (3)为自回归条件异方差模型,简称 ARCH 模型,称序列 tu 服从 P 阶的 ARCH 过程,把式 (1)和式 (3)构成的模型称为 ARCH 模型。 ARCH 模型及其扩展模型虽然都常常用来描述和解释货币和金融时间序列误差的方差或波动随时间变化的行为,但它们具有各自的特点。 ARCH 模型的主要贡献在于发现了经济时间序列中比较明显的变
17、化是可以预测的,并且说明了这种变化是来自某一特定类型的非线性依赖性,而不是方差的外生结构变化。式 (2)表明过去的波动扰动 2ti 对市场未来波动有着正向而减缓的影响,因此波动会持续一段时间,从而模拟了市场波动的集群性现象,但没有说明波动的方向。从预测的角度来看,当存在 ARCH 效应时,使用 ARCH 模型较之仍使用方差为常数的普通最小二乘法而言不仅可以提高预测值的精度,还可以知道预测值的可靠性。当方差较大时,预测值的置信区间就较大,从而可靠性较差;反之预测值的可靠性较好。ARCH 模型的这种性质在对股票、债券、期货和期权等进行风险分析时 具有重 要的实用价值。 (二) GARCH 模型 许
18、多实际问题中随着时间 t 的变化,序列 rt的随机扰动项 的条件方差也在变化,即序列具有变方差的特性。 Engel 在 1982 年首先提出了 ARCH 模型对方差进行建模,来描述股票市场的波动聚类性和持续性。 ARCH 模型通过对过去 p 期非预期回报 (Et)的平方的平方的移动平均来捕获回报序列的条件异方差。但是 ARCH(q)模型在实际应用中为得到较好的拟合效果需要很大的阶数 q,这增大了待估参数的个数,还会引发诸如解释变量的多重共线性等其他问题。另外,对于大数 q,非限制估计通常会违背 q 为负数的限定条件。 7 1986 年 Bollerslev 将 ARCH 模型推广发展成 GAR
19、CH 模型, GARCH 模型考虑了异方差本身的自回归。 GARCH 模型可以描述大多数金融报酬时间序列,所以在波动性研究中被广泛采用。和 ARCH 相比, GARCH 模型的优点在于相对低阶的 GARCH 模型可以实现高阶ARCH 模型对市场变量的预测,过程的识别和参数估计都相对容易。 GARCH 模型由均值方程和条件方差方程组合而成。 定义 et 是一个实值时间离散随机过程,也是包含 t 时刻所有信息的 P 域上的信息集,GARCH(p, q)过程定义如下。 它的条件方差表示为: 2202121 )()( ttitpi ijtqj jt LuLuw 式( 4) 在( 4)式中, pM 是
20、ARCH 项的阶数, q 是自回归 GARCH 项的阶数, p 0 并且, j 0, 0 i p, L 和 L 是滞后算子多项式。 五、上海股市收益率的 ARCH 效应检验 (一)数据来源和处理 在分析股票市场收益率时,一般将收益率 r 定义为 :r =logP(t)-logP( t-1), Pt 为股票市场每日收盘价。本文选取上海综合指数在 2013 年 1 月 4 日 2014年 12月 19 日之间的每日收盘价 Pt 作为样本数据, n=475。每日股票市场收益率 tr 为相邻营业日股指收盘价 tp 的对数一阶差分,有时候,收益率会乘以 100,以表示价格变动的百分比形式,因为原始的收益
21、率是一个很小的数字,在计算中存在着大量的舍入误差,所以乘以 100 的处理可以减少数值误差。因此上证综合指数的日对数收益率的计算公式如下: )lo g () lo g (*1 0 0 1ppr ttt 式( 5) 本文数据来源网址为: http:/ (二)上证综合指数日对数收益率序列 tr 的统计性描述 对收集到的 475 个样本数据进行统计描述,得出上证指数收益率序列 tr 的图形如下 : 8 -6-4-20246I II I I I IV I II I I I IV2 01 3 2 01 4R图 1 上证综合指数收益率 tr 的线形图 从上证综合指数对数收益率序列 r 的线性图中,可观察到
22、对数收益率波动的“集群”现象:波动在一些时间段内较小,在有的时间段内非常大。 010203040506070-5 -4 -3 -2 -1 0 1 2 3 4S e r i e s : RS a m p l e 1 / 0 4 / 2 0 1 3 1 2 / 1 9 / 2 0 1 4O b s e r v a t i o n s 4 7 5M e a n 0 . 0 6 6 2 6 9M e d i a n 0 . 0 4 6 7 8 5M a x i m u m 4 . 2 2 4 3 0 8M i n i m u m - 5 . 5 8 2 6 0 3St d . D e v . 1 .
23、1 0 1 9 0 4Sk e w n e s s - 0 . 3 5 6 5 4 7Ku r t o s i s 6 . 2 8 5 3 7 2J a r q u e - Be r a 2 2 3 . 6 8 8 9Pr o b a b i l i t y 0 . 0 0 0 0 0 0图 2 上证综合指数收益率 tr 的描述性统计 观察这些数据,我们可以发现:样本期内沪市收益率均值为 0.066%,标准差为 1.10%,偏度为 -0.357,左偏峰度为 6.29,远高于正态分布的峰度值 3,说明收益率 tr 具有尖峰和厚尾特征。 JB 正态性检验也证实了这点,统计量为 223.69, P
24、值为 0.00000,拒绝该对数收益9 率序列服从正态分布的假设。说明在极小水平下,收益率 tr 显著异于正态分布。 (三)上证综合指数收益率序列 tr 的平稳性性检验 ADF 单位根检验 虽然在金融时间序列中,收益率序列大多是平稳的,但为了使后面的研究建立在一个正确的前提之下,还是有必要对收益率的时间序列进行平稳性检验。在检验序列平稳性的方法中,单位根检验是使用最多的一种方法。因此本文对上证对数日收益率进行 ADF 单位根检验,结果如图所示: 表 1 上证综合指数收益率序列 tr 的 ADF 检验结果 Null Hypothesis: R has a unit root Exogenous:
25、 Constant Lag Length: 0 (Automatic - based on SIC, maxlag=17) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -20.79569 0.0000 Test critical values: 1% level -3.443921 5% level -2.867418 10% level -2.569963 *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Depende
26、nt Variable: D(R) Method: Least Squares Date: 12/28/14 Time: 01:05 Sample (adjusted): 1/07/2013 12/19/2014 Included observations: 474 after adjustments Variable Coefficient Std. Error t-Statistic Prob. R(-1) -0.958423 0.046088 -20.79569 0.0000 C 0.063063 0.050755 1.242492 0.2147 R-squared 0.478142 M
27、ean dependent var 0.002765 Adjusted R-squared 0.477036 S.D. dependent var 1.525537 S.E. of regression 1.103210 Akaike info criterion 3.038537 Sum squared resid 574.4586 Schwarz criterion 3.056094 Log likelihood -718.1332 Hannan-Quinn criter. 3.045442 F-statistic 432.4606 Durbin-Watson stat 2.002082
28、Prob(F-statistic) 0.000000 10 因为在单位根检验时,零假设和备择假设分别是: H0: =1,( yt 非平稳) H1: 临界值,则接受 H0, yt 非平稳; DF临界值,则拒绝 H0, yt 是平稳的。 本文中的收益率序列 tr 在 1%的显著水平下, ADF 检验值 -20.80-3.44, P 值为零。说明rt 有一个单位根的概率几乎为 0,因此拒绝 H0,认为 tr 数据是平稳的。因此沪市的收益率 tr拒绝随机游走的假设,收益率序列通常是平稳的时间序列数据。 (四)上证综合指数收益率序列 tr 的相关性检验 为了检验上证指数收益率序列 tr 的相关性,使用 EViews 软件,对收益率原序列作其 AC图和 PAC 图,如下所示: 表 2 上证综合指数收益率 tr 的自相关函数分析表 从图中可以看出,序列的自相关和偏自相关系数均落入两倍的估计标准差内,且 Q统计量的对应的 p 值均大于置信度 0.05,故序列在 5的显著性水平上不存在显著的相关性。 (五)均值方程的确定及残差序列自相关检验 由于序列不存在显著的相关性,因此将均值方程设定为白噪声。