1、基于 HAR 族模型的大型商业银行跳跃风险研究摘 要:本文运用 HAR-RV、HAR-CJ 和 HAR-CJN 对中国工商银行、中国建设银行、中国银行和中国农业银行等大型商业银行的股票进行高频数据风险价值 VaR 建模,方法效果评定采用违反率和 P 值,MAE 和 MSE 作为评价指标。研究结果显示:已实现波动率和持续样本路径方差在中国银行和中国农业银行的股票中较大,而在中国工商银行和中国建设银行中均较小;中国银行和中国农业银行在跳跃成分、持续时间和尺度均大于中国工商银行和中国建设银行;HAR-RV 模型效果最差,HAR-CJ 居中,HAR-CJN 最好。 关键词:HAR-RV;HAR-CJ;
2、HAR-CJN;风险价值 中图分类号:F832.3 文献标识码:A 文章编号:1003-9031(2013)07-0018-06 DOI:10.3969/j.issn.1003-9031.2013.07.04 一、引言 在金融领域当中,风险管理是非常重要的,特别是对于金融机构来讲,风险管理是机构安身立命之根本,而 VaR 为特定的投资组合提供了很好的风险度量。Var 是指在正常的市场环境下,在一定的持有期内和一定的置信水平下可能的最大损失。随着计算机技术和通讯技术的进步,采集和存储更高频率的金融数据已经成为了可能,在这种情况下产生了已实现波动,采用高频数据对金融波动进行研究更能充分利用金融市场
3、价格运动中的信息,有助于对金融波动的估计和建模。 已实现波动率在高频数据建模中起到了越来越重要的作用,施红俊和陈伟忠(2005)利用已实现波动率对广义自回归条件异方差类模型的波动率模拟效果进行了检验,发现该模型的波动率度量精度略胜一筹,但也只能解释一小部分收益率的变动1。郭名媛和张世英(2006)采用“已实现”波动作为新的波动度量方法在上海股票市场和深圳股票市场的高频金融数据对两个股票市场的波动的持续性和协同持续性进行了实证研究2。马玉林(2007)比较基于 GARCH 模型和已实现波动率模型的两种 VaR 预测结果,得到基于已实现波动率的 VaR 预测效果显著地优于基于 GARCH 模型的
4、VaR 预测效果3。Fulvio Corsia, Stefan Mittnik(2008)运用高频数据和非高斯分布对 S&P500 数据进行分析,结果显示已实现波动率改善了预测效果4。Eric Hillebrand,Marcelo C. Medeiros(2010)对道琼斯 23 只股票进行分析,结果显示已实现波动率可以提高非线性模型的精度5。龙瑞和谢赤(2011)在日内高频信息环境下分别采用经典已实现波动率、已实现极差波动率和已实现双幂波动率等三类方法对沪深 300 股指期货的收益波动进行测度6。王良和冯涛(2012)基于“已实现”波动、跟踪误差计算方法及 Granger 因果检验过程、VA
5、R 模型等对“已实现”波动率与跟踪误差之间进行了深入研究7。朱丹、刘艳和李汉东(2012)建立在高频金融时间序列基础上的已实现波动测度是资产价格过程中隐含波动的一致估计量,证明了已实现双幂变差波动测度是比已实现波动更有效的波动估计量8。Manabu Asai 和 Michael McAleer(2012)通过蒙特卡洛方法对 S&P500 数据整体波动中的已实现波动误差进行了分析9。 对 HAR 模型研究相对已实现波动率较少,Ray, S,Savin, N. E(2008)将 HAR 模型和 Fama 模型结合起来对道琼斯五年和十年的数据进行了预测10。Francesco Audrino(201
6、0)介绍了运用 HAR 模型估计和预测 S&P500 和 30 年国债已实现波动之间的关联11。Her-Jiun Sheu(2011)通过 HAR 模型计算出的台湾股市结果达到了最佳的夏普比率12。YIN(2012)运用基于实现波动率的跳跃模型 HAR-RV 对中国八只股票进行了分析,结果表明发展中国家的股票跳跃比发达国家要大13。Dimitrios P.Louzis,Spyros Xanthopoulos(2012)将 HAR 模型运用于不同频率对股市的不同正负冲击14。国内研究 HAR 模型的就更少,张小斐和田金方(2011)构建了已实现波动率的 HAR-L-M 计量模型,实证分析结果显示
7、,中国市场的异质程度要强于美国证券市场, 同时个股更容易受多种异质驱动因素的影响,个股稳定性要比股指差15。西村友作和孙便霞(2012)以上证综指、恒生指数以及 S&P500 指数的日内高频数据作为研究对象,采用跳跃显著性检验方法和扩展 HAR 模型,对波动跳跃特征进行了实证研究16。 对 HAR-CJ 和 HAR-CJN 的研究,国内还没有涉及,本文主要运用HAR-RV、HAR-CJ 和 HAR-CJN 对中国工商银行、中国建设银行、中国农业银行和中国银行的股票数据进行建模,并且对实证结果进行分析。 二、已实现波动 Anderson(1998)首先指出高频数据能够更加精确的测量波动率风险17
8、。Anderson(2001)定义已实现波动率为日内收益率的累积平方和18。 RVt,t+1=(rt,j)2(1) 其中,rt,j 为 t 日 j 时刻日内收益率。 资产价格服从标准跳跃扩散过程: dps=?滋(s)ds+?滓(s)dw(s)+k(s)dq(s) (2) 其中,?滋(s)为连续的和有界变差的漂移项;?滓(s)为正向波动过程;w(s)为标准布朗运动;k(s)dq(s)为跳跃项,如有跳跃项,dq(s)=1,否则为 0;k(s)为跳跃的大小。 为了分解连续和跳跃成分,需要稳健波动的一致估计量,Barndorff-Nielsen 和 Shephard 提出了 RBV,定义如下: RBV
9、t=?滋()rt rt ?滓 2(s)ds (3) 其中,?滋是一个标准的正态随机变量的期望绝对值。RV 和 RBV 之间差别二次变差部分归结于跳跃: Jt=RVt-RBVtk2(s) (4) 假设无跳跃的情况下,检验统计量定义为: JSt=N(0,1) (5) TQt=?驻-1?滋rt 4/3rt 4/3rt 4/3?滓 4(s)ds (6) 其中,?驻=1/M。 对数价格过程中跳跃成分和连续成分非参数测量分别为: C=I(JSt?椎?琢)RVt+I(JSt?椎?琢)RBVt (7) J=I(JSt?椎?琢)(RVt-RBVt) (8) 其中,I()为指示函数,?椎?琢为正态分布中的临界值。
10、 三、HAR 系列模型 (一)HAR 模型 logRV=?茁 0+?茁 1logRV+?茁 2logRV+?茁3logRV+?着 t(9) 其中,logRV表示日已实现波动的对数,logRV表示周已实现波动的对数,logRV表示月已实现波动的对数。HAR 模型对波动率的时间系列和行为的模拟和预测都比其他模型(GARCH,ARFIMA)表现要好。HAR 模型中将短期和长期的已实现波动率作为回归项,同样对模型给予了直觉的解释,其中后面的解释项可以解释不同市场参与者对信息到来时的反应,并且直接联系到对应的长期和短期的行为。HAR 模型同ARFIMA 和 FIGARCH 一样含有真实长记忆模型。 HA
11、R-RV-CJ 模型是 Andersen(2007)提出了,对于已实现波动运用了两个解释变量即跳跃和资产价格连续的样本路径。 logRVt=?茁 0+?茁 CDlogCt+?茁 CWlog(Ct-5,t)+?茁CMlog(Ct-22,t) +?茁 JDlog(Jt+1)+?茁 JWlog(Jt-5,t+1)+?茁 JMlog(Jt-22,t+1)+?着 t (10) 其中,log(Ct-5,t)为周连续成分的对数,log(Ct-22,t)为月连续成分的对数,log(Jt-5,t+1)周跳跃成分的对数,log(Jt-22,t+1)表示月跳跃成分的对数,log(Jt+1)表示跳跃为 0 时候的情况
12、。 HAR-CJN 模型包含四个方面:HAR-C 表示连续样本路径;ACH 模型表示跳跃发生概率;HAR-J 表示跳跃尺度平方;GARCH-t 模型表示隔夜收益。 HAR-C 模型: logC=?茁 0+?茁 CDlogC+?茁 CWlog(C)+?茁CMlog(C)+ ?茁 JDlog(J+1)+?茁 JWlog(C+1)+?茁 JMlog(C+1)+?着 t+1,c(11) 其中,Ch-1C+C+C,Ch-1J+J+J。 GARCH-t 的误差结构如下?着 t+1,c=?滓 t+1,c*zt+1,c,zt+1,ct(v) ,?滓=wc+?琢 1,c?着+?茁1,c+?滓 (二)ACH 模型
13、和 HAR-J 模型 计数过程 N(t)表示直到时间 t 跳跃发生的天数,跳跃发生的风险率为: ht=PrN(t)N(t-1)|Ft-1 (12) 其中,Ft-1 是到 t-1 天时的可得到信息,无信息更新的ACH(1,1)模型为: ht=1/(?追 N(t)-1) (13) 其中,?追 N(t)=?棕+?琢 1dN(t)-1+?茁 1dN(t)-1,dN(t)-1 是持续时间,dN(t)-1=tN(t)-1-tN(t)-2。 增广的 ACH(1,1)通过一个外生变量来更新条件期望持续时间:ht=1/(?追 N(t)-1) ,?追 N(t)=?棕+?琢 1dN(t)-1+?茁 1?追 N(t)
14、-1+?啄 zt-1,其中?啄 zt-1 会调整信息。 将过去连续样本路径变量,过去跳跃尺度,期望持续期作为条件跳跃函数的变量: logS=?茁 0+?茁 CDlogC+?茁 CWlog(C)+?茁CMlog(C) +?茁 SDlog(S)+?茁 SWlog(S)+?茁 SMlog(S+1) +?姿?追 t(i-1)+?酌 dt(i-1) (14) 其中,S为平方跳跃尺度,t(i)表示对应天数跳跃发生的次数,已实现波动率的预测表示如下: RVt|t-1=Var(rt|Ft-1)=E(C|Ft-1)+E(J|Ft-1) (15) 其中,E(C|Ft-1)表示从 HAR-C 模型中计算出的波动连续
15、成分中条件均值,E(J|Ft-1)波动跳跃成分中条件均值。 E(J|Ft-1)=E(S|Ft-1,It=1)P(It=1|Ft-1)=E(S|Ft-1,It=1)ht(16) 其中,E(S|Ft-1,It=1)是跳跃尺度的条件均值,ht 是 t 时刻跳跃发生的条件概率,It 是指示函数。 四、VaR 预测和检验 资产回报系列 rt rt=?滋 t+?孜 t=?滋 t+?滓 tzt(17) 其中,?滋 t 是 rt 分布的均值,?滓 t 是?滋 t 分布的规模,zt 是随机变量,则 rt=?滋 t+(18) h 步预测 VaR 为 VaRt|t-h=?滋 t|t-h+?滓 t|t-hQa(z)
16、。 (19) 第一阶段的检验,将击中系列记为 Ht=I(rt-VaR) ,Ft-1 表示直到 t-1 天得信息,无条件覆盖测试要求击中数的观测数统计上等于要求的水平 H0 E(Ht)=?琢,似然比测试统计量为: LRuc=2ln(1-N/T)T-N)-2ln(1-?琢)T-N(?琢)N) (20) 二元一阶马尔科夫可转换概率矩阵为: =1-?仔 01?仔 011-?仔 11?仔 11(21) 其中?仔 ij=P(Ht=i|Ht=j) 似然比检验为: LRin=2ln(1-?仔 01)n00?仔 01n01(1-?仔 11)n10?仔 11)n11-2ln(1-?仔 1)n00+n10?仔 1n
17、00+n10) (22) nij 表示从状态 i 到状态 j 的转换数目,条件覆盖测试统计量为: LRcc=2ln(1-?仔 01)n00?仔 01n01(1-?仔 11)n10?仔 11)n11-2ln(1-?琢)T-N(?琢)N) (23) 第二阶段评价,两个损失函数为: MSE=(rt+h-E(rt+h|rt+hVaR) )2rt+hVaR(24) MAE=(rt+h-E(rt+h|rt+hVaR)|rt+hVaR(25) 其中,T0 是估计样本的最后,K 是样本外 VaR 预测的尺度,?撰是指示函数。 五、实证分析 本文选取了中国银行(BOC) 、中国建设银行(CCB) 、中国工商银行
18、(ICBC)和中国农业银行(ABC) ,时间跨度为 2012 年 7 月 2 日到 2013年 4 月 23 日,数据为 5 分钟高频数据,一共 9431 个观测数。样本内数据为 2012 年 7 月 2 日到 2012 年 12 月 31 日数据,样本外数据为 2013 年1 月 1 日到 2013 年 4 月 23 日数据。 图 1、图 2、图 3、图 4 展示了四个大型商业银行的收益率、核密度和 QQ 图,从核密度和 QQ 图可以看出收益率数据的分布不服从正态分布。从表 1 可看出已实现波动率和持续样本路径方差在中国银行和中国农业银行数值较大,而在中国工商银行和中国建设银行这两个数值均较
19、小,另外从跳跃方面来讲,跳跃成分,持续时间和尺度,中国银行和中国农业银行在跳跃方面数值均大于中国工商银行和中国建设银行,中国工商银行股票的跳跃成分较少,持续时间较短,但跳跃尺度会大于中国建设银行,中国农业银行的跳跃成分最大,跳跃持续时间最长,中国银行的跳跃尺度在四个指数中最大。 表 2 显示了 ACH 模型的结果,从结果中可看出,中国银行和中国农业银行股票的跳跃持续期和跳跃发生风险率都高于中国工商银行和中国建设银行,一次跳跃后无跳跃持续时间越长,跳跃发生的风险率就越高。表 3 显示了 HAR-J 模型估计的结果,从表 3 可看出,中国银行和中国农业银行的股票跳跃尺度的持续性高于中国工商银行和中
20、国建设银行。 从表 4 和 5 可看出,不论从违反率还是 p 值,HAR-CJ 和 HAR-CJN 比HAR-RV 返回测试结果要好,且 HAR-CJN 的模型效果最好,中国工商银行和中国建设银行的违反率和 p 值比中国银行和中国农业银行的要好很多。从 1%VaR 来看,中国工商银行和中国建设银行的违反率比较接近 1%,而中国银行和中国农业银行则比较偏离,从 5%VaR 来看,中国银行和中国农业银行的违反率则远远偏离 5%。 从表 6 可看出,不论从 MAE 还是 MSE 指标来看,HAR-RV 模型效果最差,HAR-CJ 居中,HAR-CJN 最好。另外可看出中国工商银行和中国建设银行的这两
21、个指标较小,而中国银行和中国农业银行这两个指标偏大。 六、结论 本文对中国工商银行,中国建设银行,中国银行和中国农业银行的股票数据进行风险价值 VaR 建模,运用的方法为常用的 HAR-RV 和国内还没有涉及的 HAR-CJ 和 HAR-CJN 这三种方法。对方法效果评定采用了违反率和 P 值、MAE 和 MSE 作为评价指标,研究结果表明已实现波动率和持续样本路径方差在中国银行和中国农业银行中较大,而在中国工商银行和中国建设银行这两个数值均较小,中国银行和中国农业银行在跳跃成分,持续时间和尺度均大于中国工商银行和中国建设银行。不论从违反率还是 p 值,HAR-CJ 和 HAR-CJN 比 HAR-RV 返回测试结果要好,且 HAR-CJN 的模型效果最好,中国工商银行和中国建设银行的违反率和 p 值比中国银