1、极值理论在风险价值度量中的应用1、引言自 20 世纪 70 年代以来,金融市场的波动日益加剧,一些金融危机事件频繁发生,如1987 年的“黑色周末”和亚洲金融危机,这使金融监管机构和广大的投资者对金融资产价值的暴跌变得尤为敏感。金融资产收益率的尖峰、厚尾现象也使传统的正态分布假定受到严重的质疑,因此如何有效地刻画金融资产收益率的尾部特征,给出其渐进分布形式,及各种风险度量模型的准确估计方法和置信区间,依此制定投资策略,确定国家监管制度,成为风险度量和管理所面临的巨大挑战。目前,对金融资产损失的估计方法主要包括历史模拟、参数方法和非参数方法。历史模拟是一种最简单的方法,它利用损失的经验分布来近似
2、真实分布,但是该方法不能对过去观察不到的数据进行外推,更不能捕获金融资产收益序列的波动率聚类现象,而受到大量的批评。参数方法假设收益符合某种特定的分布如:正态分布、t 分布等,再通过分布与样本的均值、方差的匹配对参数进行估计,或者是假设收益符合某种特定的过程如:模型、 模型,该方法可以在一定程度上解释尖峰后尾现象和波动率聚类ARMGCH问题,具有比较好的整体拟和效果。不过参数方法只能对已经到来的灾难信息给出准确的估计,对于即将到来的灾难信息无法给出准确的预测,因此对极端事件的估计缺乏准确性。非参数方法则主要包括极值理论(EVT) ,该理论不研究序列的整体分布情况,只关心序列的极值分布情况,利用
3、广义帕累托分布(generalized Pareto distribution)或者广义极值分布(generalized extreme value distribution)来逼近损失的尾部分布情况。 Danielsson and de Vries(1997)以 7 支美国股票构成的组合为样本比较各种模型的表现情况,发现 EVT 的表现比参数方法和历史模拟方法明显的好。Longin(2000)认为极值理论的优点在于它的没有假设特定的模型,而是让数据自己去选择,而 GARCH 模型作为估计风险的一种方法,它只能反映当时的波动率情况,对于没有预期到的变化缺乏准确性。不幸的是,Lee and Sa
4、ltoglu(2003)把 EVT 模型应用到 5 个亚洲股票市场指数上,发现表现令人非常不满意,而传统的方法尽管没有一个在各个市场表现都是绝对优于其它模型的,但都比 EVT 模型的表现好。本人认为 EVT 模型之所以在亚洲市场表现不好主要是因为亚洲金融市场的数据具有很强的序列相关和条件异方差现象,不能满足 EVT 模型要求的独立同分布假定。另外,Jondeau and Rockinger(1999 ) ,Rootzen and Kluppelberg(1999) ,Neftci (2000) ,Gilli and Kellezi( 2003)和 Christoffersen and Gonc
5、alves(2004)也分别采用极值原理和其他模型对金融数据的尾部特征进行了分析和比较。本章在传统单纯采用极值理论(假设被分析数据是独立同分布的)描述金融资产收益尾部特征的基础上,把 ARMA(Asymmetric)GARCH 模型和极值理论有机的结合起来。首先利用 ARMA(Asymmetric)GARCH 模型捕获金融数据中的序列自相关(Correlation)和异方差(Heteroskedasticity)现象,利用 GMM 估计参数,获得近似独立同分布的残差序列,再采用传统的极值理论对经过 ARMA(Asymmetric)GARCH 模型筛选处理过的残差进行极值分析,在一定程度上克服了
6、传统单纯采用极值理论时,由于金融数据序列自相关和波动率聚类现象不能满足极值理论假设所造成的估计误差。另外,本章还采用 Bootstrap的方法给出了采用极值理论估计出的 VaR 和 ES 在某一置信水平 下的置信区间改进了采用似然比率法估计置信区间时,由于极值事件的小样本所造成的误差。最后,我们利用中国上证指数自 1990 年 12 月 19 到 2004 年 9 月 30 日的对数日收益率进行实证研究给出上证指数的 VaR 和 ES 值,及置信区间。2、VaR 和 ES 的概念:VaR(ValueatRisk)是一种被广泛接受的风险度量工具,2001 年的巴塞耳委员会指定 VaR 模型作为银
7、行标准的风险度量工具。它可以定义为在一定的置信水平 下,某一p资产或投资组合在未来特定时间内的最大损失,或者说是资产组合收益损失分布函数的分位数点。假设 代表某一金融资产的收益,其密度函数为 ,则 VaR 可以表示为:X()fx(1) inf|()1pVaRxXp当密度函数 为连续函数是也可以写作: ,其中 称为分为数函数,()fx ()VaRF它被定义为损失分布 的反函数。该模型计算简单,在证券组合损失 符合正态分布,F X组合中的证券数量不发生变化时,可以比较有效的控制组合的风险。但是 VaR 模型只关心超过 VaR 值的频率,而不关心超过 VaR 值的损失分布情况,且在处理损失符合非正态
8、分布(如后尾现象)及投资组合发生改变时表现不稳定,会出现(2)()()()pppVaRXYaVRY的现象,不满足 Artzner(1999)提出了一致性风险度量模型的次可加性。(Expected shortfull)满足Artzner(1999)提出的次可加性、齐次性、单调性、()pES平移不变性条件,是一致性风险度量模型。它的定义如下:在给定的置信水平 下,设p是描述证券组合损失的随机变量, 是其概率分布函数,令X()FxPX,则 可以表示为:1()inf|()Fx()ES(3)1()0()ppXd在损失 的密度函数是连续时, 可以简单的表示为:X()pS。 本章将分别选用这两个模型来度量金
9、融资产的风险,给|()1pESxF出在修正过的极值模型下,其估计的方法和置信区间。3. ARMA(Asymmetric)GARCH模型3.1 ARMA (Asymmetric)GARCH模型的性质模型:ARM(p,q)(4)11pqtitjttyy其中, 是期望为0,方差为常数 的独立同分布随机变量, 模型在可逆的t2ARM(p,q)情况下可以表示为 。该模型假设 的条件期望是可得的,条件方差为常数,通常()ARty可以用来解释时间序列的相关性,并可以对时间序列进行的短期预测。但是该模型条件方差为常数的假设,使其无法有效的解释在金融时间序列中经常被观察到的波动率聚类现象,为此,我们需要在模型中
10、进一步引入 模型。GARCH我们令 ,其中 是期望为0,方差为常数1,的独立同分布随机变量, 是ttzhtz 2th在 时刻的条件方差。这里我们采用通常使用的最简单的 模型,则条件方t (1,)GARCH差可以表示为: , 模型也可以表示成平方误 的形式:22011tttabh(,1)AR2t(5)2222011()()()t ttttth其中 ,因此 模型本质上是平方误 的 。21()|tttEhF,GARCHtARM(1,)模型的引入不仅可以捕获到金融时间序列的波动率聚类现象,而且可以在一,GARCH定程度上改善 尖峰后尾现象,因为tz(6)44442222()()()tttth zEzE
11、hk k其中 和 分别表示 和 的峰度, 的峰度明显大于等于 的峰度。4hkzttt t另外,在金融序列中我们还可以明显的观察到,波动率正方向变动与收益率负方向变动的相关性大于与收益率正方向变动的相关性,一种可能的解释是收益率的负方向变动会加大波动幅度。而 模型认为收益的正方向变动和负方向变动对波动率变动幅(1,)GARCH度有着相同的影响,为了捕获金融序列波动率变动的这一不对称性,我们引入需要Glosten et al(1993 )提出的非对称 模型:(,)(7)2220111sgn)tttthabh其中 ,在这个模型中我们通过 项来捕获收益sgn()()ttxz21sgn()ta率的正负变
12、动对波动率变动的不同影响,如果收益率的波动与收益率波动率的变动像我们上面所预期的那样,则 。20a这样我们就得到了ARMA(Asymmetric)GARCH模型(8)112 222012111(sgn()()()pqtitjtttt ttttttyyzhabh 3.2、ARMA (Asymmetric)GARCH 模型的参数估计:我们知道在条件正态分布的假设下,可以很容易的利用 ARMA(Asymmetric)GARCH 模型的似然函数,给出参数向量 的估计值,其中012(,)ab, 。即使在金融收益率序列残差不满足条件正态分布的情1(,)p 1(,)q况下,使用正态极大似然估计法,仍然可以得
13、到参数 的一致渐进正态非最小方差估计。但是这样我们得到的残差 将有很大的误差,而 是我们下一步进行 EVT 尾部估计的输tztz入变量,它的有效性将会直接影响我们整个的估计结果,为此我们必须寻找一个更有效的估计方法。GMM( Generalized Method of Moments)广义矩估计恰好可以满足我们的要求,它不需要假设 符合任何分布,只需要 的条件矩。在 Skoglund(2001) “A simple efficient tztzGMM estimator of GARCH models”给出了该估计方法的计算过程和收敛情况。下面给去估计的步骤:首先,定义一个行向量 和广义向量
14、,其中 是工具变2,()tttrhttgIrtI量,则参数 的 GMM 估计可以通过下式得到:(9)11minTTt tgW其中 是一个恰当的权重矩阵。1TttW在 Newey and McFadden(1994)中,我们可以知道,有效的 GMM 估计可以通过另, ,其中 , 是 Jacobian 行1()tttrI1()()ttttr11var(|)ttF(tr列式。把 和 带入上面的目标函数(9)得到:tW(10)11()TTTtttQgg其中, 是一个含有参数 的权重矩阵,它的元素可以表示为:ttg223222()()11()tttitittttijti jhvhh 其中, , , ,2
15、43()v211t tthhcb(0,)t tX221111211,sgn(),sgntttt ttca ,()tttpttqXy (|)kktvEzF通过上面对目标函数(9)的变化,我们得到函数 是恰好可识别的,即参数 的最TQ优估计是使函数 等于 0。另外,我们要进行 GMM 估计还需要一个对参数 的初始估计TQ值和对 的三阶矩和四阶矩的初始估计值,而这一初始值我们可以通过对tzARMA (Asymmetric)GARCH 模型残差符合正态分布的情况进行最大似然估计得到。这样我们就可以得到有效的参数估计值和残差序列 。tz4、极值理论极值理论是测量极端市场条件下风险损失的一种方法,它具有超
16、越样本数据的估计能力,并可以准确地描述分布尾部的分位数。它主要包括两类模型:BMM 模型(Block Maxima Method)和 POT 模型( Peaks over Threshold) ,两类模型的主要区别有:1、极值数据的获取方法上的区别,BMM 模型通过对数据进行分组,然后在每个小组中选取最大的一个构成新的极值数据组,并以该数据组进行建模;POT 模型则通过事先设定一个阀值,把所有观测到的超过这一阀值的数据构成的数据组,以该数据组作为建模的对象,两个模型的共同点是只考虑尾部的近似表达,而不是对整个分布进行建模。2、两个模型分别采用极值理论中的两个不同的定理作为其理论依据,同时也因为
17、获取极值数据的不同方法导致两个模型分别采用不同的分布来拟合极值数据。3、BMM 模型是一种传统的极值分析方法,主要用于处理具有明显季节性数据的极值问题上,POT 模型是一种新型的模型,对数据要求的数量比较少,是现在经常使用的一类极值模型。4、BMM 模型主要用于对未来一段较长的时间内的 VaR 和 ES 预测,而 POT 则可以进行单步预测,给出在未来一段小的时间内VaR 和 ES 的估计值。5、BMM 模型的前提条件是样本独立同分布,POT 模型的前提条件是超限发生的时间服从泊松分布,超限彼此相互独立,服从 GPD(generalized Pareto distribution)分布,且超限
18、与超限发生的时间相互独立。样本独立同分布可以保证 POT 模型的前提条件。4.1 BMM 模型的理论基础假设 表示我们采用 BMM 方法获得的极值数据组,其中 n 表示每个子样本的大小,nM则有下面的极限定理成立定理 1:(Fisher and Tippett (1928), Gnedenko (1943))假设 是一个独立同分布的随()tX机变量序列,如果存在常数 , ,以及一个非退化的分布函数 ,使得 0ncndRH成立,则分布函数 一定属于下面的三种标准的极值分布: dnMGc GFrechet: 0()0xeWeibull: ()()1Gumbel: xeR从图 1 可以清楚的 Fre
19、chet 分布用来描述那些极值无上界有下界的分布,Weibull 分布用来描述极值分布有上界,无下界的分布,Gumbel 分布用来描述极值无上界也无下界的分布。我们通常见到的很多分布函数都可以根据他们尾部的状况划分到上面的三种极值分布分布中去,例如:学生分布、帕累托分布(Pareto distribution) 、对数 Gamma 分布、Cauchy distributed 根据尾部特征可以划分到 Frechet 分布中去;均匀分布和 Beta 分布的尾部分布可以收敛到 Weibull 分布;正态分布、Gamma 分布和对数正态分布的尾部分布都收敛到 Gumbel 分布。 图形 1:标准 Fr
20、echet、Weibull 和 Gumbel 分布图但是,在实际应用中对于一个给定得极值序列,我们应该如何在这三种极值分布中做出选择呢。一种理想的方法是通过参数的形式把三种极值分布统一的表示成一个分布函数,这样我们就可以在利用最大似然估计的时候,把该参数也一块估计出来,让数据去决定它们的选择,这将极大的增加模型估计的准去性。这里我们采用 Jenkinson and Mises 的方法,把三种分布表示成如下单参数的形式:(11)1/()0()xeG其中 ,这一表达形式也被称为广义极值分布函数(Generalized extreme |10xvalue distribution) ,当 时,表示
21、Frechet 分布,当 时,表示 weibull 分布,11当 时表示 Gumbel 分布。0在定理 1 的基础上,对于给定一个金融资产的残差序列,我们就可以首先分组求最大值得到的极值序列记为 。为了表达上的简洁,用 和 代替公式(11)中的 和 ,Xuncd则可以序列 的近似分布函数:(12)1, exp()0()uGu 其中 。然后,我们要对参数进行最大似然估计,这需要得到随机|10xx变量 的概率密度函数,通过概率分布函数(12)对 求导,我们得到随机变量 的概XxX率密度函数:(13)(1) (1),1(ep(0()expxuuug 其中 。通过似然函数就可以得到各参数的估计值:|1
22、0x(14), ,(,)(,)argmx)argxln()u uiuiLx在各参数估计值给定的基础上,我们就可以利用极值分布函数计算不同 下的分位数p值,如用 表示这一分位数,则在 个周期内出现的极值收益会超过这一阀值的预期数pR1p量有且仅有一次。 表达形式为:p(15)1, (1ln)0()pu pRG注:关于参数的置信区间的确定我们在后面给出其计算方法。4.2 POT 模型的理论基础假设序列 的分布函数为 ,定义 为随机变量 超过门值 的条件分布tz()Fx()uyZu函数,它可以表示为:(16)()|)uFyPZyu0y根据条件概率公式我们可以得到:(17)()()()11uuFzyu
23、Fzz定理 2:(Pickand (1975), Balkema and de Haan (1974))对于一大类分布 (几乎包括所有F的常用分布)条件超量分布函数 ,存在一个 使得:()uy,()Gy(12)1/, / 0()()uyFyGue当 时, ;当 时, 。分布函数 被称作广义的0,)0,()GyPareto 分布。图 2:广义 Pareto 分布在 , 取 0.3,0,-0.3 的图形1从图形上我们可以看到 的不同取值确定了尾部的厚度, 越大则尾部越厚, 越小 尾部越薄,从 函数我们还可以得到当 时, 的最大取值为 ,有上界。,()Gy 0yLee and Saltoglu(20
24、03)在金融资产收益时间序列上直接使用 EVT 时,由于序列的尖峰后尾,使得确定出来的 一定是大于零的,但是在我们的模型中,我们对残差序列进行极值分析,因此我们得到的 不一定大于零。根据公式(12)我们可以得到广义的 Pareto 分布的概率密度函数 :,()gy1(), /1(0()ygye因此对于给定的一个样本 ,对数似然函数 可以表示为:1,nz (,|)Lz(13)1l()l0(,|)nniiiyLyy在 POT 模型中另一个重要的问题,那就是如何确定我们定理 2 中的阀值 ,它的确定u非常重要,它是正确估计参数 和 的前提。如果阀值 选取的过高,会导致超额数据量u太少,使估计出来的参
25、数方差很大;如果阀值 选取的过低,则不能保证超量分布的收敛性,使估计产生大的偏差。Danielsson et al(1997) 、de Vries(1997)和 Dupuis(1998)给出了对阀值 的估计方法,一般有两种:一是根据 Hill 图,令 表示u (1)(2)()nXX独立同分布的顺序统计量。尾部指数的 Hill 统计量定义为:,1()lnkkniiHHill 图定义为点 构成的曲线,选取 Hill 图形中尾部指数的稳定区域的起始点的横1,()kn坐标 K 所对应的数据 作为阀值 。二是根据样本的超额限望图,令Xu,样本的超限期望函数定义为:(1)(2)()nX(14))1iikueumin|ikXu超限期望图为点 构成的曲线,选取充分大的 作为阀值,它使得当 时(,) xu为近似线性函数。另外,如果超限期望图当 时是向上倾斜的,说明数据遵循形()ex xu状参数 为正的 GPD 分布,如果超限期望图当 时是向上倾斜的,说明数据来源于尾部较短的分布,如果如果超限期望图当 时是水平的,则说明该数据来源于指数分布。x这一判断方法是根据广义 Pareto 分布在参数 的时候,它超限期望函数 是一个线1()em性函数。