1、1基于高频数据的股指期货价格发现功能的动态研究摘要:利用沪深 300 指数和股指期货主力合约的日内高频数据,创新性地采用递归协整和公共因子模型方法对股指期货价格发现功能的动态变化进行了深入研究,发现在股指期货运行之初,股指期货市场与现货市场并不具有稳定的协整关系,股指期货不具有价格发现功能。随着市场的不断完善,期现货市场之间开始存在稳定的协整关系,股指期货开始具有价格发现功能,但价格发现功能表现并不理想。在价格发现过程中,起主要作用的是现货市场,而并非期货市场。 关键词:高频数据;股指期货;价格发现;递归协整;公共因子模型 中图分类号:F830.91 文献标识码:A 文章编号:1007-210
2、1(2013)03-0048-06 一、引言 2010 年 4 月 16 日,我国第一只股票指数期货合约正式上市交易,作为标的的沪深 300 指数在最初几个月一路走低(在不到 3 个月时间内,下跌了 27.3%) 。有一种观点认为,股指期货是促使股指下跌的原因,对于这一问题的回答需要我们对两市场之间的关系及期货市场价格发现功能的发挥情况进行更为深入的研究。 所谓的价格发现功能,是指相对于现货市场价格,期货市场价格能够对于新信息能做出更快的反应,即期货价格对于同期现货价格具有引2领作用。价格发现是期货市场的基本功能之一,是期货市场套期保值功能发挥的前提。金融学理论表明,由于股指期货交易具有成本低
3、、杠杆倍数高、执行指令速度快等优点,交易活跃,因此相对于现货市场,股指期货市场能更快地对市场信息做出反应,期货价格的变化会领先于现货价格的变化,具有价格发现功能。 关于这一方面的实证研究,在实证方法上主要有以下三种思路: 第一种思路是在协整分析的基础上,采用误差修正模型等方法。其中,协整分析主要是考察期现货市场价格之间是否具有长期稳定的均衡关系,而误差修正模型主要是刻画期货价格与现货价格对短期价格偏离的反应。这种思路主要是对价格(收益)的一阶矩进行研究。 Ghosh(1993)1采用协整分析和误差修正模型对 S&P500 指数期货价格和现货价格之间的关系进行了研究,研究发现它们之间具有长期稳定
4、的协整关系,且在短期关系中,期货市场价格对于现货市场价格具有较强的影响力。Booth 等(1999)2采用了同样的方法研究了德国 DAX指数期货和期权的价格发现过程,研究结果表明 DAX 指数期货的价格发现功能优于期权。任燕燕和李学(2006)3采用向量自回归模型和误差修正模型,对股指期货的价格发现功能进行了研究,研究结果表明,股指期货市场价格领先于现货市场价格。张宗成和刘少华(2010)4采用Granger 因果检验、协整检验及误差修正模型对上市以来沪深 300 股指期货与现货之间的关系进行了研究,发现无论长期还是短期,期货市场对于现货市场的影响都比较大。 第二种思路是对价格(收益)的二阶矩
5、进行研究,即通过考察两市3场之间的波动溢出效应,来揭示其各自在价格发现中的地位。Hamao(1990)5最早提出了“波动溢出效应”模型,通过该模型可以考察价格波动和信息传播之间的关系。通常采用 GARCH 类模型进行这方面的实证研究。 Bhar(2001)6采用二元 EGARCH 模型对澳大利亚期现货市场之间的动态关系进行了实证研究。Zhong 等(2004)7采用修正的 EGARCH 模型对墨西哥期现货市场之间的动态关系进行了研究,发现股指期货市场对于现货市场存在波动溢出效应。邢精平等(2011)8采用多元 T-GARCH 模型研究了我国股指期货上市以来期现货市场之间的波动溢出效应,研究结果
6、表明两市之间存在显著的双向波动溢出,但期货市场的波动溢出效应强于现货市场的波动溢出效应。刘晓彬等(2012)9基于沪深300 股指期货仿真交易数据,采用 BEKK-MGARCH 模型对期现货市场之间的波动溢出效应进行了研究,结果表明两市场之间存在相互溢出效应,且在产生持久的影响。 第三种思路是在稳定协整关系的基础上,精确量化期现货市场在价格发现过程中的贡献度。方法是公共因子模型,主要是Hasbrouck(1995)10提出的信息份额模型(Information Share,简写为 IS)和 Gonzalo 与 Granger(1995)11提出的长短期模型(Permanent Transito
7、ry,简写为 PT) 。 Hasbrouck(2003)12采用 IS 模型研究了美国证券市场的价格发现过程,发现相对于标准普尔 500 指数和纳斯达克 100 指数而言,小额的期货市场在价格发现过程中的贡献度更大。肖辉等(2006)13使用4脉冲响应与一般因子分解模型对国际五种主要的股指期货市场的价格发现功能进行了研究,发现期货市场在价格发现过程中处于主导地位。熊熊等(2010)14采用 PT 模型分析了沪深 300 股指期货 IF1005 合约生命周期内的价格发现过程,平均来看,股指期货在价格发现过程中起主导作用。许自坚(2012)15通过 IS 和 PT 模型分析股指期货与现货指数各自在
8、价格发现中的贡献度,结果表明股指期货在价格发现过程中占据主导地位。 从以上综述可以看出,上述研究方法只能考察一段时期内股指期货市场价格发现功能的静态表现,不能考察价格发现功能的动态变化。而对于股指期货市场而言,尤其是新兴股指期货市场,考察其价格发现功能的动态变化,对于加深我们对股指期货市场的认识,发现股指期货推出初期的运作规律,促进市场的不断完善和发展都具有十分重要的意义。本文将创新性地采用 Hansen 和 Johansen(1999)16所提出的递归协整的方法(recursive cointegration)考察沪深 300 股指期货价格发现功能的动态表现,这种方法可以考察两市场协整关系的
9、稳定性以及相关调整系数的动态变化,从而有助于我们发现新兴期货市场需要多长的时间得以实现其价格发现功能。与此同时,本文还将利用公共因子模型,对股指期货的价格发现功能做更为精确的刻画。 二、研究方法与模型 (一)递归协整检验 假设 yt=y1 ty2 t,其中 y1 t 为指数现货市场的自然对数价格,而y2 t 为期货市场的自然对数价格。如果两个价格序列都是非平稳的时间5序列,且为同阶单整,并具有协整关系,那么两者之间的关系可用以下误差修正模型表示: ?驻 yt=?琢?茁yt-1+?祝 i?驻 yt-i+Bxt+?着 t (t=1,T) (1) 其中,xt 是一个确定的 d 维的外生向量,代表趋势
10、项、常数项等确定性项;矩阵=?琢?茁的秩决定了协整向量的个数。 除上述标准协整方法外,本文还将采用递归协整方法考察协整关系的稳定性以及一些关键变量系数的递归变化。递归协整分析可在(1)式两种 VAR 表述下进行,第一种是“Z 表述” (Z-representation) ,第二种是“R 表述” (R-representation) 。在第一种表述中, (1)式中长期关系系数和短期关系系数将在每一次递归中被重新估计,而在第二种表述中,短期关系系数?祝 i 将在整个样本期内保持固定不变,只有长期关系系数将在每一次估计中被重新估计。Hansen 和 Johansen(1999)16认为从“R 表述”
11、所得到的估计结果更适用于递归协整分析。本文将详细介绍基于“R 表述”的主要估计过程。 假设 Z0t=?驻 yt,Z1t=yt-1,Z2t=(?驻 yt-1,?驻 yt-p+1) ,为方便表述,这里省略确定性项 Bxt, (1)式可变为 Z0t=?琢?茁Z1t+?祝 Z2t+?着 t(2) 基于样本对(2)式采用最大似然估计法进行估计,其中包含了最低一阶回归,即 X0t 对于 Z1t 和 Z2t 的回归。假设 R0t(T)和 R1t(T)分别表示 Z0t 和 Z1t 对于 Z2t 回归的残差,其中 T 表示是采用全体样本进行回归的结果。 6R0t(T)=Z0t-M02(T)M22(T)-1Z2t
12、(3) R0t(T)=Z1t-M12(T)M22(T)-1Z2t(4) 而 Mtij=zitzj t, (i,j=0,1,2) (5) 接下来的分析是基于以下回归方程,其中方程中已无?祝系数: R0t(T)=?琢?茁R1t(T)+R?着 t(T) (6) (6)式被称之为“R 表述” ,上述方程表明任何导致协整关系不稳定的原因都是由于长期关系结构的变化,而不是短期关系的动态调整。定义(6)式乘积矩阵 SijT(t) ,协整关系的确定仍然取决于求解特征根问题。 ?姿 S11-S10S00-1S01=0(7) 其中特征根 11k0,并且k+1=0,构造特征值统计量: Trace=-Tln(1-i)
13、 ,r=0,1,k-1(8) 同样,由于协整关系是由矩阵=?琢?茁的秩决定,在递归协整分析中,协整向量矩阵?茁的系数在整个样本期内保持固定不变,而调整参数矩阵?琢的系数是随着每一次递归而发生变化。 (二)公共因子模型 为进一步明确期现货市场价格之间的引导关系及其方向,本文将采用公共因子模型精确刻画每个市场在价格发现方面的贡献程度。当前,Hasbrouck(1995)10的信息份额模型和 Gonzalo-Granger(1995)11的长短期模型是使用最多的公共因子模型。这两个模型都是将冲击影响分解到每个市场,分析各个市场对于冲击所作的贡献,但它们使用了不同的价格发现定义。IS 模型分解的是共因
14、子的方差,主要是测量每个市场7的信息对共因子方差的贡献程度,每个市场的贡献比例被称为这个市场的信息份额。而 PT 模型分解的是共因子,所关注的是 VEC 模型中的误差修正机制,通过定义误差修正系数函数,来测量每个市场对共因子的贡献。 1. 信息份额模型 Hasbrouck(1995)10将向量误差修正模型(1)转换为向量移动平均形式: ?驻 yt=?追(L)?着 t(9) 其单整形式: yt=?追(1)?着 k+?追*(L)?着 t(10) 其中,?追(L)为矩阵多项式,L 为滞后算子。?追(1)为影响矩阵,它是移动平均系数之和,?追(1)?着 t 为一个信息对每个市场价格的长期影响。如果影响
15、矩阵中每一行都相同,表明信息对所有价格的长期影响都是相同的。假设?鬃=(?鬃 1,?鬃 2)为?追(L)中的一行,l=(1,1),那么方程(10)可以写作: yt=l?鬃?着 k+?追*(L)?着 t(11) Hasbrouck(1995)10将方程(11)中的?鬃?着 t 定义为两个市场价格的共因子,其方差为:var(?鬃?着 t)=?鬃?赘?鬃。 当信息之间无相关时,即?赘为对角矩阵,那么?鬃?赘?鬃只包含对角线上的两个元素。第一(二)个元素代表第一(二)个的市场对共因子的冲击贡献。每个市场的信息份额,即对价格发现的贡献度可用(12)式表示。 8第 j 个市场的信息份额(价格发现贡献度)为
16、: Sj=(12) 如果信息项之间存在相关性时,此时方程(12)不再成立,这时需采用 Cholesky 分解方法消除信息间的当期相关性。但这种方法存在一个弊端,即 Cholesky 分解与误差修正模型中变量的排序有关。如果市场信息之间正相关,那么第一个变量的信息份额最大,而最后一个变量的信息份额最小。第 j 个市场的信息份额(价格发现贡献度)为: Sj=(13) 其中,?鬃 Mj 为行向量?鬃 M 的第 j 个元素; M=m11 0m12 m22=?滓 1 0?籽?滓 2 ?滓 2(1-?籽 2)1/2(14) Cholesky 分解会对第一个市场价格施加比较大的信息份额。我们可以通过改变模型
17、中变量的排序来得到变量的两个信息份额,即价格发现的上下限。当市场 j 处于第一个变量时,得到的信息份额为其上限;当处于最后一个变量时,得到的信息份额为其下限。Baillie(2002)17推算出期货市场的信息份额的上、下限为: SjU = SjL =(15) Tatyana Zabotina(2002)认为,上下限信息份额的均值可作为价格发现贡献程度的解释。如果一个市场的信息份额均值相对较大,则表明这个市场吸收了更多的信息,在价格发现功能中发挥更重要的作用。 2. 长短期模型 Gonzalo 和 Granger(1995)11将共因子定义为 yt 的一个组合,满足?祝=?琢=(?酌 1,?酌
18、2)为共因子系数向量。通过对误差9修正项施加约束,可以识别共因子的系数。他们证明,?祝同误差修正系数向量?琢正交,表示为?琢=(?酌 1,?酌 2)。共因子的设定等价于一种资产组合,?祝为资产组合的权重。因此,每个市场对价格发现的贡献就是其在共因子中的系数。 第 j 个市场的价格发现贡献度为: (16) 三、数据及实证结果 (一)数据及描述性统计量 本文选择沪深 300 股指期货作为研究对象,该品种于 2010 年 4 月 16日上市交易,是中国大陆市场上唯一上市交易的股指期货品种。研究数据为沪深 300 指数和沪深 300 股指期货主力合约的 5 分钟收盘价。 选择 5 分钟高频数据,是因为
19、高频数据若频率过低则无法很好地体现信息的连续性,若频率过高则微观结构误差较大。经国外学者研究,5 分钟是不造成过大微观结构误差的最小频率。而之所以选择收盘价数据是因为道氏理论认为收盘价是最重要的价格,这一价格反映了市场的大部分行为。 鉴于股指期货在运行初期易受市场各种因素的影响,为考察其价格发现功能的动态变化,本文选择的样本期为 2010 年 5 月 4 日2010 年 9月 3 日,共 86 个交易日。上海交易所和深圳交易所每天的交易时间为北京时间上午 9:3011:30,下午 1:003:00。而沪深 300 股指期货的交易时间为北京时间上午 9:1511:30,下午 1:003:15。由
20、于数据可获得性原因,每日数据的选取为 9:3511:30 和1013:0515:00 两个时间段,共 48 个数据,总共 4 128 个 5 分钟交易数据。数据来源于彭博数据库,所采用的计量分析软件为 RATS7.1。 为消除可能存在的异方差,本文对现货价格序列和期货价格序列取自然对数,分别记为 LNHS 和 LNEP,现货市场和期货市场的对数价格收益率分别记为 RS 和 RF,两市场之间的对数基差记为 RB。现货、期货对数价格序列、收益率序列及对数基差序列的统计特征如表 1 所示。从标准差可以看出,期货价格收益率波动相对更为剧烈。现货和期货对数价格收益率序列以及对数基差序列的偏度都左偏,峰度
21、都超过 3。结合 J-B 统计量可知,它们均不服从正态分布,具有尖峰厚尾特征。ADF 和 PP 单位根检验结果表明,在 5%的显著性水平上,现货和期货对数价格序列都为非平稳序列,但一阶差分后所对应的对数收益率序列均为平稳序列。因此,现货和期货的对数价格序列都是一阶单整序列,即 LNHS?荠 I(1) 、LNFP?荠 I(1) 。对数基差序列的 ADF 和 PP 单位根检验表明,在 1%的显著性水平上序列是平稳的。 (二)实证结果及分析 1. Johansen 协整检验 我们知道 LNHS 和 LNEP 都是一阶单整时间序列,可对两者进行协整分析。Johansen 协整检验的关键是判断(1)式中的 Bxt 在误差修正模型中是以何种形式出现,是以常数项还是以带有时间趋势的趋势项出现。Johansen(1992)18给出的判断方法是对于两种情况都进行检验。从表 2 的检验结果可以看出,沪深 300 指数现货价格与指数期货价格之间存在一个协整关系。