论文部分内容阅读
摘 要:本文根据高频数据的特征,采用“已实现”波动率来度量股票价格的波动,并建立了ARFIMA模型,通过比较分析发现该模型是有效的,并将它应用于股票风险价值(VaR)的度量中,大大提高了风险的度量精度。
关键词:高频数据 “已实现”波动率 ARFIMA模型 TARCH模型 VaR
一、引言
无论是在金融市场的理论研究中,还是在具体的金融实践中,风险管理都备受关注。对金融风险进行有效的预警、防范、控制与管理一直是各国政府与投资机构所追求的目标之一,而金融市场波动率则是度量风险与风险价值的核心问题。关于波动性的研究已经渗透到整個现代金融理论体系,对波动性的精确度量和预测已经成为资产定价、金融衍生品的定价和交易策略设计的关键。可见,对波动率的研究不管是理论上还是现实中都具有举足轻重的作用。
Andersen和Bollerslev(1998)在金融高频时间序列基础上提出了“已实现”波动率(Realized Volatility,RV)。这种波动率的度量方法是无模型的(Model free),计算简便,理论背景深厚,在金融研究领域和实际操作领域都有很广阔的应用前景。Andersen、Bollerslev、Diebold、Ebens(1998,2001)等金融经济学家对这种高频估计方法进行了一系列研究,发现如果价格遵循普通的扩散过程,用此方法计算的“已实现”波动率,是无偏的。而且,当高频数据的时间间隔趋近于0时,“已实现”波动率的测量误差也趋于0。因此可以把“已实现”波动率当作一个观测值,它没有经典算法所带来的时间滞后。这样,我们就可以通过直接研究“已实现”波动率来检验波动率的各种特性,然后根据“已实现”波动率的特性进行建模,并对未来波动率进行预测。
不过,在“已实现”波动率估计的过程中,发现基于高频数据的“已实现”波动不仅仅存在着测量误差还有由金融市场微观结构造成的误差,并且市场微观结构误差随着抽样频率的升高而增大,从而导致当金融高频数据的抽样频率增加时,日内收益序列会出现自相关现象,这就使得“已实现”波动估计量是有偏的估计量。因此,在对“已实现”波动率建模之前,首先要确定一个最优的抽样频率,这是准确的度量中国股市波动率的一个关键性问题,本文采用Fleming和Ostdiek、黄后川和陈浪南的方法,首先对高频数据计算出了1-30分钟,然后对其求两次移动平均:。由于经过移动平均处理后估计值上下波动明显减小,表明数据所含的噪声显著减小。同时,由于高频估计的波动率趋向于低估实际波动率,从1分钟时间间隔开始的波动率估计图形在开始阶段是单调上升的。故而可以选取波动率第一次极大值对应的时间间隔为最优时间间隔。由于实际情况不是每天的最优时间间隔刚好都是同一点,所以为了使我们的度量结果更加客观,我们根据每天的的最优时间间隔求取众数,以众数最大对应的时间间隔为最优时间间隔。
二、ARFIMA模型简介
对于长记忆性的度量本文采用的ARFIMA模型。下面对ARFIMA模型做以下简单介绍:金融时间序列常具有长记忆性,即相距较远的时间间隔具有显著的序列相关性。如果收益率具有长期记忆性,则意味着收益是可预测的,因此,对于长期记忆性的研究具有重要意义,Granger&Joyeus(1980),Hosking(1981)将分数差分噪声(FI)和ARMA模型相结合提出了自回归分整移动平均模型来描述长记忆过程。该模型的具体形式如下:
对应的根在单位圆外,为白噪声。当时,即为平稳的ARMA模型,当时,为ARIMA模型,即单位根过程。Hosking(1981)证明了当时,为平稳时序;时,为长记忆时序;时,为短记忆时序;时,为非平稳的序列且具有长记忆性。
三、我国沪深300指数高频数据的波动率预测模型建立与应用
本文使用的原始数据是中国沪深300指数在2008年3月28日至2010年8年24日期间内的每分钟交易数据的收盘价。由于节假日和一些偶然因素等的影响,仅获得了这期间475天的数据,平均每日241条。
图1中国沪深300指数最优时间间隔频率图。
由图1可以看出,时间间隔为5分钟时取得最大的众数,而且其它时间间隔的频率都非常低,因此我们采用5分钟的数据进行研究,期望能够找到合适的模型。根据沪深300指数5分钟的数据,我们可以得到收益率、“已实现”波动率、对数“已实现”波动率的基本统计特征,如表1
根据表1,我们发现:(1)“己实现”波动率序列的分布是非正态的,存在严重的偏斜和尖峰厚尾现象。(2)收益率序列、对数“己实现”波动率序列接近于正态分布。(3)二组数据的LB检验都表明有序列存在自相关,说明中国沪深300指数的波动并不是固定不变的,具有时变性和集聚性。
运用MATLAB程序计算得到。显然,,表明中国股票市场的已实现波动率序列是长记忆序列,具有长记忆性。所以采用ARFIMA模型来度量“已实现”波动率。
最终得到最优的模型为
为了显示ARFIMA模型的优越性,本文还将结果和TARCH模型做了对比分析。
由表2的参数估计结果,我们可以得到如下的TARCH模型:
由方差方程中,,说明中国股票市场存在杠杆效应,即利空消息会带来更大的冲击。这与大多数市场的表现是相同的。
采用外推法,将预测样本带入TARCH模型的方程很容易得到条件波动率的预测值。
本文仅采用平均相对误差对ARFIMA模型和TARCH模型预测效果进行比较分析。ARFIMA模型预测出来的波动率与真实值之间的平均相对误差为;TARCH模型的平均相对误差。从平均相对误差的计算结果我们就可以很容易看出ARFIMA模型的平均相对误差要比TARCH模型小很多,证明了ARFIMA模型的预测精度要比TARCH模型高,ARFIMA模型的预测效果要比TARCH模型好。我们可以将ARFIMA模型测定出来的“已实现”波动率应用于VaR的计算中,并采用Kupiec(1995)失败率检验法对该模型的有效性进行检验。检验结果如下:
说明在5%,2.5%,1%显著性水平下,我们不能拒绝原假设,认为失败频率与没有显著的差别。也就是说,基于“已实现”波动率的VaR模型是有效的。
四、结语
通过以上结论,基于高频“已实现”波动率的ARFIMA模型的预测精度比较高,基于条件“已实现”波动率的VaR模型是有效的,因此,可以将条件“已实现”波动率应用于风险价值(Value at Risk,VaR)模型中,为投资者做出正确的投资决策、控制和回避市场系统风险提供了可靠的依据,也为金融监管机构运用先进的风险管理技术,准确评估风险大小,提高金融市场总体的监管水平提供了理论和技术支持。本文仅考虑了单维的情况,仅对沪深300的情况进行了研究,而现实中我们关注更多的是金融资产组合,探索有效的方法对多维情况下“已实现”波动率进行有效估计是今后努力的一个方向。
参考文献:
[1]Andersen TG, BollerslevT,“DM-Dollar volatility: Intraday Activity Patterns, Macroeconomic announcements, and Longer run dependencies”,Journal of Finance,Vo.l 53(1998) , pp. 219-265.
[2]Fleming J,Kirby C, Ostdiek B.The Economic Value of Volatility Time Using”Realized Volatility” [J].Journalof Financial Economic, 2003,67:473-509
[3]Granger CW J, Joyeux R. An Introduction to Long-memory Time Series Models and Fractional Differencing[ J]. Journal of Time Series Analysis, 1980(1): 15-29.
作者简介:赵静(1985—),女,汉族,山东嘉祥县人,硕士,讲师,主要从事统计学、概率论与数理统计等的教学工作。
关键词:高频数据 “已实现”波动率 ARFIMA模型 TARCH模型 VaR
一、引言
无论是在金融市场的理论研究中,还是在具体的金融实践中,风险管理都备受关注。对金融风险进行有效的预警、防范、控制与管理一直是各国政府与投资机构所追求的目标之一,而金融市场波动率则是度量风险与风险价值的核心问题。关于波动性的研究已经渗透到整個现代金融理论体系,对波动性的精确度量和预测已经成为资产定价、金融衍生品的定价和交易策略设计的关键。可见,对波动率的研究不管是理论上还是现实中都具有举足轻重的作用。
Andersen和Bollerslev(1998)在金融高频时间序列基础上提出了“已实现”波动率(Realized Volatility,RV)。这种波动率的度量方法是无模型的(Model free),计算简便,理论背景深厚,在金融研究领域和实际操作领域都有很广阔的应用前景。Andersen、Bollerslev、Diebold、Ebens(1998,2001)等金融经济学家对这种高频估计方法进行了一系列研究,发现如果价格遵循普通的扩散过程,用此方法计算的“已实现”波动率,是无偏的。而且,当高频数据的时间间隔趋近于0时,“已实现”波动率的测量误差也趋于0。因此可以把“已实现”波动率当作一个观测值,它没有经典算法所带来的时间滞后。这样,我们就可以通过直接研究“已实现”波动率来检验波动率的各种特性,然后根据“已实现”波动率的特性进行建模,并对未来波动率进行预测。
不过,在“已实现”波动率估计的过程中,发现基于高频数据的“已实现”波动不仅仅存在着测量误差还有由金融市场微观结构造成的误差,并且市场微观结构误差随着抽样频率的升高而增大,从而导致当金融高频数据的抽样频率增加时,日内收益序列会出现自相关现象,这就使得“已实现”波动估计量是有偏的估计量。因此,在对“已实现”波动率建模之前,首先要确定一个最优的抽样频率,这是准确的度量中国股市波动率的一个关键性问题,本文采用Fleming和Ostdiek、黄后川和陈浪南的方法,首先对高频数据计算出了1-30分钟,然后对其求两次移动平均:。由于经过移动平均处理后估计值上下波动明显减小,表明数据所含的噪声显著减小。同时,由于高频估计的波动率趋向于低估实际波动率,从1分钟时间间隔开始的波动率估计图形在开始阶段是单调上升的。故而可以选取波动率第一次极大值对应的时间间隔为最优时间间隔。由于实际情况不是每天的最优时间间隔刚好都是同一点,所以为了使我们的度量结果更加客观,我们根据每天的的最优时间间隔求取众数,以众数最大对应的时间间隔为最优时间间隔。
二、ARFIMA模型简介
对于长记忆性的度量本文采用的ARFIMA模型。下面对ARFIMA模型做以下简单介绍:金融时间序列常具有长记忆性,即相距较远的时间间隔具有显著的序列相关性。如果收益率具有长期记忆性,则意味着收益是可预测的,因此,对于长期记忆性的研究具有重要意义,Granger&Joyeus(1980),Hosking(1981)将分数差分噪声(FI)和ARMA模型相结合提出了自回归分整移动平均模型来描述长记忆过程。该模型的具体形式如下:
对应的根在单位圆外,为白噪声。当时,即为平稳的ARMA模型,当时,为ARIMA模型,即单位根过程。Hosking(1981)证明了当时,为平稳时序;时,为长记忆时序;时,为短记忆时序;时,为非平稳的序列且具有长记忆性。
三、我国沪深300指数高频数据的波动率预测模型建立与应用
本文使用的原始数据是中国沪深300指数在2008年3月28日至2010年8年24日期间内的每分钟交易数据的收盘价。由于节假日和一些偶然因素等的影响,仅获得了这期间475天的数据,平均每日241条。
图1中国沪深300指数最优时间间隔频率图。
由图1可以看出,时间间隔为5分钟时取得最大的众数,而且其它时间间隔的频率都非常低,因此我们采用5分钟的数据进行研究,期望能够找到合适的模型。根据沪深300指数5分钟的数据,我们可以得到收益率、“已实现”波动率、对数“已实现”波动率的基本统计特征,如表1
根据表1,我们发现:(1)“己实现”波动率序列的分布是非正态的,存在严重的偏斜和尖峰厚尾现象。(2)收益率序列、对数“己实现”波动率序列接近于正态分布。(3)二组数据的LB检验都表明有序列存在自相关,说明中国沪深300指数的波动并不是固定不变的,具有时变性和集聚性。
运用MATLAB程序计算得到。显然,,表明中国股票市场的已实现波动率序列是长记忆序列,具有长记忆性。所以采用ARFIMA模型来度量“已实现”波动率。
最终得到最优的模型为
为了显示ARFIMA模型的优越性,本文还将结果和TARCH模型做了对比分析。
由表2的参数估计结果,我们可以得到如下的TARCH模型:
由方差方程中,,说明中国股票市场存在杠杆效应,即利空消息会带来更大的冲击。这与大多数市场的表现是相同的。
采用外推法,将预测样本带入TARCH模型的方程很容易得到条件波动率的预测值。
本文仅采用平均相对误差对ARFIMA模型和TARCH模型预测效果进行比较分析。ARFIMA模型预测出来的波动率与真实值之间的平均相对误差为;TARCH模型的平均相对误差。从平均相对误差的计算结果我们就可以很容易看出ARFIMA模型的平均相对误差要比TARCH模型小很多,证明了ARFIMA模型的预测精度要比TARCH模型高,ARFIMA模型的预测效果要比TARCH模型好。我们可以将ARFIMA模型测定出来的“已实现”波动率应用于VaR的计算中,并采用Kupiec(1995)失败率检验法对该模型的有效性进行检验。检验结果如下:
说明在5%,2.5%,1%显著性水平下,我们不能拒绝原假设,认为失败频率与没有显著的差别。也就是说,基于“已实现”波动率的VaR模型是有效的。
四、结语
通过以上结论,基于高频“已实现”波动率的ARFIMA模型的预测精度比较高,基于条件“已实现”波动率的VaR模型是有效的,因此,可以将条件“已实现”波动率应用于风险价值(Value at Risk,VaR)模型中,为投资者做出正确的投资决策、控制和回避市场系统风险提供了可靠的依据,也为金融监管机构运用先进的风险管理技术,准确评估风险大小,提高金融市场总体的监管水平提供了理论和技术支持。本文仅考虑了单维的情况,仅对沪深300的情况进行了研究,而现实中我们关注更多的是金融资产组合,探索有效的方法对多维情况下“已实现”波动率进行有效估计是今后努力的一个方向。
参考文献:
[1]Andersen TG, BollerslevT,“DM-Dollar volatility: Intraday Activity Patterns, Macroeconomic announcements, and Longer run dependencies”,Journal of Finance,Vo.l 53(1998) , pp. 219-265.
[2]Fleming J,Kirby C, Ostdiek B.The Economic Value of Volatility Time Using”Realized Volatility” [J].Journalof Financial Economic, 2003,67:473-509
[3]Granger CW J, Joyeux R. An Introduction to Long-memory Time Series Models and Fractional Differencing[ J]. Journal of Time Series Analysis, 1980(1): 15-29.
作者简介:赵静(1985—),女,汉族,山东嘉祥县人,硕士,讲师,主要从事统计学、概率论与数理统计等的教学工作。