论文部分内容阅读
摘 要:协整套利是股票和期货市场上广泛使用的量化交易策略之一。本文将协整套利应用于债券市场交易,根据债券市场的流动性情况选取交易标的,创新性的使用遗传算法确定交易策略的相關参数,同时通过选择性移动平均,解决在止损位附近的无效止损问题。从回测效果看,取得较为良好的效果。同时,本文也提出协整套利应用于债券交易的若干问题,作为后续的研究方向。
关键词:协整套利 配对交易 债券交易 遗传算法
20世纪90年代开始,统计现象和统计规律被应用于套利交易的研究,形成了套利交易的一个非常重要的研究方向——即统计套利。Burgess(1996)在研究FTSE100指数及其成分股的时候,采用逐步回归的方法和ECM的方法,将统计套利定义成无风险套利的一种,他认为统计套利从根本上来说是一种均值回归,也即资产价格将回复到它的长期平均值。Burgess所使用的统计套利方法在本质上是一个基础的协整模型,他所构造的“协整组合”是一个平稳序列,而资产组合短期暂时偏离被视为统计套利的机会。国内学者在统计套利方面也有很多研究进展,方昊(2005)认为统计套利是一个基于统计模型的投资决策过程,需要根据标的证券的价格与数量模型所预测的理论价值进行比对,然后构建投资组合。唐衍伟使用单位根检验法、序列相关检验法和游程检验法对我国资本市场的有效性进行了相关的检验,检验结果证明我国的证券市场远未达到弱势有效,存在大量合适的统计套利机会。卢伟忠在其研究中通过对2005年上半年伦铜期货价格与沪铜期货价格的对比研究,发现伦铜和沪铜存在很大的跨市场套利空间。吴振翔,陈敏(2007)在Hogan等(2004)的基础上,采用证伪的方式来验证市场的有效性:只要有统计套利的存在,就与有效市场假定相违背。利用这种方法,还对我国A股市场的弱有效性加以检验,发现我国A股市场弱有效性不成立。雷井生,林莎(2013)将常用统计套利策略进行改进,设计出新的统计套利策略并进行实证检验。运用各频率数据进行套利的交易次数都显著减少,平均单次收益率则成倍增加,达到了获取最大单次收益及降低交易频率的目的。刘阳,李艳丽,陆贵斌(2016)将神经网络和动态GARCH模型结合,挖掘了价格偏差中的非线性特征,弥补了自回归只能挖掘价格偏差中的线性成分的不足,信息更新的加入使得动态GARCH模型更及时发现波动性的变动,降低了传统静态模型预测的风险。实证表明信息更新NN-GARCH模型的套利框架在不同的参数设置下有不同的表现,考虑交易成本的情况下该框架依然有很好的盈利能力。朱丽蓉,苏辛,周勇(2015)以我国的期货市场为研究对象,提出了协整模型、误差修正模型和基于协整关系的GARCH等3个统计套利模型,设计了相应的交易策略,然后,对样本外数据进行检验,分析不同开仓位、止盈、止损位置与累计收益率的关系。
区别于股票与期货市场,债券市场主要为场外交易,且单券的流动性不高,目前将统计套利应用于债券市场的案例还较少。本文试图将统计套利应用于债券交易市场,同时对交易策略做一定改进。后续章节安排如下,第一部分解释传统的期限利差交易的不足之处;第二至第四部分分别介绍统计套利的具体应用步骤和参数优化;第五部分介绍策略优化。
一、传统利差交易的不足
在传统的期限利差交易中,往往以(国债A利率-国债B利率)为跟踪目标,当利差高于某个阈值时买入国债B,卖出国债A;而当利差低于某个阈值时,卖出国债B,买入国债A;当利差回到某一水平时,进行反向操作,获利离场。套利模型的假设条件之一是利差会均值回归,然而,本文检查了各个期限的利差直方图,发现单纯的使用(a-b)式的利差并不满足均值回归的假设。如下图经过标准化后的10年国债与3年国债利差,更类似于卡方分布。鉴于此,本文将把在期货和股票市场大量使用的统计套利应用于期限利差交易,同时,也会根据市场特点对交易策略做一定调整。配对交易的一般步骤包括选取交易对,进行协整检验,ECM估计,确定交易规则(交易频率、交易触发规则、平仓规则等),以下将逐一进行介绍。
二、统计套利相关步骤
1.选取交易对。不同于股票市场,债券市场的分割程度比较大,目前最为活跃的市场为银行间市场与交易所市场。而按券种分,则大体分为利率债与信用债。由于债券市场主要为场外交易市场,许多个券的交易并不活跃,即使活跃的券种,其买卖价差也较大,因此,选取交易对时要特别考虑流动性问题。另外,随着经济长期步入L型走势,不断的有信用债违约,信用风险并不在配对交易的考虑范围内,因此,不建议将信用债用于债券交易。按照经验和相关托管数据,国债、国开债、AA+以上的同业存单是交易最为活跃且几乎无信用风险的券种,但同业存单还存在一些监管方面的不确定性,因此,本文建议在进行配对交易时,选取国债和国开债的关键期限(1/3/5/7/10年)作为潜在的交易标的,对每个交易组合进行分析。由于分析的方法都一样,因此,若无特殊说明,下文将以10年国债与3年国债作为例子,模型参数的计算时间为2011年4月至2012年4月,回测时间为2012年4月至2017年4月。另外,债券的价格可以表征为全价、净价、到期收益率等形式,为简洁起见,本文都采用中债收益率曲线数据做分析。为简便起见,10年国债收益率记为10Y,3年国债收益率记为3Y,一阶差分分别记为d10Y,d3Y。两者的时序图如下图所示。
2.协整检验。本文使用E-G两步法进行协整检验,具体步骤不在此赘述,以下给出结果。结果显示,两个时间序列本身不是平稳序列,但一阶差分后都平稳,即两者都是1阶单整的,可以进行下一步分析。
两个序列的OLS回归方程为:3Y=0.737510Y+0.4213 (1)
残差单位根检验结果如下:
3.确定交易规则,交易规则如下图所示,其中σ为利差序列的标准差,α,β,γ为需要确定的交易系数。交易规则的简要说明如下:(1)当利差在均值附近[mean-γσ,mean+γσ],记为IDLE,不做交易;(2)当利差运行至[mean+βσ,mean+ασ]时,买入0.7303份10年国债,卖出1份3年国债。当利差运行至[mean-ασ,mean-βσ],卖出0.7375份10年国债,买入1份3年国债。记为OPEN;(3)当利差运行至[mean+ασ,+∞]或[-∞,mean-ασ]时,反向平仓止损,记为CLOSE LOSS,随后进入IDLE状态,等待下一次交易;(4)当利差回归[mean+γσ,mean+γσ]时,反向平仓止盈,记为CLOSE WIN,随后进入IDLE状态,等待下一次交易机会。 α,β,γ的选取直接关系到交易的次数以及盈利能力,一般而言可以用暴力搜索的方法,以0.01左右的精度回测筛选,但由于国债市场的波动较小,每日的波动约为4bps,0.01的搜索精度显然够,但随着搜索精度的提升,搜索时间指数级上涨,因此,暴力搜索并不是一种很好的办法。本文选择采用遗传算法寻优,把一组止损-止盈-开仓线视为一个生物个体的DNA,初始生成一群生物个体,在算法中模拟DNA的交叉、变异,依靠优胜劣汰的机制去得到最优的DNA,即最优的止损-止盈-开仓线组合。下图1为未经过优化的交易收益,下图2为经过优化后的交易收益,提高了近50%。
另外,由于并不是所有的时间内,两者都存在协整关系,且即使有协整关系,两者的交易系数、均值、标准差也会不同,因此配对交易需要定期更新交易参数,但过于频繁的更新也会导致策略不稳定。下图为不更新交易参数与按月更新交易参数的对比,可以看到,交易的次数明显变多。
4.交易策略优化。在回测过程中,我們发现时常会有这一情况发生:利差稍有突破止损线,导致策略强行止损,但下一时间利差又回到交易区间。我们认为这样的止损为无效止损,需要做特殊处理。一个直观的想法是使用利差的移动平均线做交易,但随着曲线在开仓线上的平滑,交易机会也会一并减少。我们建议在止盈线和开仓线上不使用移动平均,在止损线上使用移动平均线。下图1为不采取任何措施下的交易回测图,回测期内共交易27次,13次盈利,14次亏损;下图2为在止损线上采用移动平均的交易回测图,共交易16次,11次盈利,5次亏损,亏损次数大为减少。
三、回测效果
训练数据为2011年4月至2012年4月,回测数据为2012年4月至2017年4月,参数更新窗口为30交易日,止损线上采用5日移动平均,止损线、开仓线、止盈线按照遗传算法确定,分别为。期间共完成24次交易,其中13次盈利,胜率54%,最终收益率为4.65%,最大回撤为0.47%。可以看到,配对交易取得了较好的效果。
四、结语
本文通过将股票市场广泛使用的配对交易应用于债券交易市场,并根据债券交易市场的特点进行一定改进,同时应用遗传算法等技术对交易策略做优化,最终得到了较为满意的回测结果。但回测易实盘难是量化交易一直所特有的现象,以下因素可能会导致实盘交易与回测交易有所区别:(1)交易比例:按模型来看需要严格按照1:β交易两只债券,但实际上不可能,由此产生的偏差可能导致利差曲线的概率分布改变;(2)买卖价差:回测用的数据为收益率曲线的数据,但实际上存在买卖价差、流动性等问题,可能无法买到期望的价格;(3)换券问题:以国债为例,每3个月都会进行一次10年国债发行,新老券之间存在流动性溢价。且在新券发行后,老券的流动性衰减较快。假如交易策略在新券发行后还未平仓,那可能会面临流动性问题;(4)如何实时获取数据:债券市场并没有交易接口可以通过程序获取交易数据,需要实时人工盯盘和输入数据计算,可能会遗漏交易机会。
以上问题需要进行更深入的研究,让策略更加鲁棒。
参考文献 :
[1]Burgess. A.N. Modelling Non-liner cointegration in International Equity Index Futures[J]. Neural Networks in Financial Engineering,Singapore, World Scientific,1996.
[2]方昊. 统计套利的理论模式及应用分析-基于中国封闭式基金市场的检验[J]. 统计与决策,2006,(5):13-16页.
[3]卢伟忠. 中国商品期货套利交易模型和投资方案[D]. 西南财经大学研究生学位论文,2006.
[4]吴振翔. 中国股票市场弱有效性的统计套利检验[J]. 系统工程理论与实践,2007,(2):91-98页.
[5]雷井生,林莎. 基于高频数据的统计套利策略及实证研究[J]. 科研管理,2013,(6):138-145页.
[6]刘阳,李艳丽,陆贵斌.基于信息更新NN_GARCH模型的统计套利研究[J]. 统计与决策,2016,(2):169-173页.
[7]朱丽蓉,苏辛,周勇. 基于我国期货市场的统计套利研究[J]. 数理统计与管理,2015,(7):731-740页.
关键词:协整套利 配对交易 债券交易 遗传算法
20世纪90年代开始,统计现象和统计规律被应用于套利交易的研究,形成了套利交易的一个非常重要的研究方向——即统计套利。Burgess(1996)在研究FTSE100指数及其成分股的时候,采用逐步回归的方法和ECM的方法,将统计套利定义成无风险套利的一种,他认为统计套利从根本上来说是一种均值回归,也即资产价格将回复到它的长期平均值。Burgess所使用的统计套利方法在本质上是一个基础的协整模型,他所构造的“协整组合”是一个平稳序列,而资产组合短期暂时偏离被视为统计套利的机会。国内学者在统计套利方面也有很多研究进展,方昊(2005)认为统计套利是一个基于统计模型的投资决策过程,需要根据标的证券的价格与数量模型所预测的理论价值进行比对,然后构建投资组合。唐衍伟使用单位根检验法、序列相关检验法和游程检验法对我国资本市场的有效性进行了相关的检验,检验结果证明我国的证券市场远未达到弱势有效,存在大量合适的统计套利机会。卢伟忠在其研究中通过对2005年上半年伦铜期货价格与沪铜期货价格的对比研究,发现伦铜和沪铜存在很大的跨市场套利空间。吴振翔,陈敏(2007)在Hogan等(2004)的基础上,采用证伪的方式来验证市场的有效性:只要有统计套利的存在,就与有效市场假定相违背。利用这种方法,还对我国A股市场的弱有效性加以检验,发现我国A股市场弱有效性不成立。雷井生,林莎(2013)将常用统计套利策略进行改进,设计出新的统计套利策略并进行实证检验。运用各频率数据进行套利的交易次数都显著减少,平均单次收益率则成倍增加,达到了获取最大单次收益及降低交易频率的目的。刘阳,李艳丽,陆贵斌(2016)将神经网络和动态GARCH模型结合,挖掘了价格偏差中的非线性特征,弥补了自回归只能挖掘价格偏差中的线性成分的不足,信息更新的加入使得动态GARCH模型更及时发现波动性的变动,降低了传统静态模型预测的风险。实证表明信息更新NN-GARCH模型的套利框架在不同的参数设置下有不同的表现,考虑交易成本的情况下该框架依然有很好的盈利能力。朱丽蓉,苏辛,周勇(2015)以我国的期货市场为研究对象,提出了协整模型、误差修正模型和基于协整关系的GARCH等3个统计套利模型,设计了相应的交易策略,然后,对样本外数据进行检验,分析不同开仓位、止盈、止损位置与累计收益率的关系。
区别于股票与期货市场,债券市场主要为场外交易,且单券的流动性不高,目前将统计套利应用于债券市场的案例还较少。本文试图将统计套利应用于债券交易市场,同时对交易策略做一定改进。后续章节安排如下,第一部分解释传统的期限利差交易的不足之处;第二至第四部分分别介绍统计套利的具体应用步骤和参数优化;第五部分介绍策略优化。
一、传统利差交易的不足
在传统的期限利差交易中,往往以(国债A利率-国债B利率)为跟踪目标,当利差高于某个阈值时买入国债B,卖出国债A;而当利差低于某个阈值时,卖出国债B,买入国债A;当利差回到某一水平时,进行反向操作,获利离场。套利模型的假设条件之一是利差会均值回归,然而,本文检查了各个期限的利差直方图,发现单纯的使用(a-b)式的利差并不满足均值回归的假设。如下图经过标准化后的10年国债与3年国债利差,更类似于卡方分布。鉴于此,本文将把在期货和股票市场大量使用的统计套利应用于期限利差交易,同时,也会根据市场特点对交易策略做一定调整。配对交易的一般步骤包括选取交易对,进行协整检验,ECM估计,确定交易规则(交易频率、交易触发规则、平仓规则等),以下将逐一进行介绍。
二、统计套利相关步骤
1.选取交易对。不同于股票市场,债券市场的分割程度比较大,目前最为活跃的市场为银行间市场与交易所市场。而按券种分,则大体分为利率债与信用债。由于债券市场主要为场外交易市场,许多个券的交易并不活跃,即使活跃的券种,其买卖价差也较大,因此,选取交易对时要特别考虑流动性问题。另外,随着经济长期步入L型走势,不断的有信用债违约,信用风险并不在配对交易的考虑范围内,因此,不建议将信用债用于债券交易。按照经验和相关托管数据,国债、国开债、AA+以上的同业存单是交易最为活跃且几乎无信用风险的券种,但同业存单还存在一些监管方面的不确定性,因此,本文建议在进行配对交易时,选取国债和国开债的关键期限(1/3/5/7/10年)作为潜在的交易标的,对每个交易组合进行分析。由于分析的方法都一样,因此,若无特殊说明,下文将以10年国债与3年国债作为例子,模型参数的计算时间为2011年4月至2012年4月,回测时间为2012年4月至2017年4月。另外,债券的价格可以表征为全价、净价、到期收益率等形式,为简洁起见,本文都采用中债收益率曲线数据做分析。为简便起见,10年国债收益率记为10Y,3年国债收益率记为3Y,一阶差分分别记为d10Y,d3Y。两者的时序图如下图所示。
2.协整检验。本文使用E-G两步法进行协整检验,具体步骤不在此赘述,以下给出结果。结果显示,两个时间序列本身不是平稳序列,但一阶差分后都平稳,即两者都是1阶单整的,可以进行下一步分析。
两个序列的OLS回归方程为:3Y=0.737510Y+0.4213 (1)
残差单位根检验结果如下:
3.确定交易规则,交易规则如下图所示,其中σ为利差序列的标准差,α,β,γ为需要确定的交易系数。交易规则的简要说明如下:(1)当利差在均值附近[mean-γσ,mean+γσ],记为IDLE,不做交易;(2)当利差运行至[mean+βσ,mean+ασ]时,买入0.7303份10年国债,卖出1份3年国债。当利差运行至[mean-ασ,mean-βσ],卖出0.7375份10年国债,买入1份3年国债。记为OPEN;(3)当利差运行至[mean+ασ,+∞]或[-∞,mean-ασ]时,反向平仓止损,记为CLOSE LOSS,随后进入IDLE状态,等待下一次交易;(4)当利差回归[mean+γσ,mean+γσ]时,反向平仓止盈,记为CLOSE WIN,随后进入IDLE状态,等待下一次交易机会。 α,β,γ的选取直接关系到交易的次数以及盈利能力,一般而言可以用暴力搜索的方法,以0.01左右的精度回测筛选,但由于国债市场的波动较小,每日的波动约为4bps,0.01的搜索精度显然够,但随着搜索精度的提升,搜索时间指数级上涨,因此,暴力搜索并不是一种很好的办法。本文选择采用遗传算法寻优,把一组止损-止盈-开仓线视为一个生物个体的DNA,初始生成一群生物个体,在算法中模拟DNA的交叉、变异,依靠优胜劣汰的机制去得到最优的DNA,即最优的止损-止盈-开仓线组合。下图1为未经过优化的交易收益,下图2为经过优化后的交易收益,提高了近50%。
另外,由于并不是所有的时间内,两者都存在协整关系,且即使有协整关系,两者的交易系数、均值、标准差也会不同,因此配对交易需要定期更新交易参数,但过于频繁的更新也会导致策略不稳定。下图为不更新交易参数与按月更新交易参数的对比,可以看到,交易的次数明显变多。
4.交易策略优化。在回测过程中,我們发现时常会有这一情况发生:利差稍有突破止损线,导致策略强行止损,但下一时间利差又回到交易区间。我们认为这样的止损为无效止损,需要做特殊处理。一个直观的想法是使用利差的移动平均线做交易,但随着曲线在开仓线上的平滑,交易机会也会一并减少。我们建议在止盈线和开仓线上不使用移动平均,在止损线上使用移动平均线。下图1为不采取任何措施下的交易回测图,回测期内共交易27次,13次盈利,14次亏损;下图2为在止损线上采用移动平均的交易回测图,共交易16次,11次盈利,5次亏损,亏损次数大为减少。
三、回测效果
训练数据为2011年4月至2012年4月,回测数据为2012年4月至2017年4月,参数更新窗口为30交易日,止损线上采用5日移动平均,止损线、开仓线、止盈线按照遗传算法确定,分别为。期间共完成24次交易,其中13次盈利,胜率54%,最终收益率为4.65%,最大回撤为0.47%。可以看到,配对交易取得了较好的效果。
四、结语
本文通过将股票市场广泛使用的配对交易应用于债券交易市场,并根据债券交易市场的特点进行一定改进,同时应用遗传算法等技术对交易策略做优化,最终得到了较为满意的回测结果。但回测易实盘难是量化交易一直所特有的现象,以下因素可能会导致实盘交易与回测交易有所区别:(1)交易比例:按模型来看需要严格按照1:β交易两只债券,但实际上不可能,由此产生的偏差可能导致利差曲线的概率分布改变;(2)买卖价差:回测用的数据为收益率曲线的数据,但实际上存在买卖价差、流动性等问题,可能无法买到期望的价格;(3)换券问题:以国债为例,每3个月都会进行一次10年国债发行,新老券之间存在流动性溢价。且在新券发行后,老券的流动性衰减较快。假如交易策略在新券发行后还未平仓,那可能会面临流动性问题;(4)如何实时获取数据:债券市场并没有交易接口可以通过程序获取交易数据,需要实时人工盯盘和输入数据计算,可能会遗漏交易机会。
以上问题需要进行更深入的研究,让策略更加鲁棒。
参考文献 :
[1]Burgess. A.N. Modelling Non-liner cointegration in International Equity Index Futures[J]. Neural Networks in Financial Engineering,Singapore, World Scientific,1996.
[2]方昊. 统计套利的理论模式及应用分析-基于中国封闭式基金市场的检验[J]. 统计与决策,2006,(5):13-16页.
[3]卢伟忠. 中国商品期货套利交易模型和投资方案[D]. 西南财经大学研究生学位论文,2006.
[4]吴振翔. 中国股票市场弱有效性的统计套利检验[J]. 系统工程理论与实践,2007,(2):91-98页.
[5]雷井生,林莎. 基于高频数据的统计套利策略及实证研究[J]. 科研管理,2013,(6):138-145页.
[6]刘阳,李艳丽,陆贵斌.基于信息更新NN_GARCH模型的统计套利研究[J]. 统计与决策,2016,(2):169-173页.
[7]朱丽蓉,苏辛,周勇. 基于我国期货市场的统计套利研究[J]. 数理统计与管理,2015,(7):731-740页.