论文部分内容阅读
涨停板制度对每只股票当天的涨跌幅给予适当限制,目的是防止价格的暴涨暴跌。但涨停板制度作为对市场的人工干预,本身也导致了围绕涨停板的较为特别的波动规律。本文的目的就在于发掘其中的规律并设计针对性的交易策略并使用历史数据对交易策略进行模拟。
本文的核心是一个量化交易系统的设计、实现、测试和模拟,有较大的现实意义。文中使用了Logistic回归、决策树和支持向量机等方法对涨停板进行量化分析,涉及到了模型的设计、比较和基于分析结果的交易策略的设计。
本文首先介绍了量化交易的发展和国内外的研究进展,对涨停板和本文运用的量化分析方法的研究现状和应用进行了论述。本文在研究对象、研究方法上都有其创新性,国内尚未有学者对涨停板这一现象做过较为系统的量化研究分析。同时,本文在分析上十分注意实用性和模型对现实的指导意义。
在分析思路上,本文采用了定性分析和定量分析的方式。首先论述了涨停板的类型和联系,接着结合行为金融学理论对涨停板的相关现象进行分析,探讨了动量效应和反转效应在围绕涨停的波动的体现,同时总结了国内针对涨停板的交易策略,这些定性分析是量化分析的基础。
在定性分析后,本文对下文量化分析所使用了Logsitic回归、决策树和支持向量机的理论进行了简单的描述,同时论述了用于分类模型性能评价的混淆矩阵、ROC曲线、AUC、Lift、Gain等概念。
在定量分析部分,本文使用参数估计和数据挖掘方法进行二元判别分析。量化分析遵照了标准的量化分析流程:首先在确定研究的框架的同时对数据进行清洗、整理和拼接,构造分析所用的数据集;然后使用描述性分析手段确定分析的因变量和时间窗口;结合技术分析指标构造虚拟变量同时对缺失值进行处理;最后是模型的设计和比较。在模型的使用上,本文重点介绍了Logistic回归模型,将简单Logistic回归和结合了聚类的两步Logistic回归进行了对比。在Logistic回归不理想的情况下,本文使用Clementine对多种二元判别模型的效果进行比较,然后选择效果可能好于Logistic回归的决策树和支持向量机进行进一步的分析和比较,发现实际建模效果并不理想,接着对这一现象进行了分析。本文在分析中注重模型对实践的指导价值,对模型挑选出的变量及其系数进了经济意义上的解释。同时,在分析过程中并不拘泥于模型的统计意义,SVM、决策树、神经网络也被放在考虑和比较的范围内。
量化分析的目的是指导实践,本文针对前文的分析结果制定了针对涨停板的交易策略,同时使用历史数据对交易策略进行了测试、对比和调优。在这一部分首先简述了量化交易策略,比较了量化交易策略和主观交易策略的差异;然后接着结合上文量化分析的内容制定了简单的交易策略并使用历史数据进行了模拟,将结果和简单的投资策略进行了对比,发现即使在设置很多限制后,使用基于决策树的算法依然能取得远优于大盘的收益;最后简要说明了算法交易、实验金融学等量化前沿内容。
最后,本文对上文的分析思路、建模效果和模型的现实意义进行了总结。对针对涨停板量化分析的特殊性进行了说明。同时,在总结部分还就分析的整个流程,分析的困难点,模型的不足及改进方向进行了描述。
本文的创新体现在数据挖掘和传统参数估计方法在特殊股价波动中的应用;大量数据的分析处理和针对性交易策略的制定、调优和测试。同时,本文在变量的选择和构造上,不但使用了基本面方面的指标,同时也结合了在投资者在涨停板分析中总结的操作经验和短线分析的技术指标对涨停进行解释并构造虚拟变量。这样就保证了构造的变量能反映基本面和量价方面的信息,同时也保证了构造的虚拟变量有较好的经济含义。
本文是一篇实证性质的文章,模型的优美或数学意义并不是本文追求的目标;数据选取的广泛性,模型的实用性,变量的可解释性和对实践的指导价值才是本文的着重点。