论文部分内容阅读
随着机器学习技术应用的不断深入,量化投资呈现一些新的发展趋势,投资者能够利用机器学习算法来处理更大量的数据,挖掘市场的内在规律。量化选股策略作为一类重要的量化投资策略,具有重要的地位,其借助机器学习的力量也有了进一步的发展。本文采用国内最具代表性的沪深300指数成分股作为实证研究对象,以04年初至19年底作为研究区间,研究了基于随机森林模型、梯度提升树模型及混合模型的量化选股策略。本文首先介绍了所使用的机器学习相关模型的理论知识,之后进行基础模型的搭建工作,基于收益率特征构造了训练集和交易集,并对模型进行训练,根据预测概率选出头部做多的k只股票和尾部做空的k只股票,舍弃掉中间方向较为不确定的股票,构造投资组合。在k=10、扣除交易费用前的情况下,基于GBDT模型的策略日均收益率达到了 0.37%,远高于按照相同方式持有并交易沪深300指数所获得的日均收益率0.04%;基于混合模型的策略每日收益大于0的概率达到了 69.62%,扣除交易费用后依然可以达到58.59%,高于持有市场指数策略的52.78%,策略表现较为良好。本文对基础模型进行了一定的改进,形成了两个策略,一个是赋权策略,一个是周频策略。其中,在k=10、扣除交易费用前的情况下,基于GBDT的赋权策略日均收益达到0.40%,相比基础模型策略有了一定的提升;而在k=10、扣除交易费用前的情况下,基于混合模型的周频策略避免了繁琐的每日调仓,周平均收益可以达到0.71%,远高于持有市场指数策略的0.18%,改良后的策略效果良好。我们的策略具有较强的实用价值,能够为投资者提供参考。