论文部分内容阅读
近年来,人工智能AI发展之势迅猛,人工智能机器人AlphaGO对战人类大获全胜,“智能+”首次写入2019年国务院政府工作报告,种种迹象无不说明人工智能在我们生活中扮演着日益重要的角色。量化投资为金融领域的一个庞大分支,其中,多因子选股是一项较为成熟的选股技术。因此,本文将深度学习应用于多因子选股,构建了基于LSTM神经网络算法的多因子选股模型。通过与SVM算法对比,发现LSTM神经网络算法比SVM算法更适用股票这类时间序列数据,并将LSTM预测出来的股票进行回测发现其能够获得超过比较基准的收益率。本文选取2012年1月至2018年12月的每一周最后一个交易日的动态沪深300成分股的因子截面数据作为数据样本,其中2012年1月到2017年12月的数据作为模型的训练数据和验证数据,2018年1月至2018年12月作为模型的测试数据。在选取候选因子方面,分别选取质量、动量、价值、常用技术指标、每股指标、情绪、成长、分析师预期、基础科目与衍生和收益与风险等十类因子,合计因子244个,这在广度和深度上均扩大了候选因子的选取范围。本文模型的构建主要分为以下几个步骤:首先,对原始数据依次进行数据预处理、标签标记和主成分分析降维,然后将处理后得到的新数据喂入支持向量机模型和长短期记忆神经网络模型中作比较分析,通过对比发现LSTM模型更适合股票这类非线性的时间序列数据。其次,在LSTM模型中进行训练、学习,并通过学习得到一个优质模型。最后,将测试数据喂入学习得到的优质模型中进行预测,并依据模型预测得到的结果,选择一些股票构建等权重投资组合作回测检验,以期获得超过同期基准的收益率。通过年化收益率、夏普比率、信息比率和最大回测等评价指标对模型进行评估发现,本文构建的回测模型在2018年这一年间的年化收益率超过比较基准的收益率。