基于机器学习方法的量化投资策略研究

来源 :中国计量大学 | 被引量 : 0次 | 上传用户:lichunhui128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
量化投资在海外的发展已经有30多年的历史,中国目前虽然处于起步的阶段,发展前景仍然十分广阔。股票价格的涨跌一直是人们最关心的问题,对股票市场的分析以及未来行情的预测,更成为一个热门研究的课题。机器学习算法由于具备较高的预测准确率和较好的泛化能力,被广泛地应用到量化投资研究中。所以,本文基于机器学习方法构建量化投资策略,根据模型预测股票价格的涨跌方向,从而做出投资决策。
  本文选择沪深300的所有成分股从2007年1月到2018年1月的月度数据作为研究对象,指标选取包括质量类、成长类、动量类、价值类、情绪类、基础科目与衍生类、收益和风险类、常用技术指标类、每股指标类和分析师类等十类因子。其中,提取股票每个月初的因子暴露作为训练输入特征,输出的是月末股票收盘价的涨跌。文章的第一部分是基于Lasso-logistic模型的量化投资策略。Lasso算法可以同时进行变量选择和参数估计,本文尝试将传统logistic模型与Lasso方法相结合,探索一种行之有效的量化投资策略。第二部分是基于支持向量机方法的量化投资策略。SVM是一种新的机器学习方法,又作为公认的强分类器,在股票预测方面取得了成功的应用,本文采用SVM的方法对股票价格的涨跌问题进行分析。此外,由于选取的因子指标之间相关性较高,可能导致样本信息过度重复的情况。本文考虑通过在Lasso-logistic模型和SVM方法中加入主成分分析,即建立PCA-Lasso-logistic和PCA-SVM模型,先对样本信息进行降维处理,解决因子指标解释冗余的问题。最后一部分是策略的回测检验和风险控制。希望在帮助投资者获得稳定超额收益的同时,能够更加有效地控制投资风险。
  根据实证分析结果,虽然整个选股模型的预测准确率并不突出,但是策略回测依然取得了超越HS300指数的超额收益。机器学习中的Lasso-logistic模型和SVM方法相比较于传统分类模型logistic回归的效果更好,同时也证明了在大量因子指标的情况下,进行PCA降维处理是极其有必要的。最终的结果基本符合理论预期,在主成分分析之后的数据基础上的支持向量机即PCA-SVM的策略收益最好。但是从布林带通道的风险控制效果来看,PCA-SVM模型似乎没有PCA-Lasso-logistic模型的明显。
  本文着重于合理地选取因子指标,再结合科学的机器学习方法,构建量化投资策略,使因主观偏差、操作失误等导致的风险大幅度降低,从而保证投资决策的客观性、科学性以及严谨性。因此,本文对股票价格涨跌的分析和预测有着重大的理论意义和可观的应用价值。
其他文献
中药栀子(Gardeniae Fructus)为茜草科植物栀子(Gardenia jasminoides Ellis)的干燥成熟果实,具有泻火除烦,清热利湿,凉血解毒,消肿止痛的功效。近年来越来越多的文献报导栀子及其主要活性成分京尼平苷(又称栀子苷)具有肝毒性,长期或大量使用可引起肝损伤。由于中草药多成分、多靶点的特性,其毒理机制研究较为困难,早期关于栀子肝毒性的研究主要停留于描述性研究层面,未能
学位
近四十年来,侵袭性真菌感染(IFIs)的发病率逐年增长,并且严重威胁着人类健康。而现有药物种类不足,且真菌耐药现象日益严重。因此,开发新结构,新机制的抗真菌药物具有重要现实意义。  本论文包含两个部分:首先,设计合成了含有苯并三嗪酮、异喹啉酮以及酚酞酮侧链的阿巴康唑类似物,以期发现高活性、抗菌谱广、低毒且具有体内药效的新型三唑类抗真菌先导化合物。其次,基于本课题组前期报道的新型小檗碱类协同抗真菌先
目的:针对阿苯达唑原料内的杂质进行高效液相色谱.离子阱质谱联用仪(LC--Orbitrap)的分析鉴定,并使用ADMET Predictor8.5软件对其进行全面毒理参数的评测,获得其不良反应情况的剖析及预估;采用反相高效液相色谱仪(RP-HPIC)测定阿苯达唑原料中的杂质及破坏实验的杂质情况,充分了解杂质的分布及来源情况;采用顶空-GC测定阿苯达唑原料中的残留溶剂,了解工艺过程中残留溶剂是否符合
川贝母(Fritillariae Cirrhosae Bulbus)是一种多基原植物,来源于百合科植物川贝母(Fritillaria cirrhosa)、甘肃贝母(F.przewalskii)、梭砂贝母(F.delavayi)、暗紫贝母(F.unibracteata)、太白贝母(F.taipaiensis)和瓦布贝母(F.unibracteata var.wabuensi)的干燥鳞茎,是我国重要的
学位
格列吡嗪(Glipizide)为第二代磺酰脲类降糖药代表性药物,相较于第一代具有降糖效果好、作用时间长、副作用小等优点,临床上主要用于治疗Ⅱ型糖尿病。我国作为一个仿制药生产大国,当前药品市场中拥有批准文号的格列吡嗪仿制片有近60个,其中截止2020年底提出一致性评价申报或已完成仅4家企业,故对格列吡嗪片进行一致性评价研究具有重要的科研及社会意义。生物等效性试验(BE)是一致性评价的主要手段,现阶段
学位
一个理想的眼部药物释放体系,应该以滴眼液的形式给药,不引起糊视和眼部刺激,而且有较长的眼部滞留时间和一定的缓释作用.基于这种思想,该论文研究了一种滴注性凝胶(droppablege),它以液体形式滴入眼睛后发生相转变而形成具有一定粘弹性的凝胶,属于在位形成凝胶释放体系(insitu-forminggeldeliverysystem).该滴注性凝胶以因pH改变而胶凝的高分子聚合物卡波姆(Carbop
学位
该文就NIRDRS在药物分析领域内几个方面的应用进行了研究.第一部分:影响NIRDRS测定的因素考察.该部分考察了影响NIRDRS测定的因素:采样因素和仪器因素,具体为药物颗粒大小、堆密度、厚度、装样方式以及分辨率等.第二部分:定性鉴别.该文采用NIRDRS,首次根据峰形的不同,并结合一、二阶导数光谱对二十种氨 基酸原料进行无损鉴别,样品不需处理,直接测定,方法简便、直观、快速,适合工业生产过程
数字经济时代,互联网、大数据技术与制造业的融合发展成为制造业现代化的典型特征。通过机器学习对工业大数据进行分析、处理,进而提高生产效率,改进产品质量是提高企业核心竞争力的重要途径。但工业大数据是典型的不平衡数据集。以产品质量数据为例,不合格品占比极低,但是错分为合格品产生的代价极高。因此,通过分类算法提高正类样本的分类精度进而减少由于错分导致的重大损失具有重要的研究价值。  机器学习中标准的分类算
供给侧结构性改革的核心思想在于通过加强供给层面的创新结构改革突破现有创新供给矛盾,以解决市场高端供给不足而低端供给过剩的现状。创新供给结构的设计离不开知识产权的有效支撑,专利和标准正是知识经济发展中的关键钥匙,其创新导向越来越凸显于经济转型期的市场经济结构。所以,对新改革形势下的标准制定与专利许可研究更是表现为创新结构下的知识产权设计基础环节,具有一定的理论价值和实践意义,研究的主要目的在于通过对
随着资源和环境的矛盾日益凸显,对废旧产品进行回收再制造成为了缓解矛盾的主要方式。回收再制造不仅可以提升企业的经济效益,更可以保护环境、节省资源、促进循环经济的发展。本文基于风险视角,考虑了制造商风险中性与风险规避两种情形下的回收再制造定价模型。  (1)在风险中性模型下,假设市场中存在低碳产品供应链和普通产品供应链且消费者存在低碳偏好,构建了新品与回收品的闭环供应链最优定价模型,利用Stackel