基于一种新兴机器学习方法的多因子选股研究

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:AHUAYA
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,机器学习方法在量化投资的应用研究逐渐兴起,但关于新兴的机器学习模型 (XGBoost模型) 在量化选股方面的研究并不算多,本论文以沪深300成分股作为样本对XGBoost模型进行多因子选股研究,并结合支持向量机模型、随机森林模型、线性回归模型比较分析各模型在选股性能上的优劣。
  首先,在第一章中指出传统多因子模型的有效性随着因子池的扩大而不断降低,而各种机器学习模型都是一种有效的解决方案,其中在理论上具有优越性的XGBoost模型也有待实证进一步检验,为全论文奠定了理论基础,具有研究意义。
  其次,在因子选择方面,本论文从价值投资理念出发并结合行为金融学的思想,选择了估值类、财务类、成长类、动量类及情绪类共5大类20个因子,较为全面的反映了影响股票收益率的因素。为进一步优化因子池进而为模型实证创造最佳样本数据,本论文还对选取的初始数据进行数据预处理及单因子有效性检验。本论文还综合了中位数去极值法、均值填充法、行业市值中性化处理及数据标准化等方法对原始数据进行预处理进而得到了标准数据格式;在单因子有效性检验中,本论文综合运用了IC值法及分组收益法对单个因子的有效性进行综合评价,得到了11个有效因子,然后再根据相关系数法对这11个因子进行冗余因子剔除并最终得到了9个有效因子。
  然后,本论文采用网格寻优法及交叉验证法对XGBoost模型进行参数寻优并得出最优参数。并且,根据各因子得分权重值可以看出其中momenturn_1m (个股最近1 个月收益率) 与Attention_rate (1月关注增长率) 等反映市场情绪的短期因子重要性排名靠前,而诸如Sales_G (营业收入同比增长率) 等反映基本面的长期因子重要性排名靠后,在一定程度上也反映了我国股市短期因素主导较强、投机较为严重,中长线价值投资理念还没有很好被普及和贯彻执行。
  最后,本论文对XGBoost模型及各模型进行了回测检验,并对模型损失函数进行了改进,同时运用收益-风险评价体系比较各模型选股性能的优劣;此外本论文进行了三次回测以纵向观测时间维度对模型有效性的影响。回测结果表明:各模型在多因子选股上均能产生超额收益,这在一定程度上肯定了本文因子选取的有效性;从各模型的横向比较来看,XGBoost模型整体表现优于其他模型,这从实证上验证了XGBoost模型强大的集成学习能力,同时结果表明改进损失函数有效的提升了模型的预测能力;从三次回测结果的纵向比较来看,随着回测区间的增长,各模型的Alpha收益显著降低,并且风险指标也在不断增大,表明模型预测的稳定性会随着时间的延长而减弱。
其他文献
在市场经济体制与企业现代化发展的背景下,我国国有企业已经进入改革的攻坚期,其中,国有企业组织结构改革与优化是关键环节之一。研究与显示表明,企业的组织机构与企业的经营绩效有着密切的关系,即合适且有效的组织结构能够提升企业的经营绩效。由于国有企业是我国计划经济的典型产物,其组织结构的关系还沿袭着传统的“政商结合”的管理模式,这已无法适应市场经济体制下的发展需求,这就要求国有企业必须建立起能够适应竞争激
学位
氧化锆作为一种新型材料,因其性能优势被广泛应用于精密陶瓷、耐火材料、圆体燃料电池、氧传感器等方面,市场的需求极大促进了氧化锆产业的发展。中国作为最大的消费市场,吸引了国内外众多企业在此投资、建厂,外商独资、合资和民营等各种类型的不同规模企业竞争激烈。  为了探究我国民营企业应如何扬长避短、壮大企业规模,形成与外商独资、合资企业相抗衡的能力,在学习借鉴国内外竞争力研究理论的基础上,本文从企业竞争力角
机电产业是中国国民经济的重要产业,自加入WTO以来中国机电产品出口量持续增长,成为推动我国对外贸易发展的引擎,也为促进国内经济高质量发展、保持国际收支平衡、增加国民就业机会等方面发挥着不可替代的作用。随着中国传统竞争优势弱化以及国际产业重新布局,中国机电产业面临更加激烈的国际竞争,提升中国机电产品出口竞争力刻不容缓。  本文首先通过历年来中国机电产品对外贸易统计数据,从产品类别、出口市场、出口贸易
学位
在互联网时代的今天,整体金融行业多元化发展,在激烈的竞争背景下,众多金融机构都加大了对金融行业专业人才的需求,以适应市场提出的新服务要求。  与此同时,财务公司行业也积极的寻求发展,行业内许多财务公司都在不断提升信息技术水平,在政策允许的范围内拓展服务业务品种,因此就加大了对掌握各类金融知识,业务操作能力高度熟练,了解服务成员单位业务的专业人才的需求。  然而,目前内外部环境影响造成了传统金融行业
学位
改革开放以来,中国实现了从旅游短缺型国家到旅游大国的历史性跨越。旅游业全面融入国家战略体系,走向国民经济建设的前沿,成为国民经济战略性支柱产业。旅游业作为惠民生的重要领域,成为改善民生的重要内容,将推动各级政府更加重视旅游业发展,旅游业发展环境将进一步优化。“十三五”期间,中国旅游业处于黄金发展期、结构调整期和矛盾凸显期,也面临不少机遇和挑战。鉴于此,明确旅游产业发展的空间非均衡性这一问题,具有重
从上世纪七十年代末开始,中国政府执行了极为严格的计划生育政策,政策的实施为我国经济社会发展做出了突出的历史贡献。但随着我国人口结构的变化,人口政策带来的负面效果开始显现:一方面,从2012年开始我国劳动力人口数量的绝对值开始下降,人口红利逐渐消失;另一方面,我国老年人口占总人口的比重不断增加,人口老龄化问题愈发严重。为了适应新的人口形势,我国政府从2013年开始逐步放开计划生育政策。然而,根据国家
自城镇住房制度改革以来,我国房价不断攀升,房地产市场的繁荣发展提供了大量就业机会,增加政府税收,但从历史经验来看,高房价现象不利于国家金融稳定,我国监管部门采取了多种措施遏制房价快速上涨,但长期效果并不显著。与此同时,近年来行使信用创造功能,游离于银行体系之外的影子银行不断发展壮大,2017 年底总规模已达到 65.6 万亿元。房地产是资金密集型行业,当下传统银行信贷受限,影子银行的膨胀是否导致我
学位
经济决策在现代经济生活中扮演着至关重要的角色,而微观决策作为经济决策的重要组成部分主要是针对特定的地方问题,如企业分配资源等。这其中投资决策就是资金预算的重要一环,是资金预算要解决的最重要的问题。一些学者将概率论与最优化理论相结合,研究当企业全部使用自有资金进行投资时,如何使资金满足许多不相容的投资目标。而另一些学者则认为项目的投资参数从本质上来说是具有模糊性。然而在现实的经济环境中,并不是所有的
学位
本文从计量经济学角度出发,探寻财政分权及支出竞争对地方政府债务行为的影响。由于目前针对地方政府债务的研究大多未考虑地方政府债务存在的空间性问题的情况,本论文将多种空间权重矩阵纳入空间计量模型中,对现有的地方政府债务行为空间性研究进行丰富与补充,具有较好的理论意义。同时,在新《预算法》颁布后的中央对地方政府债务行为规范新时代,本论文还将为化解新监管环境下积累的地方政府债务风险进行有益探索,具有较强的
随着我国市场经济体制的不断完善,税收制度也在不断的改善以适应全球经济融合的大趋势。94年的分税制改革和09年的增值税转型改革尽管都采取了各种措施来弥补两税并行的弊端,但随着经济社会的发展,行业分工进一步细化、结构调整不断加速以及以服务业为主的第三产业在国民经济中的地位日益提高,由营业税重复征税所带来的税负不公、遏制企业专业化及分工细化的问题日益凸显,两税并行的制度与国家发展的现状并不匹配,增值税深
学位