基于集成学习的股票价值分析方法研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:syyyqw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人们通常希望知道在特定的宏观经济状况和市场环境下,某一支股票在一定的时间内是否具有投资的价值。通过对历史数据的学习构建准确的模型,进而分析所有潜在的可能影响因素对股票收益率的影响,就是股票的价值分析。因此,股票的价值分析问题需要解决两个问题——模型构建和特征选择。 我们首先使用了集成学习方法进行模型构建。集成学习方法旨在通过同时构建多个模型,并将其结果汇总,从而实现对学习问题构建更准确的模型。我们使用了Bagging和Boosting两种集成学习方法施加于决策桩,决策树和随机决策树三种基学习算法之上。基于Boosting DS算法得到的决策桩模型,我们使用了3种方法Boosting DS FC,Boosting DS AWFC和Boosting DS MWFC对各个特征的重要程度进行了排序。 本文的主要贡献在于: (1)我们成功的构建了准确的集成分类模型,把正确率从原来的70%-80%提高到了现在的85%以上。而且,我们构建的模型具有非常好的可理解性。 (2)我们成功的找到了各个因素与目标变量的相互影响关系。我们发现发现市场回报率,公司的市值以及一些重要比率是最重要的影响因素。这个结果与Fama的试验给出的结果是比较吻合的。 (3) 我们的模型评价指标不仅包括通常使用的正确率,还包括敏感度,特异度和马太相关系数。
其他文献
胚胎着床是一个复杂的生理过程,胚胎着床的顺利完成,不仅需要神经递质、内分泌激素、细胞因子和免疫细胞协同作用,更涉及各种细胞因子和信号通路。近年来关于胚胎着床调控机
竹林生态旅游是指在被保护的竹林生态系统内,以观赏竹林生态景观为主要目的的旅游,竹林生态旅游以竹为主要观赏对象、以构成景观的竹林和竹文化为旅游目的地,旅游者通过与自然的
通信技术发展日新月异,在3GPP Release10(Rel-10)和Re1-11中,提出了可以有效提升链路的质量和频谱效率,解决宏网络覆盖空洞的的分层异构无线网络的技术方案,通过在宏覆盖范围
近年来随着遥感卫星数据的急速膨胀,以往的卫星数据记录和处理系统,以及技术方法逐渐不能满足业务应用的需求,中国遥感卫星地面站提出了建设多元卫星海量数据存储与处理系统,对地
智能视频处理技术涉及到许多基本技术,由于存在一些关键性技术仍然没有得到很好地解决,致使智能视频处理技术在其发展过程中受到一定程度的阻碍。本论文针对当今各种智能视频处
本文对采用均值位移,卡尔曼滤波和快速运动估计的物体跟踪算法进行了研究。文章深入分析了Mean Shift跟踪算法原理,并对它跟踪物体的本质进行了探讨,由此对它的权重更新方式进行
本文针对目前自然语言处理领域的研究热点--信息检索模型存在的问题,结合统计自然语言处理以及HNC自然语言理解技术的研究现状,提出了将语义方法与统计方法结合进而构建检索模
本文主要对指纹识别技术中的指纹比对技术进行若干探索和研究。 当今社会中,生物特征识别技术在社会生活的各个方面有着越来越广泛的应用,作为生物特征识别领域研究历史最久
随着我国农业生产工作现代化进程的不断加快,各种机械设备以及新的生产理念都在生产工作当中得到了普遍的推广,这对农作物本身的质量与生产效率都有重要的促进作用.保护性耕
离子迁移率谱仪(IMS)是二十世纪七十年代发展起来的一门新兴的化学分析技术,被广泛应用于测定痕量的化学武器、毒品、爆炸物、以及空气污染物等,跟其他的有机化合物分析仪器相