论文部分内容阅读
人们通常希望知道在特定的宏观经济状况和市场环境下,某一支股票在一定的时间内是否具有投资的价值。通过对历史数据的学习构建准确的模型,进而分析所有潜在的可能影响因素对股票收益率的影响,就是股票的价值分析。因此,股票的价值分析问题需要解决两个问题——模型构建和特征选择。
我们首先使用了集成学习方法进行模型构建。集成学习方法旨在通过同时构建多个模型,并将其结果汇总,从而实现对学习问题构建更准确的模型。我们使用了Bagging和Boosting两种集成学习方法施加于决策桩,决策树和随机决策树三种基学习算法之上。基于Boosting DS算法得到的决策桩模型,我们使用了3种方法Boosting DS FC,Boosting DS AWFC和Boosting DS MWFC对各个特征的重要程度进行了排序。
本文的主要贡献在于:
(1)我们成功的构建了准确的集成分类模型,把正确率从原来的70%-80%提高到了现在的85%以上。而且,我们构建的模型具有非常好的可理解性。
(2)我们成功的找到了各个因素与目标变量的相互影响关系。我们发现发现市场回报率,公司的市值以及一些重要比率是最重要的影响因素。这个结果与Fama的试验给出的结果是比较吻合的。
(3) 我们的模型评价指标不仅包括通常使用的正确率,还包括敏感度,特异度和马太相关系数。