论文部分内容阅读
数据挖掘技术产生于20世纪80年代后期,90年代有了突飞猛进的发展,随着技术的不断成熟,越来越多的学者将其广泛运用于不同的领域;其中,与金融领域的结合能够给广大投资者带来额外收益;股票市场是一个受多方信息影响的复杂系统,股市的涨跌由于其高度不稳定性,更是难以预测。投资者面对大量的股市信息,通常希望能够利用已知的历史信息运用某种方式对未来的市场涨跌进行预测,以应用于投资,获得超额收益。面对巨大的信息量,人工进行处理显然不现实:花费的成本也过于昂贵;所以有许多学者运用例如支持向量机、BP神经网络等机器学习的方法来对股市的涨跌进行预测;这一领域逐渐成为近两年待解决的热点问题;但是支持向量机等方法有一定的局限性,为了达到最优的分类效果,要采用高纬度的平面进行分类,这无疑增加了模型的复杂度;XGBoost算法作为2015年新提出的算法,具有运算效率和准确率高的优点,所以作者运用这一新的算法对股市涨跌进行预测,为投资者提供一种新的投资决策有效性方案。本文结合国内股票市场和国际上主要的股票指数,运用了支持向量机、决策树模型和XGBoost算法对上证综指、上证50指数、标准普尔指数的涨跌进行预测;同时,为了尽可能提高支持向量机、决策树和XGBoost算法对股市涨跌预测的效果,作者还把与成交量有关的数据进行了处理,使它的数值与其他指标相差不是太大;与此同时,还将XGBoost算法的有关参数进行了调优。选取了 28个技术指标作为输入变量,将预测的第二天的股市涨跌作为分类的输出变量;利用RStudio软件进行支持向量机、决策树和XGBoost建模,并得到了相对合理的实证结果,结果显示XGBoost模型对上证综指有非常理想的预测效果,预测的准确率达到了 70%以上,这与XGBoost算法的原理有关,它迭代每次的误差,达到最小化平方损失函数,所以比普通算法的准确率要高;上证50和标准普尔指数的预测准确率达到了 60%到65%,这可能与这两个指数只是选取的一部分股票作为样本有关;按照趋势进行划分时,也能够得到更高的预测准确率,运用XGBoost算法的预测结果进行投资,结果也显示能够使投资者获得理想的超额收益,支持向量机和决策树略低,也达到了 60%以上。可以看出,机器学习方法对股市预测和投资有一定的指导意义。给投资者的决策和政府监管提供了一个方便,切实可行的方案。