基于XGBoost算法的上证指数预测方案设计研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:shengyan1205
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术产生于20世纪80年代后期,90年代有了突飞猛进的发展,随着技术的不断成熟,越来越多的学者将其广泛运用于不同的领域;其中,与金融领域的结合能够给广大投资者带来额外收益;股票市场是一个受多方信息影响的复杂系统,股市的涨跌由于其高度不稳定性,更是难以预测。投资者面对大量的股市信息,通常希望能够利用已知的历史信息运用某种方式对未来的市场涨跌进行预测,以应用于投资,获得超额收益。面对巨大的信息量,人工进行处理显然不现实:花费的成本也过于昂贵;所以有许多学者运用例如支持向量机、BP神经网络等机器学习的方法来对股市的涨跌进行预测;这一领域逐渐成为近两年待解决的热点问题;但是支持向量机等方法有一定的局限性,为了达到最优的分类效果,要采用高纬度的平面进行分类,这无疑增加了模型的复杂度;XGBoost算法作为2015年新提出的算法,具有运算效率和准确率高的优点,所以作者运用这一新的算法对股市涨跌进行预测,为投资者提供一种新的投资决策有效性方案。本文结合国内股票市场和国际上主要的股票指数,运用了支持向量机、决策树模型和XGBoost算法对上证综指、上证50指数、标准普尔指数的涨跌进行预测;同时,为了尽可能提高支持向量机、决策树和XGBoost算法对股市涨跌预测的效果,作者还把与成交量有关的数据进行了处理,使它的数值与其他指标相差不是太大;与此同时,还将XGBoost算法的有关参数进行了调优。选取了 28个技术指标作为输入变量,将预测的第二天的股市涨跌作为分类的输出变量;利用RStudio软件进行支持向量机、决策树和XGBoost建模,并得到了相对合理的实证结果,结果显示XGBoost模型对上证综指有非常理想的预测效果,预测的准确率达到了 70%以上,这与XGBoost算法的原理有关,它迭代每次的误差,达到最小化平方损失函数,所以比普通算法的准确率要高;上证50和标准普尔指数的预测准确率达到了 60%到65%,这可能与这两个指数只是选取的一部分股票作为样本有关;按照趋势进行划分时,也能够得到更高的预测准确率,运用XGBoost算法的预测结果进行投资,结果也显示能够使投资者获得理想的超额收益,支持向量机和决策树略低,也达到了 60%以上。可以看出,机器学习方法对股市预测和投资有一定的指导意义。给投资者的决策和政府监管提供了一个方便,切实可行的方案。
其他文献
农村青壮年劳动力的大量转移,造成农村劳动力十分短缺,迫使其价格大幅上升,进一步压缩了粮食生产的利润空间。试验结果表明,早稻机械插栽具有省工、省本、增产、增效等优点,
社会权入宪是权利确立的基本问题。社会权的显性入宪,包含将社会权的内涵、范畴等明文规定于宪法之中,形式上表现为宪法对法的拘束力的基本要求,实质上体现国家最低限度的给付义
目的观察乙型病毒性肝炎(乙肝)母婴传播阻断效果;探讨母婴传播阻断失败的病毒学因素。方法在四川和甘肃省5家医院招募439名慢性乙肝病毒(Hepatitis B virus,HBV)感染孕妇及其
针对反渗透系统中浓差极化的原因和危害,以某电厂利用反渗透制备除盐水系统为实例进行分析,并提出有效的解决措施。
<正>龙游黄龙玉产自于我国浙江省龙游县,主要分布在钱塘江上游衢江、兰江和灵山江等流域,该水域所产观赏石有黄龙玉、黄蜡石、陶石、玛瑙和水冲木化石等,是继云南黄龙玉之后
1 桑树春季霜冻危害的表现 1.1 桑芽的危害 受害程度轻的发芽迟,萌发后叶芽不完全或呈畸形。重的不发芽,呈僵芽、干瘪状,鳞片脱落,内部组织褐变。中下部潜伏芽正常情况受冻害
近年来,量化投资凭着其纪律性、系统性、及时性及分散化的特点,日益受到机构投资者和对冲基金的重视。同时,我国证券投资市场的规模和证券开户数都在迅猛的增加,从我国证券市
<正>经过历时"十年磨一剑"的艰辛探索,在学界的期待中,郑杭生和杨敏教授合著《社会互构论:世界眼光下的中国特色社会学理论的新探索—当代中国"个人与社会关系研究"》(以下简
我国农业近些年来取得了长足的发展,面对不同程度的病虫草害,合理使用化学农药是保证农业丰收的重要手段。随着化学农药的广泛应用,要求从业人员掌握其抗药性,结合治理要求,
内幕交易的主观方面在理论与实务中争议较大,不仅司法、执法中操作不一,理论界也鲜有系统全面论及。通过梳理中外理论与实践中的疑难,主要分析了如下问题:一是内幕交易的行政