论文部分内容阅读
摘 要:本文对股价相关自变量进行主成分分析,然后采用PSO-BP神经网络对行业龙头性典型医药上市公司进行仿真与股价预测。实验结果表明,经过主成分分析处理的PSO-BP神经网络模型预测精度达到预测效果。
关键词:主成分分析 PSO-BP神经网络 股价预测
一、引言
我国上市公司股票价格的波动受诸多因素的综合影响,包括政策、政治、经济、社会、行业、上市公司自身等。加之我国股市发展历程尚短,各种配套制度尚不完善,股价走势呈现高波动性、高非线性。如何把握股价走势,对股价进行预测获取正盈利是投资者最为关心的问题。目前常见的分析方法主要有传统的基本面分析和技术分析,现代的回归分析、灰色模型、状态空间以及人工智能神经网络模型。各种改进算法的ANNs模型以及SVM模型在股价预测方面众多学者进行了大量的研究,取得了许多具有实际应用价值的研究成果。但大部分的研究都没有把关注点聚焦到输入变量的选择与处理上面,对于神经网络模型来说,只有输入自变量与因变量具有高度的相关性,并且没有遗漏重要的自变量影响因素,才能有效地解释股价走势的变化关系,对股价趋势作出比较准确的预测。因此,本文首先运用SPSS22.0对股价影响因素相关指标进行了相关性检验,删选出相关性较高的输入指标变量,然后通过因子分析里面的降维,进行主成分分析,减少冗余的相关性较低的自变量输入,从而缩短BP神经网络的训练时间,获得更理想的预测精度。在模型算法的优化上,本文选择了PSO算法,来提高BP神经网络全局寻优的能力和收敛的速度。本文以恒瑞医药(600276)为例,对股价走势进行仿真预测。
二、PSO-BP神经网络模型
1.模型基本原理。BP神经网络模型能通过调整层与层之间的权值与阈值来刻画出自变量与因变量之间任意的非线性关系,通过对历史数据的学习,使得BPNN模型储存自变量与因变量之间的映射关系信息,再通过自变量的输入信息来预测因变量的取值。本文在BP神经网络模型的原理基础上,构建股价影响因素输入指标体系,运用主成分分析降维,用主成分得分来进行BP神经网络模型的仿真与预测。
2.主成分分析法。主成分分析法是通过正交变换将一组可能存在相关性的股价影响因素输入变量指标转换成线性不相关的几个综合变量指标,并根据需要选取较少的几个变量以尽可能反映原来的输入变量的信息,对输入指标进行降维。
3.PSO算法。PSO算法中,每个待优化问题的潜在解称之为“粒子”,总的粒子个数即为种群规模,其中每个粒子都由其在解空间中的位置及其飞行速度所决定。粒子的适应度函数由待优化的具体问题决定,根据粒子的适应度值确定粒子的个体最优值以及粒子种群的全局最优值。每个粒子不断迭代计算在解空间中进行搜索,并不断更新其速度和位置。
4.BP神经网络。人工神经网络一般包括输入层、隐含层和输出层,隐含层可以只有一层,也可以有多层,隐含层中的神经元一般采用S型传递函数,可以学习输入输出之间的线性或非线性关系,一般采用单调可微的递增函数。BP神经网络又称前馈型神经网络,是一种有导师的人工神经网络模型,可以通过输出结果误差的反向传递来调整层与层之间的权值和阈值,从而来实现输入输出之间的复杂映射关系。
三、仿真实验
1.输入指标体系的选取。本文选取恒瑞医药(600276)为实验对象。数据区间为2015年1月9日到2016年2月19日之间共58周的交易数据,以股票每周的开盘价、收盘价、最高价、最低价、MA5、MA10、、MA20、、MA60、、MACD的2个指标DIF、DEA、龙系长线2个指标LON、LONMA(10)以及ZLJC的3个指标JCS、JCM、JCL共15个输入指标变量。所有指标在被删选作为股价相关性因素作为输入变量之前,均通过相关性检验,在0.01的置信度(双侧)上,显著相关(>0.6)。
2.输入指标PCA处理。本文利用SPSS20.0统计分析软件进行主成分分析,使得多个指标可以被转化为少数的几个指标来反映股价影响因素综合变量。运用主成分分析法来提取因子并进行了方差最大正交旋转,参照碎石图确定抽取因子的有效数目。KMO和 Bartlett检验用来判断原始数据的有效性,KMO值为0.915,Bartlett's 球形检验值为 15655.238(Sig=0.000)。说明原始指标变量适合用来进行主成分分析。提取主成分的原则是,主成分对应的特征值要大于1,且方差累计贡献率达到85%的前m个主成分。根据计算结果,提取出了2个主成分,即m=2。这意味着用2个主成分可以代替原来的15个指标变量,前2个主成分的累积贡献率达到94.621%,2个主成分包含了全部指标绝大部分的信息,并得到了样本数据的主成分得分。
3.PSO-BPNN模型的实现。根据主成分分析,选择2个主成分作为神经网络的输入,神经网络的输出为下一周的最高价。根据多次调试选取了七层神经网络,一个输入层、五个隐含层、神经元个数分别为2、5、1。BP神经网络的训练学习寻求全局最优的过程采用PSO粒子群算法。用2015年1月9日到2016年2月19日共48周数据作为训练样本,2015年12月11日到2016年2月19日共10周数据作为预测数据,采取滚动预测的方法,即用前面48周预测第49周,然后用前面49周预测第50周,依此类推。
4.预测结果分析。运用所建立的神经网络模型对样本进行仿真训练,得到的結果见下表。从结果中可以看到,拟合的精度比较理想,预测值与实际值的误差在可以接受的范围内(3%以内),即经过主成分分析降维的PSO—BP神经网络模型进行股价预测能达到期望的预测效果。
四、结语
我国二级股票市场属于弱式有效市场,股价影响因素错综复杂,波动剧烈,股价走势的规律难以捕捉,但诸多学者利用各种不同的数据挖掘技术,发现股价走势存在“趋势性”,这种趋势的规律可以被挖掘分析,从而进行股价的预测,并且具有实际投资参考价值。本文运用经过主成分分析降维处理的PSO-BP神经网络对恒瑞医药(600276)进行预测研究,输入指标不仅有较常见的技术指标均线、MACD,同时也纳入了资金流指标LON与ZLJC,以提高预测的准确度。
参考文献:
[1]陈可,张琴舜等.BP神经网络在证劵分析预测中应用[J].计算机工程,2001(11):95-97.
[2]吴成东.人工神经元BP网络在股票预测方面的应用[J].控制工程,2002,9(5):48-51
[3]董长虹.MATLAB 神经网络与应用[M].北京:国防工业出版设,2005.12.
[4]蔡红,陈荣耀.基于 PCA-BP神经网络的股票价格预测研究[J],计算机仿真,2011,03:365~368
[5]郑杰.SPSS统计分析从入门到精通[M].北京:中国铁道出版社,2015.
[6] Liu X Y, Shao C, Ma H F and Liu R X. Optimal earth pressure balance control for shield tunneling based on LS-SVM and PSO. Automation in Construction, 2011, 20: 321–327.
[7]杨建刚.人工神经网络实用教程[M].北京:中国石化出版社,2003.
作者简介:张彩凤(1989—),女,汉族,籍贯:湖北武穴,单位:五邑大学经济管理学院,2013级硕士研究生,研究方向:管理科学与工程。
关键词:主成分分析 PSO-BP神经网络 股价预测
一、引言
我国上市公司股票价格的波动受诸多因素的综合影响,包括政策、政治、经济、社会、行业、上市公司自身等。加之我国股市发展历程尚短,各种配套制度尚不完善,股价走势呈现高波动性、高非线性。如何把握股价走势,对股价进行预测获取正盈利是投资者最为关心的问题。目前常见的分析方法主要有传统的基本面分析和技术分析,现代的回归分析、灰色模型、状态空间以及人工智能神经网络模型。各种改进算法的ANNs模型以及SVM模型在股价预测方面众多学者进行了大量的研究,取得了许多具有实际应用价值的研究成果。但大部分的研究都没有把关注点聚焦到输入变量的选择与处理上面,对于神经网络模型来说,只有输入自变量与因变量具有高度的相关性,并且没有遗漏重要的自变量影响因素,才能有效地解释股价走势的变化关系,对股价趋势作出比较准确的预测。因此,本文首先运用SPSS22.0对股价影响因素相关指标进行了相关性检验,删选出相关性较高的输入指标变量,然后通过因子分析里面的降维,进行主成分分析,减少冗余的相关性较低的自变量输入,从而缩短BP神经网络的训练时间,获得更理想的预测精度。在模型算法的优化上,本文选择了PSO算法,来提高BP神经网络全局寻优的能力和收敛的速度。本文以恒瑞医药(600276)为例,对股价走势进行仿真预测。
二、PSO-BP神经网络模型
1.模型基本原理。BP神经网络模型能通过调整层与层之间的权值与阈值来刻画出自变量与因变量之间任意的非线性关系,通过对历史数据的学习,使得BPNN模型储存自变量与因变量之间的映射关系信息,再通过自变量的输入信息来预测因变量的取值。本文在BP神经网络模型的原理基础上,构建股价影响因素输入指标体系,运用主成分分析降维,用主成分得分来进行BP神经网络模型的仿真与预测。
2.主成分分析法。主成分分析法是通过正交变换将一组可能存在相关性的股价影响因素输入变量指标转换成线性不相关的几个综合变量指标,并根据需要选取较少的几个变量以尽可能反映原来的输入变量的信息,对输入指标进行降维。
3.PSO算法。PSO算法中,每个待优化问题的潜在解称之为“粒子”,总的粒子个数即为种群规模,其中每个粒子都由其在解空间中的位置及其飞行速度所决定。粒子的适应度函数由待优化的具体问题决定,根据粒子的适应度值确定粒子的个体最优值以及粒子种群的全局最优值。每个粒子不断迭代计算在解空间中进行搜索,并不断更新其速度和位置。
4.BP神经网络。人工神经网络一般包括输入层、隐含层和输出层,隐含层可以只有一层,也可以有多层,隐含层中的神经元一般采用S型传递函数,可以学习输入输出之间的线性或非线性关系,一般采用单调可微的递增函数。BP神经网络又称前馈型神经网络,是一种有导师的人工神经网络模型,可以通过输出结果误差的反向传递来调整层与层之间的权值和阈值,从而来实现输入输出之间的复杂映射关系。
三、仿真实验
1.输入指标体系的选取。本文选取恒瑞医药(600276)为实验对象。数据区间为2015年1月9日到2016年2月19日之间共58周的交易数据,以股票每周的开盘价、收盘价、最高价、最低价、MA5、MA10、、MA20、、MA60、、MACD的2个指标DIF、DEA、龙系长线2个指标LON、LONMA(10)以及ZLJC的3个指标JCS、JCM、JCL共15个输入指标变量。所有指标在被删选作为股价相关性因素作为输入变量之前,均通过相关性检验,在0.01的置信度(双侧)上,显著相关(>0.6)。
2.输入指标PCA处理。本文利用SPSS20.0统计分析软件进行主成分分析,使得多个指标可以被转化为少数的几个指标来反映股价影响因素综合变量。运用主成分分析法来提取因子并进行了方差最大正交旋转,参照碎石图确定抽取因子的有效数目。KMO和 Bartlett检验用来判断原始数据的有效性,KMO值为0.915,Bartlett's 球形检验值为 15655.238(Sig=0.000)。说明原始指标变量适合用来进行主成分分析。提取主成分的原则是,主成分对应的特征值要大于1,且方差累计贡献率达到85%的前m个主成分。根据计算结果,提取出了2个主成分,即m=2。这意味着用2个主成分可以代替原来的15个指标变量,前2个主成分的累积贡献率达到94.621%,2个主成分包含了全部指标绝大部分的信息,并得到了样本数据的主成分得分。
3.PSO-BPNN模型的实现。根据主成分分析,选择2个主成分作为神经网络的输入,神经网络的输出为下一周的最高价。根据多次调试选取了七层神经网络,一个输入层、五个隐含层、神经元个数分别为2、5、1。BP神经网络的训练学习寻求全局最优的过程采用PSO粒子群算法。用2015年1月9日到2016年2月19日共48周数据作为训练样本,2015年12月11日到2016年2月19日共10周数据作为预测数据,采取滚动预测的方法,即用前面48周预测第49周,然后用前面49周预测第50周,依此类推。
4.预测结果分析。运用所建立的神经网络模型对样本进行仿真训练,得到的結果见下表。从结果中可以看到,拟合的精度比较理想,预测值与实际值的误差在可以接受的范围内(3%以内),即经过主成分分析降维的PSO—BP神经网络模型进行股价预测能达到期望的预测效果。
四、结语
我国二级股票市场属于弱式有效市场,股价影响因素错综复杂,波动剧烈,股价走势的规律难以捕捉,但诸多学者利用各种不同的数据挖掘技术,发现股价走势存在“趋势性”,这种趋势的规律可以被挖掘分析,从而进行股价的预测,并且具有实际投资参考价值。本文运用经过主成分分析降维处理的PSO-BP神经网络对恒瑞医药(600276)进行预测研究,输入指标不仅有较常见的技术指标均线、MACD,同时也纳入了资金流指标LON与ZLJC,以提高预测的准确度。
参考文献:
[1]陈可,张琴舜等.BP神经网络在证劵分析预测中应用[J].计算机工程,2001(11):95-97.
[2]吴成东.人工神经元BP网络在股票预测方面的应用[J].控制工程,2002,9(5):48-51
[3]董长虹.MATLAB 神经网络与应用[M].北京:国防工业出版设,2005.12.
[4]蔡红,陈荣耀.基于 PCA-BP神经网络的股票价格预测研究[J],计算机仿真,2011,03:365~368
[5]郑杰.SPSS统计分析从入门到精通[M].北京:中国铁道出版社,2015.
[6] Liu X Y, Shao C, Ma H F and Liu R X. Optimal earth pressure balance control for shield tunneling based on LS-SVM and PSO. Automation in Construction, 2011, 20: 321–327.
[7]杨建刚.人工神经网络实用教程[M].北京:中国石化出版社,2003.
作者简介:张彩凤(1989—),女,汉族,籍贯:湖北武穴,单位:五邑大学经济管理学院,2013级硕士研究生,研究方向:管理科学与工程。