论文部分内容阅读
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用信息和知识的过程。基于近年来数据挖掘技术在证券市场中得到广泛的关注,本文对数据挖掘技术在上市公司的财务数据中的应用进行了研究。
文中介绍了数据挖掘的相关知识,包括主成分分析及聚类分析的概念,介绍了上市公司财务指标的体系结构,综述了国内外相关领域的研究工作。在此基础上,本人主要做了以下几个方面的工作:
一、在上市公司财务数据中隐藏着大量信息,但是这些信息不容易直接得到,所以需要用一些先进的技术来发掘这些不为所知的东西,从而为投资者服务。本文用数据挖掘技术对上市公司的财务数据进行了聚类及主成分分析,看能否找出为投资者服务的有用信息来。
二、从上市公司中选择沪市医药类60家股票,构建财务数据矩阵,通过划分聚类中的k-means算法,基于上市公司中所给出的财务指标数据,对相应的股票进行聚类,把股性相似或相近的股票聚为一簇;
三、对聚类后的某一类骰票,通过主成分分析方法,求出相关矩降及其特征值,确定财务指标的主成分及股票综合评价函数,通过财务数据计算出上市公司的综合得分,得出上市公司综合得分及排列顺序,找出具有一定投资价值的投票;
四、通过实验,本文把数据挖掘技术中的聚类分析方法与主成分分析方法结合起来,运用到证券市场的投资中去。再结合其他证券技术分析方法建立投资组合技术,为投资者提供选择股票的辅助方法,克服因主观或人为因素而影响选择股票的困难。
最后,附录中给出了验证主成分分析及划分聚类程序的代码清单。