论文部分内容阅读
数据挖掘技术融合了人工智能、统计学、随机过程等多门学科,并涉及到神经网络、小波分析等多种模型方法。因此在对海量数据进行研究的时候数据挖掘技术成为了首选。时间序列就是根据时间顺序保存下来的有序数列。金融时序与一般的时序数据相比有着动态性、随机性、非线性以及高噪声的特点。如何从这些海量的数据中挖掘出能指导商业行为的信息成为了人们关注的热点。由于数据的特殊性,传统的数据挖掘方法在聚类和预测时有一定的局限性。针对该问题,本文从聚类算法着手,对金融时序数据进行挖掘并形成模型进行预测,本文的主要工作如下:首先阐述并总结传统的数据挖掘技术,分析指出当前的DBSCAN算法在聚类过程中存在对参数敏感以及参数全局性的缺点,使得DBSCAN在聚类时对变化密度的数据集不能取得较好的聚类效果。基于此提出DBSCAN算法的自适应参数选择与初始点优化的方法即OVDBSCAN算法。通过实验验证OVDBSCAN算法能够对不同密度的数据集有良好的聚类效果。其次在OVDBSCAN算法基础上,结合支持向量机回归、参数优化技术,设计并实现了一种结合多种算法优点的混合算法(mixed-OS算法),通过实验分析验证该算法对非稳态、非线性、有噪声数据的有效回归预测。最后将mixed-OS算法运用于上海证券交易所民生银行和中国联通的股票和金融指数作出预测,以验证算法的实用性、有效性。并将该算法予以系统实现,将金融预测以图形界面的形式展现出来。