论文部分内容阅读
数据挖掘技术作为近年来迅速发展的时间序列分析方法之一,得到了越来越多的科学工作者的关注和研究。如何对海量的时间序列数据进行有效的知识发现,挖掘其内在的各种变化模式、并进行相似性搜索、关联规则发现等应用分析,已经成为了一个挑战性的、具有重要意义的理论和实际应用课题。本文在分析时间序列特点和实际应用需求的基础上,针对时间序列挖掘的相似性查找和决策树生成模型进行了研究,具体所做的工作和创新成果体现在以下三个方面:1)深入、系统的进行基础理论学习与分析。本文在许多章节都安排了介绍性的基础理论,包括数据挖掘、时间序列、决策树方法和微粒群算法,并对它们进行了深入、系统的学习和分析,为后面的研究和创新工作做好铺垫。2)时间序列相似性搜索的研究本文在第三章首先给出了用回归系数对时间序列进行维约简的方法,该方法利用时间序列的趋势性对原序列进行了简化,然后研究了用相关性分析来进行相似性搜索的可行性,最后进行了实证研究,实验结果表明用该方法对时间序列的趋势性进行相似性搜索具有很高的实际意义。3)用微粒群算法改进生成决策树的模型研究本文在第四章提出了一种新型的用微粒群算法改进生成决策树的模型。该模型传承了经典的C4.5算法中使用信息增益率作为生成决策树的思想,结合改进的微粒群优化算法,将信息增益率、建树错误率整合在了一起,最后的实验结果说明本模型比较原有的C4.5算法在建树速度和精度上有一定的优势。