论文部分内容阅读
时间序列数据挖掘是数据挖掘领域中的一个重要的研究课题,有其自身的特点和难点。粗糙集理论作为一种强有力的数据分析和知识获取工具,正被越来越多的学者尝试应用到时间序列数据分析中去。本文基于粗糙集理论及相关方法,对于时间序列数据挖掘技术中所存在的一些关键问题进行了比较深入的相关研究和探索。主要工作、成果及核心内容归纳如下: 粗集理论通过对原始决策表的约简获取规则知识,其核心部分是属性约简。本文提出了一种新的启发式属性约简算法,并给出了算法的详细步骤和具体的实验示例。该算法通过不一致计数和互信息增量的计算值衡量属性的重要性,避免了对属性之间随机组合情况的搜索。实验结果表明,该算法更加适用于海量数据分析,其有效提高了求解速度且获得的约简属性集更加简洁和高效。 本文基于趋势结构序列,定义了时间序列的状态变化速度序列以及趋势变化序列。针对一元时间序列的预测问题,结合滑动窗口算法,提出了一种基于粗糙集的时序趋势变化前向预测方法。然后将该方法应用于换热器冷却水出口水温的趋势值预测实例上,给出了具体计算步骤和结果分析,并对算法的有效性进行了验证。 针对多元时间序列数据的挖掘问题进行了相关的研究。并提出了一种将时态信息系统转换为趋势变化度信息系统的方法,给出了具体转换算法和应用示例。并在此趋势变化度信息系统转换方法的基础上,又结合本文提出的针对一元时间序列的预测方法,提出了一个基于粗糙集的多元时序趋势预测的方案。且针对实际应用中的换热器性能分析预测问题,给出了方案的具体应用实例。