论文部分内容阅读
数据挖掘可视化方法的目的就是要很好地利用人类对可视化形式下模型和结构的获取能力,来对执行结果进行分析解释并控制整个挖掘过程。对用户来说,将关联规则挖掘过程以可视化的形式呈现出来,并实现用户与挖掘过程的交互非常重要。论文的工作是对关联规则挖掘过程和交互式可视化技术进行研究,最终将数据挖掘工具与可视化展现工具融为一体,促成关联规则的交互式可视化挖掘。使用户能够参与关联规则挖掘过程,控制挖掘过程中的参数,从而实现用户与关联规则挖掘过程的充分交互,大大提高关联规则挖掘的效率和质量,增加用户对结果模式的理解,提高用户对挖掘结果的满意度。论文在数据挖掘技术、可视化交互技术的基础上,对关联规则挖掘技术的概念、算法和挖掘过程进行研究,论文的成果主要体现在以下几个方面:1.提出了关联规则的交互式可视化挖掘方法。指出在关联规则的交互式可视化挖掘过程中应体现三个重要特性,即前阶段的可约束性,过程中的可交互性,后阶段的可评价性。提出了集这三个特性为一体的关联规则交互式可视化挖掘过程,该过程包括三个阶段,在不同的阶段用户可以设置不同的约束条件和参数,以实现用户与挖掘过程的交互。2.设计并实现了基于XML/EXCEL的挖掘结果模型表示方法。使得规则文档保持了良好的结构,并且具有清楚的语义表达能力,以便提供给挖掘系统的规则展示模块、其它系统(软件)和知识工程师/普通用户进行决策分析。3.设计实现了交互式可视化关联规则学习器RestrictApriori并将其与机器学习平台Weka集成。弥补了Weka中关联规则挖掘缺少项约束、挖掘过程缺乏可控性等不足,从而完善了Weka的数据挖掘性能。