【摘 要】
:
数据挖掘(Data Mining)就是从大量数据中提取或“挖掘”知识。数据挖掘被信息产业界认为是信息系统最重要的研究和应用领域之一,也是信息产业界最有前途的交叉性学科之一。关
论文部分内容阅读
数据挖掘(Data Mining)就是从大量数据中提取或“挖掘”知识。数据挖掘被信息产业界认为是信息系统最重要的研究和应用领域之一,也是信息产业界最有前途的交叉性学科之一。关联规则(Association Rule)是数据挖掘中一个重要的研究内容,而多最小支持度关联规则挖掘(Mining Association Rules with Multiple Minimum Supports)作为关联规则挖掘的一个新的研究课题,用于发现稀有项之间的关联规则,正逐步受到人们的重视。 本文在总结和分析其他关联规则挖掘算法的基础上,分析总结了多最小支持度关联规则挖掘的性质,并给出了相关的定理及证明。针对多最小支持度关联规则挖掘性质,提出了一种项集枚举二叉树(SEB-tree)结构模型,用于压缩存储待挖掘的数据集,同时提出了一种基于SEB-tree的多最小支持度关联规则挖掘算法MSTApnod。实验证明,MSTApriod算法在针对较大规模数据集或数据集中存在重复事务的情况下,以及在挖掘长模式时,挖掘效率远高于原有MSApriori算法。其次,本文针对多最小支持度的设定过程中存在盲目性、不易把握的问题,提出了在多最小支持度设定过程中采用参考属性集的方法。该方法应用BP神经网络技术对用户设定的模式进行跟踪学习,辅助用户动态的设定新加入项及属性变更项的最小项支持度。实验表明,该方法简单、实用、可行,是本文的另一个创新点。 实验表明,本文提出的算法在典型的蘑菇数据集及人工合成数据集测试中具有很好的结果。把算法应用于教务管理系统、铜川电子警察管理系统,提取的规则经过评价,可以为相关部门的正确决策提供支持。
其他文献
J2EE是SUN公司定义的一套规范,提供了基于组件的方式来设计、开发、组装和部署企业应用。J2EE平台提供了一个多层次分布式的应用模型,包括了可复用的组件、基于XML的数据交换、
关联分类法将关联规则挖掘技术应用于分类领域,构建了一种新的更准确的分类器。由于关联规则挖掘在挖掘大量数据之间的并发的潜在相关性方面的优势和良好的扩展适应性,使得在其
由于城市交通的迅速发展,道路及其它交通设施的管理水平急待提高。近年来,随着人们对智能交通系统(Intelligent Traffic System,ITS)越来越重视,以及Internet技术、WebGIS技
随着电信业的迅猛发展,用户对各种业务的需求不断增长,原有的电信网络远远不能满足。以软交换为核心的下一代网络技术正是在这种背景下产生并发展起来的。 本文首先概述了NG
MPEG-4作为集中各种多媒体应用于一体的新一代压缩标准得到广泛应用,而其中基于内容的编码标准因其应用的优势成为MPEG-4标准的重要特色之一。本文选择视频信息中频繁出现的视
信息的内容安全已经成为信息安全技术架构中重要组成部分。内容安全技术是继防火墙、网络入侵监测技术之后的又一种网络安全手段。作为互联网上最广泛的应用——电子邮件,研
Agent的协商环境是开放的、动态变化的,这就要求Agent在协商过程中必须具有很强的应变能力和自治能力。协商之前Agent的这些能力在自身的BDI模型设计中已经确定,因此Agent要
本文针对运行在校园网上的校园一卡通系统的安全性需求,讨论了基于消息级的Web服务安全的相关知识及其应用。本文研究了Web服务安全性方面的一些基本理论和实践方法,对各种实
近年来,随着电信业、计算机业和影视业的迅速融合,数据压缩方法有了令人瞩目的发展。以活动图像数字为代表的信号压缩技术已走向成熟。但人们已不满足于现有的通信方式和质量,因
本文通过分析Agent的特性、结构,阐述了MAS的建模思想和方法,着重研究了多Agent协作和建模的关键技术。建立了供应链模型,包括供应商、生产商、分销商、零售商和市场。对比