基于粒计算的数据挖掘算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:shhgay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是当今计算机科学中快速发展的一个研究方向,它涉及到多个领域的知识。数据挖掘能从大量的数据中发现一些人们事先未知的、潜在的、有趣的知识,因此广泛被应用于商业分析、机器学习、网络个性化服务等领域。数据挖掘有很多研究方向,关联规则和序列模式是其中重要的两类,其中关联规则的研究重点在于频繁项集的发现,而序列模式则强调数据的序列特性。本文基于粒计算的相关原理和模型,对关联规则和序列模式的挖掘算法进行了研究。本文的主要工作概括如下:1.概述了数据挖掘和粒计算的基本原理,说明了数据挖掘的主要研究方向和粒计算的几个重要的计算模型,对关联规则、序列模式和粗糙集的基础理论知识进行了介绍,对常见的关联规则挖掘算法和序列模式挖掘算法进行了简单的汇总和分析。2.详细分析了关联规则挖掘算法Apriori算法的原理。针对Apriori算法存在的产生较多候选频繁项的问题,给出基于粒化原理的改进算法Apriori-GRC算法,并通过仿真实验表明其有效性。3.给出一种基于重要度的粗糙集信息系统属性约简算法Sig-Reducts算法。讨论了序列的粗糙集模型,在Sig-Reducts算法的基础上,给出了一种基于决策表的序列规则挖掘算法Sequence-Mining算法,分析了算法的时间复杂度并通过仿真实验进行了验证。
其他文献
图像处理是计算机科学中一个重要的研究方向,有着广泛的应用。图像理解是图像分析的关键基础之一,也是图像处理研究中的热点与难点。图像理解有两种常用的手段,即图像分解与图
学位
图案在人们生活中无处不在。随着科技的进步和计算机图形学的发展,图案的绘制也开始由传统的手工设计方式向计算机辅助创作方式进行转变。目前利用计算机绘制图案的方法主要
随着生物技术的发展,产生了大量的生物网络数据。研究者发现,此类网络中除了具有一些固有的全局属性,如“小世界”和“无标度”等之外,还具有一些能够表征特定功能的拓扑频繁结构
近年来,随着云计算技术快速地发展,互联网业务数目与规模得到了空前的增长,传统的互联网结构面临这随之而来的一系列问题,其中网络僵化问题尤为突出。如果采用以往的单纯增加
随着高新技术的飞速发展,固态盘被引入到存储系统中,它的高性能、低能耗等特点能够满足现代数据存储的需要,对解决传统磁盘的性能瓶颈起到了很好的作用。但是固态盘的价格高,容量
Nand Flash是目前消费性电子产品中被广泛使用的元件之一。由于Nand Flash的物理机构特点,容易发生错误,如何保证数据的可靠性,成为一项重要的研究课题。采用纠错码(Error Corre
作为生物认证技术领域的重要一员,基于手掌的身份认证系统正以其安全、准确、快捷的特点而受到越来越广泛的重视,具有广阔的应用前景。本文针对掌纹认证系统若干关键技术进行了
评论文本的观点挖掘是指通过对评论文本中的观点、立场等主观信息进行挖掘与分析,判断评论文本中观点的情感倾向性。随着评论文本在人们生活中的广泛应用,仅仅挖掘评论文本的
随着移动终端设备的发展,一种新兴的医疗保健模式移动医疗迅速发展。未来,移动医疗发展潜力巨大。本课题设计实现了面向云平台的心电交互系统。系统包括数据采集端,心电监测
近年来随着移动互联网的兴起,市场上出现了越来越多的嵌入式解决方案,包括手机解决方案、IPTV解决方案、安防监控解决方案等等。不同厂家都推出带有自身特色的解决方案,配套各自