基于粒计算的数据流分类及F-粗糙集扩展的研究

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:changkaiaini
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流是大数据的主要形式。概念漂移的探测以及数据流的分类是当前数据流挖掘的主要研究方向。虽然有不少概念漂移的探测方法,但是他们都有一些共同的缺陷:没有从整体上删除冗余属性以及利用外部特性去探测概念漂移(比如利用对外部数据的分类准确率)等。粗糙集可以有效地处理不精确、不完整等各种不完备的信息与知识,它不需要其他任何先验知识,可以通过直接对数据进行分析和推理,发现其中所隐含的知识与潜在的规律,从而进行分类或决策。传统的粗糙集理论不能很好的研究海量的、动态变化的数据,也不太适合研究数据流,并且不能处模糊概念或知识。模糊粗糙集虽然将粗糙集中等价关系替换成模糊等价关系,并将处理的数据类型从离散扩展到连续,克服了粗糙集约简需要离散化的缺陷,但是它及所有其他的粗糙集模型本身是静态的模型,不太适合处理数据流。F-粗糙集和并行约简算法,是经典粗糙集知识约简理论的一种有效拓展,它是将经典粗糙集从单表拓展到多表,无论是研究事物的动态变化与发展,还是在从整体和局部角度分析解决问题都具有非常强的理论和实际意义。但F-粗糙集是经典粗糙集意义上的扩展,在处理模糊数据流上显得的有些局限。本文首先运用粗糙集和F-粗糙集的基本原理和基本方法,把数据流中的决策子表簇当成滑动窗口,提出了一种对数据流进行并行约简、整体删除冗余属性的方法,并运用并行约简后数据流决策子表簇中属性重要性的变化探测概念漂移现象;其次,利用F-粗糙集对模糊粗糙集进行扩展,提出F-模糊粗糙集及其约简模型,该模型为模糊知识系统中知识并行约简提供了理论和算法支持。本文的主要创新点如下:(1)利用属性重要度定义概念漂移的指标。(2)基于并行约简,整体删除冗余属性,统一了度量概念漂移的标准。(3)利用数据的内部特性探测概念漂移现象。(4)结合F-粗糙集和模糊粗糙集,建立了F-模糊粗糙集及其约简模型,扩展了粗糙集理论。
其他文献
蚁群算法(Ant Colony Algorithm, ACA)根据蚂蚁的群体行为特性,模仿自然界中的蚂蚁寻找食物到蚁巢之间最短路径的行为,寻找搜索问题的最优解,是一种新型仿生进化算法;是继模拟
使用Web挖掘技术提取用户访问模式具有重要的现实意义。在用户浏览网页时为用户提供预取服务,在电子商务中为用户推荐商品以及改善网站的组织结构等。然而,在信息爆炸的今天,
随着虚拟现实技术的新发展和计算机网络的快速普及,基于网络的虚拟实验的开发和研究作为远程教育研究的热点,已经受到教育界人士越来越多的关注。虚拟实验系统在教学领域中的
随着Internet和移动媒体业务的快速发展,内容在终端上的展现已经成为人们越来越关注的焦点。从手机报纸到手机漫画、手机视频,一定都涉及到内容的展现问题。终端展现管理系统对
提高图像的分辨率一直都是图像处理领域一个重要的课题,由于成像系统及工艺的限制,从硬件方面提高图像分辨率难度大且成本高,所以通过软件算法的方法能够实现图像的超分辨率
随着互联网应用的快速发展,政府和企业等单位办公越来越依赖基于网络的应用系统,为了给众企事业单位营造安全和谐健康的网络环境,计算机应用系统的网络安全技术显得格外重要
随着各领域科学研究的开展,文献数据与日俱增,关于文献数据的更深入的研究对于科研对象的评价与趋势分析具有重要意义。文献计量学的研究为文献评价分析提供了系统的统计分析
随着信息技术的飞快发展,网络逐渐成为人类生产、生活所必需的一种载体和工具。网络一旦发生故障,将给人们带来重大的影响,因此加强网络可靠性建设迫在眉睫。在分析网络可靠
电力系统中电能质量扰动信号的检测和压缩是目前新兴的研究课题,其随着电力信息化的发展、电网规模的扩大、供电质量的提高而变得越来越重要。现代工业、商业及居民用户的用电设备对供电质量也提出了更高的要求,而谐波分析作为衡量电能质量的重要手段引起了人们越来越多的重视,其中对非稳态谐波的分析更是其中的重点和难点。另一方面对电能质量实时监测要求的不断提高,巨量数据的存储与通信问题已成为电力系统中一个非常重要且亟
随着可信计算的提出和发展,意识到把可信计算机制与网络接入机制进行结合,把可信扩展到网络,从终端开始保证网络可信,建造可信网络。可信网络包括接入端的可信、传输数据可信