基于属性相关分析的局部离群数据挖掘算法研究及其应用

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:a328623784
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海量高维离群数据挖掘是当前数据挖掘等领域的研究热点之一,但传统的离群数据挖掘算法大多数是从全局的角度寻找离群数据,并不适合高维海量数据集。本文针对高维海量数据集中的局部离群数据,采用属性相关分析方法,对离群挖掘算法与应用进行了较深入的研究,其主要研究成果为:1)给出了一种基于属性相关分析的局部离群数据挖掘算法。该算法首先采用属性相关分析,删除冗余属性及在各种属性维组合中都处于稠密区域的数据对象,有效地实现降维和缩小数据集的目的,提高了挖掘效率;然后根据稀疏度系数,利用微粒群算法搜索稀疏子空间,并确定局部离群数据;最后采用恒星光谱数据作为数据集,实验结果验证了算法的正确性和有效性。2)给出了一种基于属性相关分析的局部离群数据并行挖掘算法。该算法首先由主节点分配属性相关分析任务,各个子节点并行查找数据集中的冗余属性,将其冗余属性传回主节点,并由主节点删除;其次,主节点分配搜索任务,各子节点采用微粒群算法,并行搜索局部离群子空间;再次,由主节点对局部离群子空间合并计算后,确定全局离群数据;最后,在MPICH2-1.0.3的并行计算环境下,采用天文光谱数据作为数据集,实验结果验证了算法的正确性和有效性。3)在上述研究的基础上,采用C++和Oracle 9i作为开发工具,设计与实现了天文光谱特征线局部离群挖掘原型系统。利用晚型星SDSS光谱数据作为实验数据集,验证了该系统实现天体光谱数据局部离群挖掘是可行的、有价值的。
其他文献
本文所涉及项目主要针对在基于J2EE平台规范的应用服务器中提供EJB容器集群的问题。系统采用了面向对象的系统分析与设计方法和迭代式软件过程。依据EJB容器集群系统的总体用
我们的主要目的是通过利用一些比较底层的网络通讯协议和一些比较先进的网络协议特征,克服一些当前信息系统的不足。我们没有打算整个的推翻现有的信息系统,而是希望将新的系统
移动无线传感器网络(mWSN)作为一种新兴的传感器网络(WSN),以其感应数据高保真性、节点位置可调整、节点移动可控制、网络部署灵活等优点,被广泛应用于无人职守现场、灾难发
在日常生活中,不规则物体是一类比较特殊的物体,它们没有固定的外观形状,人们可以很容易的指认这些物体,却总是不能准确地给出这些物体的统一定义,因此不规则物体模拟是计算
该论文从GIS系统的发展历史出发,讨论了GIS系统的主要构成和发展趋势.然后分析了比较了目前几种重要的WebGIS系统的特点,指出了当前的WebGIS系统缺乏互操作的特性.该文的研究
学位
传统的集中式数据库的数据集中的特点已经无法满足大量数据分散分布的应用要求,分布工数据库因此被提出来,它被认为是"数据库系统+计算机网络",但绝不是二者的简单组合,分布
构件库系统是基于构件的软件重用研究中的一个重要组成部分,国内外的很多组织和机构都在进行关于构件和构件库的研究。已有的构件库系统大多使用各自特有的数据模型及服务接口
在DPS中,当单个Agent不能完成任务,且任务不能分解或分解算法很复杂时,Agents必须形成有效的联盟来执行任务。与其他的最优化问题一样,联盟形成需要在复杂而庞大的搜索空间中寻找
论文《基于多合本体论的中文标准主题词智能析取》是对中文信息处理实现标题词标准化和析取.该文属于自然语言处理研究范畴,针对办公自动化研发中标题标准化和析取问题展开了
该论文重点讨论了智能小区信息化建设的方案,在方案设计的基础上,对小区宽带网接入技术进行了研究,比较详细的研究了以太网方案、有线电视网方案(HFC)和ADSL接入方案,并通过