基于数学形态学的模糊异常点检测算法

来源 :云南大学 | 被引量 : 0次 | 上传用户:magicylt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在高度信息化的今天,产生的海量数据和新型数据集都对传统的数据分析技术形成挑战。数据挖掘不断突破这些挑战带来的种种局限性,为当今信息技术的发展奠定了基础。作为数据挖掘的一项重要任务,异常点检测可能会导致意想不到的知识发现,也越来越引起研究者的重视。   但是,传统的异常点检测算法中,要么直接检测出异常点,而忽略了数据的自然结构,要么可以评估每个数据对象的异常点得分,却忽略了异常点与各簇之间的联系。然而,有时把异常点得分和聚类方法结合起来有利于对异常点与簇关系的研究。   从把聚类方法和异常点检测方法结合起来研究异常点与簇的联系的思想出发,本文提出了基于数学形态学的模糊异常点检测算法。该算法把数学形态学的聚类结果和基于连接的异常点检测的结果统一到一个模糊模型中,从异常隶属度和模糊隶属度这两个方面来分析对象与簇集的模糊关系。簇集包括通过聚类得到的真实簇和一个由异常点组成的虚拟的异常簇。算法通过两个步骤实现:首先,计算对象与异常簇的初始的异常隶属度;然后,计算对象与簇的模糊隶属度,并通过迭代的方法,改进对象与簇集的模糊关系,从而得到与各簇相关联的异常点。   基于数学形态学的模糊异常点检测算法可以通过综合比较分析对象与各簇的模糊关系来判断异常点,能满足更高要求的检测目标。同时,数学形态学聚类方法和基于连接的异常点检测方法的结合,使得算法对无论是点状、线状,还是凸面形状、非凸面形状等数据集,和变密度数据集都能够适应,还考虑了异常点“局部”的概念。通过在模拟数据集上的实验证明,该算法能够对复杂面状和变密度的数据集,正确、高效地找出异常点,同时发现与异常点相关联的簇信息,对异常点本身的意义具有启发作用。  
其他文献
视频会议系统是采用视、音频压缩技术和多媒体通信技术,支持人们远距离实时信息交流与共享、开展协同工作的应用系统。作为分布式视频会议系统最重要的组成部分,目前的视频会议
工作流的概念起源于生产组织和办公自动化领域,目的是通过将工作分解成定义良好的任务、角色,按照一定的规则和过程来执行这些任务并对它们进行监控,达到提高办事效率、降低生产
随着互联网的发展,新型数据与时间的联系越发紧密,而传统数据库难以有效管理数据的时态信息,并且尚无完整的时态数据库以进行时态数据管理,关于时态数据的管理课题的研究变得更为
多目标优化问题一直是科学和工程领域的一个难题和热点问题,在演化算法应用到这一领域以前,已经产生了许多传统的方法,传统的方法存在探索未知空间的能力不强,容易陷入局部极值点
随着工作流产品应用的逐渐普及、用户需求的不断提高和社会分工的细化,工作流管理系统的应用背景呈现出分布式、多任务协作等特点,给工作流任务的实施带来了新的挑战,如何利用工
IPv4地址耗竭致使全球互联网正在加紧向IPv6的过渡。但是由于IPv4应用广泛,互联网对IPv4依赖强,因而向IPv6过渡无法在短期内完成。为了在IPv4/IPv6过渡时期推动IPv6的部署发
随着个人机和计算机网络的快速发展,各种计算资源像燎原烈火一般,燃遍信息世界的每一个角落。各种应用的核心——数据,以不同的形式存储在不同的系统中,呈分布、异构和自治状态。
随着网络日益成为经济生活的基础设施,网络的规模和复杂度日益增加,为了知晓网络的运行使用情况,及时发现网络中可能存在的异常流量,需要一种行之有效的流量检测方法。这种方法应
C语言是一种广泛流行的高级计算机语言,即使现在已经有像java这样可以检查数组越界的语言,C语言还被使用于很多的系统开发中。一方面,还存在很多用C语言实现的遗留系统;另一方面,
曲面拟合是逆向工程和其它许多应用的关键技术。细分曲面因其表示简单、C1连续和可由一个控制网格表示任意拓扑曲面等优点而广泛应用于计算机动画与三维游戏等领域的复杂物体