基于密度的聚类算法研究

来源 :中北大学 | 被引量 : 0次 | 上传用户：yx065781080

【摘要】

：

随着信息技术的发展,数据挖掘技术得到了广泛的关注。在数据挖掘技术中有很多研究领域,聚类分析就是其中一个重要的研究方向。与分类不同,聚类的目标是在没有任何先验知识的

【作者】

：

孙凌燕

【机构】

：

中北大学

【出处】

：

中北大学

【发表日期】

：

2009年期

【关键词】

：

聚类分析快速算法核心点代表对象相对密度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息技术的发展,数据挖掘技术得到了广泛的关注。在数据挖掘技术中有很多研究领域,聚类分析就是其中一个重要的研究方向。与分类不同,聚类的目标是在没有任何先验知识的前提下,根据数据的相似性将数据聚合成不同的簇,使得相同簇中的元素尽可能相似,不同簇中的元素差别尽可能大,因此又被称为非监督分类。聚类分析作为数据挖掘系统中的一个模块,既可以作为一个单独的工具以发现数据库中数据分布的深层信息,也可以作为其他数据挖掘分析算法的一个预处理步骤,因此研究如何提高聚类算法的性能具有重要的意义。迄今为止研究者们提出了多种聚类算法,例如划分方法、层次方法、基于网格的方法、基于密度的方法、基于模型的方法等。基于密度的聚类算法由于能够发现任意形状的聚类,识别数据集中的噪声点,可伸缩性好等特点,在许多领域有着重要的应用。DBSCAN算法是典型的密度聚类算法,但由于该算法采用全局密度,部分密度小的聚类可能被作为噪声数据进行处理,而处于两聚类边缘的点,若存在该点的密度比较大的情况则容易造成单连通的情形,出现错误结果。同时算法需要判断数据库中每个点是否为核心点,为每个点建立查询区域,这样就需要频繁的I/O操作。FDBSCAN算法是对算法DBSCAN的一个改进算法。该算法通过选用核心点邻域中的部分点作为种子点来扩展簇,从而大大减少区域查询的次数,降低I/O开销,在一定程度上加快了聚类速度。但其在聚类过程中容易丢失一部分对象,成为噪声,影响了聚类结果。本文第三章在对FDBSCAN算法存在的问题进行深入研究的基础上,具体提出了一种选最远距离核心对象的方法,并且针对其核心对象是非核心点就不作查询,以至于丢失对象的情况作了详细讨论,最后提出从核心领域中的核心点中选择代表对象的方法,在一定程度上解决了丢失对象的问题。FDBSCAN算法是对DBSCAN算法在速度上的一个改进,基于相对密度的聚类算法RDBClustering (Relative Density Based Clustering)则是针对其算法采用全局密度这一缺点做的改进。虽然两种算法从不同角度对DBSCAN算法做了改进,但仍都存在不足。前者在一定程度上加快了聚类速度,但无法解决对象密度不均匀时聚类出现错误结果的问题;后者解决了全局密度的问题,但其运行速度很慢,需要的内存也比较大。因此,本文第四章在两者的基础上提出一种新的算法——基于相对密度的快速聚类算法FRDBClustering (Fast Relative Density-Based Clustering),新算法结合了FDBSCAN算法和RDBClustering两种算法的优点,不仅解决了DBSCAN算法全局参数的问题,在一定程度上也加快了聚类速度,实验证明了该方法的有效性。

其他文献

若干数字混沌图像加密算法的密码分析

在二十世纪六十年代开始迅速发展的混沌理论被发现与密码学存在着紧密的联系，比如混沌系统的状态对初始条件或控制参数的变化非常敏感，这点刚好与密码学里要求加密结果对密钥和

学位

混沌密码分析图像加密已知明文攻击选择明文攻击差分攻击

利用地震波吸收系数确定裂缝的发育带-以普光三叠统须家河组为例

裂缝性储层是裂缝油气藏勘探与开发的重要目标层，裂缝是重要的储集空间和流体渗滤通道。一般情况下，地层中在裂缝发育带因裂隙的散射作用，吸收、衰减增强，吸收系数大。可通过对地

期刊

相干体吸收系数裂缝性储层

以用户为中心的数据服务即时组合及数据视图更新优化

随着网络技术和服务计算技术的飞速发展和深入应用，面向服务的应用得到充分的重视和深入的研究，尤其是在各政府和企业的业务领域，对于业务数据的管理越来越得到业务人员的重视。

学位

数据服务即时组合数据视图更新效率业务用户

抛物型方程参数反演的蚁群算法研究

抛物型方程是偏微分方程中的三大类方程之一，实际生活中的很多问题可以归结为抛物型方程的参数反演问题，因此对抛物型方程的参数进行反演具有重要的作用。在已有资料和理论的基

学位

抛物型方程蚁群算法水质模型参数反演

小学数学教学上如何激发学生的学习热情

数学是小学学习阶段的一门重要课程，教师要想更好的提高学生的数学成绩，就应该从培养学生的学习兴趣入手，激发学生学习数学的n热情，本文就针对在小学数学教学中如何激发学生的学

期刊

小学数学教学方式学习热情学生

胡锦涛在中共中央政治局第十五次集体学习时强调坚持国防建设与经济建设协调发展

请下载后查看，本文暂不支持在线获取查看简介。胡锦涛在中共中央政治局第十五次集体学习时强调坚持国防建设与经济建设协调发展 Please download to view, this article does

期刊

国防建设

问津桃花源——绘本创作谈——湖南省建筑师学会沙龙活动

8月29日晚,由湖南省建筑师学会主办的建筑师沙龙活动在长沙市新民路尚书房如期开讲.应学会邀请,沙龙主讲人著名画家蔡皋先生作了一场题为“问津桃花源-绘本创作谈”的学术交

普适细胞自动机若干动力学性质

从数学上看，细胞自动机（Cellular Automata，简称CA）是一种时间、空间和状态都离散的动力系统。研究表明，通过设计不同的局部映射，细胞自动机可以表现出复杂丰富的动力学行为。比如，

学位

细胞自动机符号动力学滑翔机拓扑传递拓扑共轭混沌

Ni75AlxV25-x合金沉淀过程界面演化规律的微观相场研究

镍基高温合金具有良好的高温蠕变强度、抗疲劳性能、抗氧化和抗热腐蚀性能，广泛应用于制造工业中的热端部件，其中加入铝、钨、钼、钴等元素形成共格有序的A3B型金属间化合物作

学位

镍基高温合金沉淀过程界面演化规律微观相场

密闭取心技术在礁灰岩油田的应用

密闭取心技术在砂泥岩油田应用较多，但在礁灰岩油田应用较少。本文以L礁灰岩油田X井为例，阐述了密闭取心技术在礁灰岩地层中的应用。对密闭取心的技术措施进行了详细说明，包括取

期刊

礁灰岩油田密闭取心技术措施改进手段

基于密度的聚类算法研究

其他学术论文