几种新聚类算法的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：kmyzkmyzkmyz

【摘要】

：

随着计算机和互联网技术的飞速发展,各种类型的数据呈爆炸式增长。如何在海量数据中进行准确有效地信息挖掘和知识获取,已成为当今社会亟待解决的重点问题。聚类分析作为数据

【作者】

：

钟俊坤

【出处】

：

西安电子科技大学

【发表日期】

：

2004年期

【关键词】

：

聚类分析密度边界点视觉系统网格聚类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机和互联网技术的飞速发展,各种类型的数据呈爆炸式增长。如何在海量数据中进行准确有效地信息挖掘和知识获取,已成为当今社会亟待解决的重点问题。聚类分析作为数据挖掘技术中非常有效的手段之一,其目的是发现隐藏在数据集中的内部结构。近年来越来越多的学者关注聚类分析,但是对类边界信息的关注度不够,另外聚类分析与其他学科交叉结合也日益频繁,其中的生物视觉系统计算模型为聚类分析提供了一种新颖的生物观点。本文针对现有聚类算法存在的缺陷展开研究,设计一种利用边界信息进行聚类的算法。另外,将生物视觉系统的尺度空间理论应用于聚类分析,提出一种基于视觉系统的网格聚类算法。本文的主要创新工作包括以下两个部分:(1)针对K-means聚类算法不适用于非凸数据集以及Affinity Propagation(AP)算法不能准确区分类边界的缺点,本文通过分析类边界信息,提出一种利用边界信息进行聚类的算法。本算法采用传递性聚类不断扩展当前集合直至形成完整的类,由于使用传递性聚类方法使得本算法对凸型和非凸型数据集都能取得很好的聚类结果。因为边界点描述了潜在的数据结构,对聚类分析具有十分重要的意义,所以本算法首先统计每个数据点邻域内包含数据点的个数作为其密度,然后定义密度低于平均密度的数据点为边界点并统计边界点的数目。如果边界点的数目小于给定的阈值,则用边界点勾勒出各类的轮廓,然后任意选择一个非边界点开始传递性聚类,在传递聚类过程中遇到边界点则停止往类外传递,这有效地避免了将不同类的数据点聚为一类的情况发生。否则,说明数据集过于稀疏,此时边界点与非边界点差别不明显即无法用边界点准确划分类边界,所以不再区分边界点与非边界点,直接进行传递聚类。根据边界点的数目不同采取不同的聚类方案使本算法对稀疏和非稀疏数据集都能得到理想的聚类结果,从而扩大了算法的适用范围。在人造数据集和标准数据集上的实验结果表明本文提出的算法是有效的。(2)针对网格聚类算法中网格宽度难以确定的问题,本文设计一种计算网格宽度的方法,并将视觉系统中的尺度空间理论应用于聚类分析,提出一种基于视觉系统的网格聚类算法。通过对传统网格聚类算法的时间复杂度和准确度进行分析,确定合理的网格宽度,使得在减小算法时间复杂度的同时保证算法的准确度。根据Weber定律来增大网格宽度,从而达到视觉尺度空间理论中连续增大观察尺度的效果,对于每个网格宽度都有一个聚类结果,定义出现次数最多的聚类结果作为最终聚类结果。本算法将视觉系统中的尺度空间理论应用于聚类分析中,因此能够准确地发现数据集中的类结构。在人造数据集和标准数据集上的实验结果证明了基于视觉系统的网格聚类算法是有效和高效的。

其他文献

仪器的作用与量子力学的诠释

<正> 当前,我国哲学界对量子力学的哲学诠释存在着两种倾向,一种是强调量子力学认识的主体性;认为量子力学所揭示的仪器的特殊作用突出了主体性(包括选择性)。其二是强调量子

期刊

量子力学物理实在主体性测量理论微观过程量子态

产品差异、外资垂直并购与市场竞争——基于企业产品定位和市场份额的分析

基于产品从低端到高端分布的Hotelling模型,同时考虑上下游企业产品定位的内生决策,探究外资高端下游企业垂直并购上游企业对我国低端下游企业产品定位和市场份额的短期与长

期刊

产品差异外资垂直并购市场竞争产品定位市场份额

建筑节能中热力学方法的分析应用

建筑的采暖制冷需求是典型的低能源需求,分析方法是一种对能源系统进行热力学分析非常有效的方法,特别适用于低能源系统。通过对供热工况下建筑各子系统的消耗分析,

期刊

建筑节能分析围护结构能效

淘汰猪瘟抗体不合格种猪对母猪繁殖性能和仔猪生长性能的影响研究

应用Herdchek猪瘟抗体检测试剂盒对3个规模化猪场送检的1865份血清样品进行猪瘟抗体的测定,淘汰加强免疫后猪瘟抗体不合格(阻断率<50%)的种猪,观察并记录淘汰猪瘟抗体不合格

期刊

猪瘟淘汰繁殖性能生长性能

晚期罗马帝国的文化困境

晚期罗马帝国的文化困境金利安罗马帝国的兴衰问题，始终是发人深省的。罗马帝国不仅开创了西方历史上空前繁荣的局面，而且近代以来西方社会所进行的诸多重大尝试及所面临的问题

期刊

罗马帝国商务印书馆军事征服希腊人文化困境

特定次谐波补偿的并联型APF算法研究与设计

有源电力滤波器作为一种应用在供电系统中的谐波抑制装置,有着谐波抑制效果好,响应速度快,稳定可靠性高等优点。传统APF控制思想是针对畸变电流中的所有谐波进行补偿,然而电

学位

谐波抑制有源电力滤波器特定次谐波检测特定次谐波补偿现场可编程逻辑门阵列

西安市近58年雨涝事件时间序列特征研究

利用西安市1951-2008年逐日气象数据,以Z指数方法定义西安市雨涝指数,结合大雨、暴雨等主要强降水雨涝事件发生频次变化特征,揭示出西安市近58年雨涝灾害时间序列变化特征以

期刊

西安市雨涝事件Z指数小波分析

CWPO中催化剂的应用研究现状及趋势

催化湿式过氧化氢氧化技术，是一种专门针对高浓度难降解有机废水的处理技术。对该技术中使用的催化剂进行了分类评述，并详细讨论了非均相催化剂的研究状况，展望了其今后的发展方

期刊

CWPO有机废水均相催化剂非均相催化剂

标准化助力质量提升，提高出口产品竞争力

标准是经济活动的技术依据,促进投资贸易便利化,是推进"一带一路"倡议的重要抓手。发达国家普遍将标准化上升到国家战略高度,以标准抢占经济科技竞争制高点。我国作为世界第

会议

标准化质量提升出口产品竞争力

氧化铝平板陶瓷膜的制备

以氧化铝、少量无机粘接剂为主要原料,加入适量的有机粘结剂、分散剂(聚丙烯酸铵)和水,采用浸渍和喷涂两种工艺在氧化铝支撑体上镀膜,然后在高温下烧制成氧化铝平板陶瓷膜。

期刊

氧化铝平板膜分散剂浸渍法喷涂法

几种新聚类算法的研究

其他学术论文