基于特征间隙检测簇数的谱聚类算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:zhangxi0922
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
谱聚是聚类的一个重要分支。谱聚类算法不同于其他传统聚类算法,它将聚类问题转化成图的最优划分问题。谱聚类算法不关心数据集的形状,能处理复杂、高维非球形的数据样本。同时,谱聚类算法实现简单,计算复杂度小,非常适合处理大型数据集,可应用到分布式系统中去,并能获得全局最优解,改善聚类效果。谱聚类算法的难点之一是聚类簇数k值的检测。大多数聚类算法都需要人工提前来设定聚类簇数,而不合适的聚类簇数会导致不理想的聚类效果,甚至会使聚类过程失去意义。另外,谱聚类算法的另一个研究热点是分布式谱聚。集中式的谱聚类算法不能直接适用于分布式系统。对此,本文对传统的谱聚类算法作出了如下改进:首先,本文提出了一种基于特征间隙的簇数检测(Identifying Clustering Number based on Eigengap,ICNE)算法。通过构建基于邻接矩阵的规范拉普拉斯矩阵,顺序求解拉普拉斯矩阵的特征解,计算矩阵相邻特征值的间隙,判断出特征间隙的所在位置,确定簇数k,ICNE方法只需求解出前k个特征解,从而减少了特征求解的计算量,实现了快速有效地确定聚类簇数k。其次,提出了一种基于ICNE方法的分布式谱聚类(Decentralized Spectral Clustering with Identifying Clustering Number based on Eigengap,DSC-ICNE)方法,以分布式方式完成自动谱聚类,使得谱聚类方法可以应用于分布式系统,提高谱聚类算法的可扩展性。最后,提出了基于特征间隙检测簇数的谱聚类(Spectral Clustering with Identifying Clustering Number based on Eigengap,SC-ICNE)算法,在ICNE算法的基础上快速有效地确定聚类簇数k,完成谱聚类算法。并对SC-ICNE算法在UCI数据库上进行了仿真,仿真结果表明,SC-ICNE算法能够快速有效地实现聚类,而且相对于k-means算法,SC-ICNE算法对非球形数据集的聚类效果更好。
其他文献
IMT-Advanced定位于更高的数据速率和更大的系统容量,这对无线通信技术提出了新的挑战。未来的无线通信将会采用更高的频率,由此造成的路径损耗衰减更加严重。通过中继技术,
认知中继网络将中继技术认知网络融合,覆盖范围大频谱利用率高;但同时因为认知中继节点处于次要地位并不总是获得频谱,因而对频谱检测的检测概率提出了更高的要求。空间分集可以
网络编码技术因其能够带来网络性能方面的诸多优势而受到越来越多业内研究人员的广泛关注。在Ad Hoc网络中,能量效率就是无线链路上传输比特所需要的能量,它是网络设计的一个
胡记餐饮有限公司一直是沈城人们的最爱,胡记海鲜坊成立于2006年,虽然是新店,但已被食客所接受、认同.大厅可同时容纳500人就餐,风格各异的包房给广大就餐者带来温馨、幽雅的
天波超视距雷达(Over-the-Horizon Radar—OTHR)工作在高频波段,外部干扰很强,因此抑制外部干扰对于提高OTHR的性能、发挥OTHR的优势有重要的作用。本论文重点对高频干扰抑制
学术界和业界人士普遍认为:下一代无线通信系统应该是一个能够将现已存在的和未来将要出现的各种无线接入网有机地融合在一起的无线异构网络。实现无线异构网络的融合是一个
基于形状的图像匹配技术主要涉及三方面内容:一是形状特征的提取和描述;二是形状相似性度量;三是匹配最优解的搜索。本文首先研究了采用边缘特征点和角点来描述物体形状的情况及
智能天线技术在无线通信中能显著增加通信容量和速率、减少电磁干扰、减少手机和基站发射功率,并具有定位功能等优点,因此得到了人们越来越广泛的关注。但由于自适应智能天线算
学位
随着量子理论的逐步完善,量子保密通信从理论走向了现实。数据协调是量子密钥分发中最为关键的技术之一。在通信过程中,发送方Alice端通过光纤向接收方Bob端传送量子态信息,