基于空间几何特征的分割聚类法

被引量 : 0次 | 上传用户:wondercn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是一种常用的数据分析方法,指将数据集合分组,使得具有类似性质的数据聚到一起成为一个类,而属性相差较大的数据相互分开成为不同类的过程,是数据挖掘的一个重要分支,也是模式识别的一个重要应用领域,是一种典型的无监督分类方法。其中基于划分的聚类算法,基于密度的聚类算法,基于网格的聚类算法,基于图论的聚类算法在数据聚类的过程中具有相似性,所以将它们汇总在一起称统称为分割聚类法。这些算法不管是在理论上还是实际应用中都得到了充分的探讨与应用。但是由于数据来源的多样性与数据结构的复杂性等原因以及模式样本集本身的几何特征,目前还没有一种聚类算法能够同时运用于全部的数据库,每种算法都有各自的缺陷。需要根据数据集的具体特征来选择合适聚类算法。首先本文介绍了一些基本的聚类算法,包括了这些聚类算法的步骤以及对它们在处理数据的过程中表现出来的优点与缺点,然后根据这些算法的缺点提出了基于改进这些缺点的算法。针对动态聚类算法在选择初始聚类中心具有随机性的缺点,在本文的第三章提出了基于参考点的k-均值算法,基于参考点的k-均值算法是在k-均值算法和参考点的基础上提出的,主要是为了克服k-均值算法在寻找初始聚类中心时具有盲目性以及聚类结果受到模式样本排列顺序影响的缺点,使得初始聚类中心能够更好的反应模式样本集的几何特征,以便在聚类时能够减少迭代次数、提高聚类准确度。在本文的第四章提出了网格密度最大的近邻聚类算法,网格密度最大的近邻聚类算法是在近邻聚类法和中心网格的基础上提出的,主要是为了克服近邻聚类法的聚类结果受第一个指定的聚类中心影响较大以及初始聚类中心单一的缺点,以便提高聚类准确度。实验证明,与传统的聚类算法相比较,本文提出的算法有较好的聚类效果。
其他文献
水资源是人类生存和发展的重要的战略资源,其对于人类文明的产生和发展具有不可替代的重要作用。随着经济、社会的发展和生活水平的提高,人们对于水资源的需求也日益增加。在
基耶斯洛夫斯基和王家卫,是20世纪90年代欧洲和亚洲电影界两位著名电影导演大师,他们的电影作品都集中关注后现代环境下人类的生存状态。们的影片对人物刻画和人性描写形象生
合成孔径雷达(SAR)具有全天候、全天时、远距离成像的优点,无论在军事上还是民用中都具有非常重要的意义。将SAR和地面运动目标检测(GMTI)相结合,能够很好地监视场景中的静止和
目的建立结核分枝杆菌L型的诱导模型,观察L型变异对结核分枝杆菌耐药性的影响。综合评估中药茜草素对结核分枝杆菌L型的作用,为开发新型抗结核中药提供实验基础。方法①通过3
随着经济全球化和信息技术的发展,现代物流在社会发展中的作用日益突出,冷链物流企业是现代物流专业化发展的产物,它主要借鉴传统物流企业的操作方法和营运模式进行管理。由于管
全局优化问题是优化问题中一个比较重要的分支,因其在自然科学,工程技术等诸多领域的广泛应用,对该问题的研究具有十分重要的意义。自20世纪60年代早期以来,约束优化问题与无约束
随着我国城市建设的不断发展,各大城市都正在兴建或准备兴建地铁。城市地铁的修建过程中涉及到大量的深基坑工程,并且常常是处于密集建筑区内,就不免出现深基坑施工和周围建筑物
典当简单的说来,就是以物换钱,拿有价值的财产到典当行去换取自己需要的资金。典当在当今社会上发挥着重要的作用,如对于中小企业而言典当就是一种快捷的融资渠道,而对于普通群
随着利率市场化的发展,利率管制权不再掌握在政府手中,而是随着市场供求关系的变化,基准利率也发生变化,利率水平与均衡市场的利率水平不断接近,促进了国家经济的健康发展。然而,由
近几十年来,以非制冷红外焦平面阵列(Uncooled Infrared Focal Plane Array简写UIRFPA)为核心器件的红外成像技术逐渐快速发展起来,具有无需制冷、体积和重量小、成本低的优