基于粒计算的K-medoids聚类算法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:Heavenws
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统K-medoids聚类算法的聚类结果随初始中心点不同而波动,且计算复杂度较高不适于处理大规模数据集;快速K-medoids聚类算法通过选择合适的初始聚类中心改进了传统K-medoids聚类算法,但是快速K-medoids聚类算法的初始聚类中心有可能位于同一类簇。为克服传统K-medoids聚类算法和快速K-medoids聚类算法的缺陷,提出一种基于粒计算的K-medoids聚类算法。算法引入粒度概念,定义新的样本相似度函数,基于等价关系产生粒子,根据粒子包含样本多少定义粒子密度,选择密度较大的前K个粒子的中心样本点作为K-medoids聚类算法的初始聚类中心,实现K-medoids聚类。UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明了基于粒计算的K-medoids聚类算法能得到更好的初始聚类中心,聚类准确率和聚类误差平方和优于传统K-medoids和快速K-medoids聚类算法,具有更稳定的聚类结果,且适用于大规模数据集。
其他文献
目前,随着银行发展水平的逐渐提升,对其借贷业务的有效开展进行了更多的考虑。在此背景下,为了确保银行信贷业务状况良好性,则需要对这类业务中贷款企业的财务风险进行科学分
伴随信息化技术在各个领域越来越普遍的应用,使得中职会计教育教学也产生了相应的变革,即会计信息化会将会计电算化逐步代替。在这一背景下,对信息化背景下的中职会计教学模
文物定名应科学、规范、准确。本文以《第一次全国可移动文物普查工作手册》中规定的命名规则为出发点,依托所收集的数据,采用异化和归化相结合的翻译策略,对陶器文物定名的
本文讨论了自然资源资产负债表在绿色国民经济核算中的必要性,结合当前资产负债表编制的实际情况,对相关问题进行探讨。
频繁超剥地区具有岩性变化快、断裂体系发育等特点,是地层油气藏形成的有利位置。为了系统研究频繁超剥地区不整合特征及圈闭发育模式,以草桥北部地区沙河街组四段(简称沙四)
传统的基于保护、开关动作信息的电网故障诊断方法在实际应用中存在误动和拒动。利用SCADA系统采集的电网支路稳态潮流信息作为诊断依据,提出一种电网支路开断故障诊断的新方
环顾艺术领域,当不同的思想观念、审美趣味、利益诉求于后现代语境下闯入人们的判断视阈,前卫、新潮、现代艺术、当代艺术、实验艺术、装置、新材料、跨媒介……这些新名词正越
报纸
分析了利用数字图像处理进行畸变校正的理论 ,采用点阵样板校正的方法 ,对特殊的大视场广角物镜光学系统进行畸变的实时校正。通过计算机多项式拟合 ,得到该光学系统畸变的非
随着延安城管跳踩商户头部的视频和照片广为传播,城管行政执法中的暴力冲突问题又引起了公众高度关注。从近年来频繁发生的城管与摊贩冲突来看,城管的的确确陷入了无奈的困局之
报纸
财务管理是企业经营管理的关键环节,对于业务日趋多样化、复杂化的建筑设计院而言,财务管理的重要性也愈加突显,本文结合当前的市场实际,从设计院财务管理现状入手,对存在的