半监督的改进K-均值聚类算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:polaris20092009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
K-均值聚类算法必须事先获取聚类数目,并且随机地选取聚类初始中心会造成聚类结果不稳定,容易在获得一个局部最优值时终止.提出了一种基于半监督学习理论的改进K-均值聚类算法,利用少量标签数据建立图的最小生成树并迭代分裂获取K-均值聚类算法所需要的聚类数和初始聚类中心.在IRIS数据集上的实验表明,尽管随机样本构造的生成树不同,聚类中心也不同,但聚类是一致且稳定的,迭代的次数较少,验证了该文算法的有效性.
其他文献
明天就是一年一度的中秋节了,我对这个美好的节日充满了遐想.我对中秋节的遐想无处不在,连角落中都充满着美好的遐想.rnrn
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
武术是我国优秀传统文化的重要组成部分,也是中华民族生活范式的一种表现形式,维系着各民族的情感,蕴含着丰富的民族风俗和伦理,构筑了中华民族五千多年的多彩生活,在帮助国
传统的基于AMDF及其改进算法LV-AMDF容易导致检测基音周期时产生加倍、减半等错误.针对该现象,分析了AMDF、LV-AMDF函数的特性及其用于基音检测时存在的不足,提出了幅值补偿A
针对XML数据流上的XPath查询处理问题,基于自动机技术构造的lazyDFA查询处理器是一种有效的解决方法.为了提高lazyDFA的查询处理效率,提出了利用DTD的语义信息和结构信息对la
属性约简的效率是粗糙集等软计算理论的核心问题之一.为了提高约简效率,在分析不可分辨关系和基数排序特点的基础上,提出了一种时间复杂度为O(|C||U|)的求核算法.然后,遣用改
我国目前衡量银行盈利能力普遍采用的指标是股本收益率(ROE)和资产收益率(ROA),其缺陷是只考虑了银行的账面盈利而未充分考虑风险因素。国际银行业的发展趋势是采用经风险调整
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
跨入2011,我国经济正式进入“十二五”轨道,中国工程机械将迎来又一个充满希望和挑战的发展阶段。过去的一年,中国工程机械产业用“全行业销售收入超过4000亿元、增速20%以上
作为发展中大国,中国利用低廉的劳动力成本优势,已经成为“世界加工厂”,但是仍处于世界经济的下游环节。中国经济正步入优化产业结构,提升产业的跨越式发展阶段。要成功的完成产