k均值聚类算法的研究与优化

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:wq123sd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘的重要组成部分,k均值聚类算法是聚类分析方法中的一种基本的划分式方法,也是无监督的机器学习方法。其具有效率高、容易理解和实现等优点,同时,可以对多种数据类型进行聚类,被广泛应用于诸多领域,如应用数学、模式识别、图像分割和生物工程等。但是,k均值聚类算法也有一些局限性。k均值聚类算法中合理的k值难以确定,而且算法选择初始聚类中心的随机性会导致聚类结果不稳定,同时,算法对噪声和离群点数据也有很强的敏感性。为了解决初始聚类中心随机性的问题,本文通过全局化思想对k均值聚类算法进行了改进,改进的聚类效果评价使用常用的误差平方和准则。实验结果表明,相较于一般的k均值聚类算法,全局k均值聚类算法得到了更好的聚类效果,同时提升了算法的稳定性。
其他文献
当前能源环境新形势下,对燃气锅炉的NOx排放要求也越来越严。北京市自2017年4月1日起,在高污染禁燃区内,新建、在用燃气锅炉NOx排放浓度限值降至80mg/m~3。文章从NOx生成机理
马克思的《资本论》关于自然力的理论是其重要研究内容。自然力是一种生产力,或源于自然界,或源于社会,能够无偿利用于生产过程并带来额外收益的一种生产要素,论述自然力的涵
目的:探讨加速康复外科(ERAS)理念结合随访制度在腹腔镜胆囊切除术患者中的应用效果。方法:将2015年7~9月肝胆外科30例腹腔镜胆囊切除术患者作为观察组,采用ERAS护理措施结合
党的十八大以来,习近平对中华优秀传统文化的时代价值和传承途径进行了系统论述,深刻肯定了传统文化的思想精髓、道德规范和时代价值,提出立德树人、以文化人的要求,从信仰、
消费税是对国内卷烟市场影响最深的税种,但我国09年的消费税改革却没有对控烟起到良好的效果。文章将围绕消费税,分析09年改革中存在的不足,提出进一步的改进建议。
寻根文学以来的知识分子形象,其形象类别、精神流变与价值取向经历了由单一到分化丰富的过程。这个时期初创作者在需要启蒙的时代带着强烈的责任感赋予知识分子形象高尚纯洁的
阐述了梁启超在《清代学术概论》中关于清代考据学的批评,分析了梁启超对戴震的《孟子字义疏证》和康有为的《新学伪经考》及《孔子改制考》的评价。从清初顾炎武对王学的反
目的探讨难治性精神分裂症患者的临床特点。方法按入院时间先后顺序共纳入72例难治性精神分裂症患者作为研究组,对照组72例为非难治性精神分裂症患者,在其他精神分裂症患者中
目的评价日间腹腔镜胆囊切除术(ambulatory laparoscopic cholecystectomy,ALC)的安全性及可行性,探讨加速康复外科(enhanced recovery after surgery,ERAS)理念在ALC中的临
<正>乳腺癌是女性最常见的恶性肿瘤之一,早期准确诊断具有重要的意义。近年来,随着超声技术的广泛应用,尤其是超声诊断技术在乳腺肿块的综合应用,包括高频线阵二维超声、彩色