一种改进的遗传k-means聚类算法

来源 :数学的实践与认识 | 被引量 : 0次 | 上传用户:mxf12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在经典的k-means聚类算法中,聚类数k必须事先给定,然而在现实中k很难被精确的确定.本文提出了一种改进的遗传k-means聚类算法,并构造了一个用来评价分类程度好坏的适应度函数,该适应度函数考虑的是在提高紧凑度(类内距)和分离度(类间距)的同时使得分类个数尽可能少.最后采用两个人工数据集和三个UCI数据集对k-means聚类算法(KM),遗传聚类算法(GA),遗传k-means聚类算法(GKM)和改进的遗传k-means聚类算法(IGKM)进行比较研究,比较的指标有类间距、类内距和分类正确率.研究证明改进的遗传k-means算法能够自动获取最佳聚类数k并且保持较高的正确率.
其他文献
<正>按人教版高中教材必修2中实验3—4进行实验后,发现以下几点不足:①加热过程中乙醇、乙酸、浓硫酸的混合液易变黑;②试管中收集的产物经振荡后久久不出现分层,或虽出现分
目的了解空巢老人健康状况及卫生服务需求,为湘、鄂、渝、黔四省边区社区老年护理的开展和完善提供科学依据。方法应用自制调查表对湘、鄂、渝、黔四省边区1456名空巢老人进
1995 年后转基因作物的商品化种植迅猛发展。优良的农艺性状和巨大的经济效益,日益显示出转基因作物是解决21 世纪不断膨胀人口对食物需求的主要途径之一。转基因作物的潜在生态风险
社会保险经办机构是社会保险一切服务的载体。随着社会保险制度的完善,参保人数和基金规模的快速增长,社保经办机构服务体系也日益壮大。社保经办机构作为社会保险公共服务的
目的探讨服务性学习在社区护理学实践教学中的应用,为培养应用型社区护理人才提供新思路。方法将296名参加社区护理实习的护理本科生分为试验组和对照组,试验组(n=147)应用服
目的探讨ICU气管切开术后患者应用不同声门下滞留物吸引方法的效果。方法选择ICU行气管切开、机械通气的患者104例,按入院序号分为A组和B组,每组52例。A组采用持续声门下吸引
目的 通过回顾性分析探讨影响非小细胞肺癌脑转移治疗效果的预后因素。方法 对1 33例非小细胞肺癌脑转移患者进行以全脑放射治疗为主结合其他方法的治疗。脑转移症状缓解定
关于基尼系数计算方法的文献已经十分丰富,但专门计算城乡混合基尼系数的理论方法,却一直没有得到很好的解决,这导致全国收入分配长期变化方面的某些研究难以深入。本文建立
论文对山西省池塘养殖历史沿革、养殖面积、养殖品种和养殖产量等养殖现状进行了阐述,剖析了山西省池塘养殖业存在的主要问题:养殖面积萎缩,养殖鱼类种质严重退化,养殖场基础
目前我国渔业已经迈入了由传统渔业向现代渔业转型时期,在这样的背景下,对我国现代渔业进行投入产出分析具有十分重要的现实意义。论文在构建分析现代渔业投入产出指标体系的