基于聚类有效性指数的选择性聚类集成研究

来源 :河南财经政法大学 | 被引量 : 0次 | 上传用户:lzyrock
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类集成是机器学习和数据挖掘领域中一种极其重要的方法,它通过设计共识函数的方法对聚类集体中多个带有差异性的聚类结果进行集成,从而提高聚类结果的质量。聚类集成虽然可以提高学习精度,但对于如何选择个体精度高、差异性大的基聚类结果仍存在着许多困难。选择性聚类集成的实质是选取一部分差异性大、准确性高的基聚类结果进行集成,从而提高聚类集成结果的质量。聚类集成解决的问题主要集中在以下两个方面:一是使产生的初始基聚类结果即聚类成员呈现多样性;二是选取合适的融合方法。然后将这些聚类成员集成,进而获得最后的聚类结果。选择性聚类集成除了研究聚类集成的两个关键问题之外,还需要研究的重点是如何设计合适的选择策略,进而从产生的多样性聚类结果中选择部分合适的聚类成员进行聚类集成,以此提高聚类结果的质量。鉴于聚类有效性指数可用来测量聚类结果的良好性,本文利用此特点进行筛选基聚类成员集,进而提出了基于聚类有效性指数的选择性聚类集成算法。本文的具体工作主要围绕选择性聚类集成的选择策略进行,具体分为以下两个方面:第一,提出了一种基于单一聚类有效性指数的选择性聚类集成算法研究,该算法采用三个经典的聚类有效性指数来度量基聚类结果的有效性,利用NMI(Normalized Mutual Information,标准化互信息)选择出效果较好的基聚类结果,然后使用CSPA算法进行集成,从而提高聚类结果的质量。第二,鉴于单一聚类有效性指数仅适用于特定分布的数据集,本文进一步提出了一种基于多个聚类有效性指数的选择性聚类集成算法研究。该算法综合3个聚类有效性指数对初始基聚类结果进行评价,然后挑选某个区段的基聚类结果使用CSPA方法来进行集成。本文在5个人工数据集上对所提出的上述算法展开了对比科学实验,实验结果显示,本文算法提升了聚类集成结果的准确度。
其他文献
<正>高尿酸血症是痛风发生发展和预后严重程度的重要指标之一,调节生活方式,改善饮食习惯是防治其并发症的关键措施。而高质量的健康教育,具有提高患者依从性、减轻患者心理
会议
对小学数学来说,传统的教学模式已经无法满足当前学生的需求,因此,在实际教学中,教师应优化教学模式。当前,小组合作学习受到了教师和学生的青睐。基于此,本文主要探讨了小组
按照V型开发模式对燃料电池城市客车的整车控制器(Vehicle control unit,VCU)进行了开发,取得了初步的 成功,所开发的整车控制器成功装车运行。按照V型开发模式的各个阶段,对
论述了低阶煤热解机理、热解技术及工艺的研究现状,重点分析了低阶煤与其他物质共热解技术,对比了现有低阶煤热解工艺的优缺点,介绍了一种新型小粒径低阶煤热解工艺,分析了低
国际田联少儿趣味田径项目(以下简称少儿趣味田径)以田径项目的基本运动形式为载体,通过对传统的田径项目进行系统的改造来激发青少年儿童参与田径运动的兴趣,把少年儿童的基
智能手机已经成为我们生活中至关重要的一部分,作为一名私人助理,它帮助我们作为客户掌握日常任务(例如,移动设备一直是消费者的伴侣,它们在消费者的日常生活中扮演着越来越
四川省是我国西部的经济大省,而省会成都则是四川甚至西南地区的经济、政治和文化的中心。同时成都市是西南地区的竞技体育强市,多年来培养了许多优秀员进入国家队。其中在网
<正>近日,中央电视台正式播出保密文献纪录片《胜利之盾》。该片汇集革命战争年代共产党人为保护秘密安全面英勇斗争的感人事迹,用镜头梳理保密工作发展历程,展现了共产党人
原国家质量技术监督局首次发布了GB/T 20000.2—2001《标准化工作指南 第2部分:采用国际标准的规则》。该标准是根据ISO/IEC指南21∶1999《采用国际标准为区域或国家标准》(英
根据统一强度理论应力不变量的形式,确定所要建立模型的屈服函数以及塑性势函数,考虑土体强度随加载过程的逐渐发挥,确定土体硬化函数。采用非相关联流动法则建立复杂应力状