聚类集成算法及应用研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:kzyzf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类集成技术综合利用基聚类的多个版本来完成聚类任务,可大大提高聚类结果的准确性和稳定性。近年来,聚类集成技术已成为机器学习领域的一个研究热点。聚类集成一般可分为三个阶段:生成基聚类、获取集成关系和确定最终聚类。通过设置单个聚类算法的不同参数、采用数据集的不同特征或者不同子集等方法来生成基聚类成员;利用关系矩阵或簇关联矩阵等方法来处理多个基聚类结果,并生成集成关系;最后利用超图分割技术等方法来获得最终的聚类结果。本文研究并实现了三种最新的聚类集成算法,并对其进行了改进,具体工作包括以下几个方面:(1)首先,研究并实现了基于随机投影的模糊聚类集成方法,本文利用特征重采样来改进原基聚类生成方法,并采用关系矩阵增一法改进获取集成关系的方法。(2)前述方法在聚类过程中需要事先指定聚类数目,本文研究并实现的第二个算法是基于多重K的聚类集成方法,该方法不需要指定聚类数目,直接生成不同聚类数目的基聚类。针对该算法中获取集成关系方法的不足,提出利用关系矩阵增K法来突出样本之间的紧密度和分离度,并在确定最终聚类时对孤立点进行了重分配。(3)前两种集成算法在获取集成关系时,得到的都是样本之间的关系,忽略了簇与簇之间的关系。基于链接的聚类集成方法综合了前两种算法中生成基聚类的方法,并充分利用簇与簇之间的相似度来完善集成关系。在研究并实现该算法的基础上,分析其确定最终聚类方法的不足,提出基于簇关联矩阵的二次集成方法。(4)在多个真实的基因表达数据集上的实验结果表明:改进后算法的聚类效果均优于原始算法;改进的基于多重K的聚类集成方法适用于不指定聚类数目的情况;在指定分组数目的情况下,改进的基于链接的聚类集成方法性能更好。
其他文献
人类大脑能够在复杂环境下利用其自身特有的融合机能帮助人们准确识别周边事物。在信息产业蓬勃发展的今天,说话人识别技术在模式识别领域不断被提及,因其在某些条件下能够很好
岩芯地学研究中,钻孔岩芯高光谱技术属于新的发展趋势.此次研究通过具体铀矿床为例,分析钻孔岩芯蚀变分带特征.通过多种方法进行光谱测试和分析,结果显示,钻孔岩芯热液蚀变矿
在现今网络化与信息化高度发达社会中,信息的安全显得极其重要,个人身份识别技术拥有显著的应用价值。在各种身份识别技术中,手写签名认证技术具有方便性、唯一性与稳定性的特点
本文主要对大型船舶的航向局部逼近神经网络复合自抗扰控制进行了理论设计和仿真研究,完成了对两艘大型集装箱实际船舶对象的操纵数学建模、航向智能控制器的算法设计及仿真
近年来由于脉冲技术、数字计算机的快速发展,使得数字控制系统在军事、航空以及工业过程控制中代替了模拟控制系统,作为设计与分析数字控制系统的基础,离散系统变得越来越重
微创手术机器人系统以其高效、可靠、安全的优良特性,逐渐走入人们的视野。然而随着医生对手术操作中临场感应能力的需求增大,微创手术机器人系统感知能力的实现已成为当今微创
我国煤炭企业信息建设现状是国有煤矿已将信息技术广泛应用于生产、安全、管理以及市场等各个领域。随着计算机技术、网络技术、数据库技术、自动化技术、传感器技术、数字视
网络控制系统(Networked Control System,简称NCS)是指利用通讯网络形成的闭环反馈控制系统。它减少了系统布线、降低维护与诊断成本、提高系统的灵活性,但同时也带来了一些