基于极限学习机的多核聚类算法研究

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:bear1634
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多核聚类方法在处理多源异构数据时具有比传统的方法更优异的性能,受到了数据挖掘、机器学习等相关领域专家的关注,并广泛应用于医疗、商业、生物、地理、因特网、电子商务、金融、娱乐等各行各业。由于多核聚类需要消耗大量的时间资源才能到达很好的聚类效果,导致了现有的多核聚类方法在处理实时性较高的多源异构数据分析任务中,不能得到广泛的应用。除了不能满足实时性学习的要求,当数据在采集、传输或存储的过程中出现核矩阵不完整的情况下,现有的多核聚类方法无法有效处理这种现象。因此,从运行效率上提升多核聚类性能以及对处理缺失核矩阵的多核聚类算法的研究,具有重要的理论意义和价值。主要研究成果如下:(1)为了提高多核聚类的学习效率,提出了一种基于极限学习机的两步多核聚类方法。该方法采用多个预先定义好的核函数作为多核学习方法的基核函数来捕获异构数据中的信息,并学习一种最优的异构数据表示核函数。在第一个阶段,对多源异构数据进行多核聚类,然后在第二个阶段使用极限学习机学习基核权重系数。该方法将多核聚类与极限学习机相结合,让多核聚类的结果引导极限学习机学习到最优的基核联合系数,从而快速学习到最优的聚类结果。实验表明,所提出的方法与现有的多核聚类方法相比,具有微弱优势的聚类结果,特别是,其速度是其他多核聚类算法的至少4倍。(2)为了有效地解决多核聚类算法无法处理核矩阵中出现缺失的情况,提出了基于核补全与极限学习机的多核聚类方法,该方法可以从多个来源学习未标记的不完整数据而且效率高,学习速度快。该方法首先对核矩阵中的缺失值进行填0初始化,然后采用多个基核函数将数据映射到多个核希尔伯特空间。最后,迭代地进行下面三个步骤:1)对多核希尔伯特空间数据进行聚类,2)获得核函数组合系数对应的核矩阵,3)对核矩阵中的缺失值进行补全。实验表明,该方法在核矩阵缺失率较低的情况下可以有效地对核矩阵中的缺失值进行估计。当满足收敛条件时,该方法可以输出与原始基核矩阵误差较小的矩阵,同时可以得到不完整数据的聚类分析结果。
其他文献
当今时代,基于互联网技术的新经济形态正在改变着人类的生活,冲击着企业生存发展的传统模式,与互联网的融合发展提升了制造业等实体经济的生产经营效率和自主创新能力。互联网时代企业的竞争优势不再是基于资产体量的竞争,而是商业模式的竞争。HT公司作为国家液压气动行业骨干企业和创新型企业,处于国民经济发展的主战场,如何进行互联网时代的商业模式创新,建立集信息资源、智力资源和液压气动行业生产资源为一体的工业互联
集成电路(integrated circuit,IC)按照摩尔定律已经发展60余年,芯片内集成晶体管数量已经达到1011,最新的技术节点已经进入7nm阶段,使IC制造技术面临着巨大的挑战。在IC后端工
三民主义青年团(简称“三青团”)是抗日战争时期由蒋介石一手扶植并建立起来的一个政治组织。蒋介石希望三青团能够促进国民党的更新与发展,更好地整合国内各派政治力量,并能
Based on the framing theory,this thesis examines the framing of anti-terroristic direction within Shanghai Cooperation Organization(SCO)by government media of R
目的:本研究将甲氧明引入每搏量变异度(SVV)指导的目标导向液体治疗(GDFT)理念,将其应用于创伤性脑损伤(TBI)手术患者,评价甲氧明对TBI手术患者预后的影响。方法:依据纳入标准选取总计60例行TBI手术患者,采用简单随机法则,将所有研究对象分为两组:对照组(C组)、甲氧明组(M组),每组各30人。所有病患的ASA分级、年龄、性别、体质指数(BMI)、麻醉时长均被记录。所有需施行手术的病患均
随着网络和信息技术水平的迅猛发展和智能手机的普及,以网络为平台进行交易的电子商务成为了我们生活中重要的一部分。电子商务的高速发展在两个方面有较大的影响,一方面是它带来的人们购物方式的转变,电子商务凭借其方便快捷、价格低廉的优势迅速抢占着传统零售业的市场,很多传统零售企业迫切需要转型。电子商务快速发展的另一方面就是产生了海量的信息数据,这些数据中隐藏着巨大的商业价值,对其进行研究和挖掘具有重要意义,
自20世纪80年代中期我国政府开始推行社区建设开始,村民参与一直是社区建设的重点,“治理”开始取代“管理”,学界强调社区村民应全方位的参与到社区“人、文、地、产、景”的建设中,村民社区参与程度开始被被作为社区治理层次和水平高低的评价标准。由于城乡差距,我国农村社区治理的水平明显低于城市社区治理的水平,村民参与社区治理的理论、方式等各个方面都不太完善和健全,要实现十九大报告提出的“打造共建、共治、共
随着现代传感器和存储技术的高速发展,高阶数据分析已经被广泛应用到了信号处理和工程控制等领域。矩阵秩最小化技术具有很强的全局约束能力,能够较好地表征二维矩阵的稀疏性,当前,低秩矩阵重建作为一种新的高阶数据分析和处理的工具已成为机器学习、计算机视觉和数据挖掘等领域的研究热点。然而,实际待分析的高维数据往往具有较为复杂的数据结构,如:彩色图像、多光谱图像和多维视频序列等。诸如向量和矩阵这样的传统数据表示
纳撒尼尔·霍桑(1804-1864)是美国19世纪最重要的浪漫主义作家之一,其作品经久不衰。他的《红字》(1850)、《七个尖角阁的房子》(1851)、《福谷传奇》(1852)因其背景设定在美
现如今,人们越来越关注人与社会、人与自然和谐相处的问题,关注生态和可持续发展的理念。随着社会经济的迅速发展,人们传统的居所开始变得日益边缘化出现了许多问题。本着对这些问题的思考,从生态美学的角度来分析研究人与自然和谐共处的理想的居住形式。我国地理和文化的差异性塑造了各个地区独特而珍贵的传统民居,陕北窑洞民居作为我国传统民居的一种,是我国劳动人民经过多年的实践和智慧,最早创造出来的符合当地自然环境、