基于自编码器的深度子空间聚类

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:danan1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在真实世界中,聚类算法得到了广泛的应用。基于子空间的聚类又是其中非常重要的一种方法。近年来,得益于深度网络强大的特征表达能力,研究人员提出了许多基于自编码器的深度子空间聚类方法。但这些方法也存在一些不足,比如,如何让网络在训练过程中学到更具判别力的特征表示以获得更好的聚类结果是一项具有挑战性的任务。此外,随着各领域中多视图数据爆炸性增长,如何同时有效利用多视图数据之间包含的一致性和多样性的信息成为了一个热门的研究课题。为了解决以上问题,本文提出了基于自编码器的单视图深度子空间聚类以及多视图深度子空间聚类方法,主要研究内容包括以下两个方面:(1)基于自编码器的单视图深度子空间聚类方法研究:本文提出了一个特征监督模块,通过最小化目标概率分布与生成的聚类概率分布之间的KL(Kullback-Leibler)散度,使模型学习到对聚类任务贡献度大的特征。同时,对自编码器模块、自表达模块、特征监督模块联合优化,使特征提取与邻接矩阵学习两个过程互相促进,从而实现更好的聚类效果。在五个真实数据集上的实验结果充分证明了模型的有效性。(2)基于自编码器的多视图深度子空间聚类方法研究:本文所提出的方法通过让网络学习视图间一致性表达以及单个视图内特异性表达来充分挖掘并利用多视图数据蕴涵的相互关系。此外,在每个视图特异性表达上增加多样性的约束使其学到的信息尽可能丰富。为了有效利用模型优化过程中每次迭代得到的聚类伪标签,在网络中增加一个自监督模块来促进邻接矩阵的学习。最后,利用经典的梯度下降算法来联合优化所有网络模块,并且通过谱聚类获得聚类结果。为了更好挖掘多视图数据中包含的非线性信息,本文把上述的线性模型推广到基于自编码器的深度模型中。在六个真实数据集上的实验结果,充分证明了本文提出的模型良好的聚类效果以及对于各种数据的鲁棒性。
其他文献
三维感知技术的研究是一个应用广泛但是目前仍然处在发展阶段的研究领域。三维数据格式多种多样,三角网格模型作为其中一种广泛使用的数据格式,和点云格式一样有着极不规则的特点,同时其区别于点云还包含了复杂的拓扑结构。这使得现有深度学习方法在处理三角网格数据时难以充分发挥其强大的功能。在这样的背景下,本文立足于三角网格模型识别任务,从几何特征和拓扑结构两个角度分别进行了研究。本文将三角网格模型的几何结构归纳
随着电网发展对输电走廊和运行成本要求的提高,多端混合高压直流输电系统由于兼具常规直流大功率、成本低与柔性直流传输灵活、无换相失败的优势,已然成为科研领域着重发展的高精尖方向。然而,由于多端混合高压直流输电系统中换流站与控制器数量众多,导致控制参数优化与控制策略配置变得愈发复杂。而合适的控制参数与控制策略选取直接决定着直流系统的稳定、高效和可靠运行。为此,本文围绕多端混合高压直流输电系统控制参数及控
当今社会老龄化问题日益严重,社区作为城市居民生活的主要场所,是为老年人创造宜居生活环境的重要载体,因此推进社区适老化建设已成为基本内容。自80年代中期提出“社区服务”以来,社区养老设施不足、配套设施布局分散的弊端日益凸显;集中式的新型社区中心尚在起步探索阶段,已建成的案例多出现养老功能配置不当、设施空间环境缺乏适老设计等问题。因此本文选取广州和深圳的五个典型社区中心为研究对象,聚焦建筑适老性设计目
第一部分耐利妥昔单抗弥漫大B细胞淋巴瘤细胞株建立和特征分析目的 弥漫大B细胞淋巴瘤患者发生耐药及复发是治疗失败的主要原因,故诱导人弥漫大B细胞淋巴瘤耐利妥昔单抗的耐药细胞株,为寻找与耐药相关的靶分子和探索克服耐药的研究奠定基础。方法 本部分研究采用利妥昔单抗大剂量间断冲击结合梯度递增药物浓度的方法培养建立人弥漫大B细胞淋巴瘤耐利妥昔单抗的耐药细胞株(SU-DHL-6-R和NU-DUL-1-R)。采
随着攻坚脱贫工程的全面实现和乡村振兴战略的逐步实施,我国农村建设发展进入了一个新时期。淘宝、京东、拼多多等电商企业响应国家号召,积极主动接轨乡村,帮助乡村推广销售生鲜农产品,致力农民脱贫致富,探索生鲜农产品供应链的现代化模式,推动农业现代化改革。地方政府也积极投入当地特色生鲜农产品的研发培育和推广,致力于打造有品质有保证有口碑的生鲜农产品品牌,从而实现当地农业的稳定可持续发展。在生鲜农产品品牌如雨
豆腐乳清是豆腐生产过程中产生的“废水”,因其富含蛋白质、异黄酮、低聚糖、皂苷等营养成分,直接排放极易引起腐败菌的滋生,从而对环境易造成极大的污染。因此如何有效利用豆腐乳清是许多学者关注的问题。本论文在前期研究的基础上首先对豆腐乳清的营养成分和生物活性成分进行初探,进一步对发酵豆腐乳清的抗光老和抗皮肤炎效果进行研究,为其有效应用提供理论依据。主要结果如下:(1)使用前期从发酵豆腐乳清分离的乳酸菌对3
地聚物是一种有潜力的水泥替代品,具有不亚于水泥的力学性能,且绿色环保。地聚物的生产一般是采用碱性溶液激发硅铝质前体材料,由于碱性溶液在储存和运输方面的不便限制了地聚物的大规模工程应用。若能使用固体碱激发剂代替液体激发剂溶液,提前将干粉状的碱性激发剂与前体材料混合,现场只需加水搅拌,即可配制形成地聚物,则能极大提高地聚物混凝土的施工方便性。目前鲜有人比较干粉激发与液体激发地聚物的反应机理及由此带来的
随着风力发电技术的发展,能源危机得到了缓解,但其出力的随机波动性会影响电网的稳定运行,要求系统必须具有足够的灵活性调节资源来平衡其随机波动。同时,在其他因素如环境污染和电力体制改革等的影响下,机组发电计划的制定要考虑除了运行费用外的多个目标。因此需要建立一个含风电的电力系统高维多目标安全约束机组组合(security constrained unit commitment,SCUC)模型,并提出一
质子交换膜燃料电池(PEMFCs)是氢燃料电池车(FCEV)的首选动力电源,以其特有的高效率和环保性等优点引起了广泛的关注。然而,富氢燃料气中少量的CO会造成PEMFC的Pt电极不可逆毒化。CO选择性甲烷化法因其具有工艺简单、产物无毒副作用、无须添加反应物等优点,成为了深度清除富氢气体中少量CO的有效技术手段。其关键在于研制一种高活性、高选择性、高稳定性的CO选择性甲烷化催化剂。本文成功在氧化石墨
糖基化改性是一种有效的无化学试剂参与的蛋白质化学改性方法,通过这种方式,蛋白质的溶解性、乳化特性和凝胶特性可能会得到增强。但由于多糖分子中数量有限的醛基和糖链产生的空间屏蔽效应不利于反应的进行,传统的蛋白质糖基化改性往往需要6-72 h才能获得令人满意的效果。本课题针对糖基化反应速率慢和效率低的问题,首先对葡聚糖进行不同程度的氧化处理,以获得更多的醛基,对不同氧化度的葡聚糖醛与酪蛋白酸钠的反应产物