半监督的聚类和降维研究及应用

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:zhenlic0300
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半监督学习是近年来机器学习领域的一大研究热点。与传统的监督学习和无监督学习相比,半监督学习能同时利用有标号和无标号样本来学习,从而获得更好的性能。目前,国际上有关半监督学习的研究可大致分为两类,即半监督分类和半监督聚类。其中,相对于前者,后者在理论和算法研究上都还尚不够成熟。本文首先对半监督聚类进行研究,在原有的一些模糊核聚类算法基础之上,提出了一系列半监督模糊核聚类算法。随后,把半监督学习的思想引入降维,对半监督降维加以研究。最后,把本文提出的算法分别应用于图像分割和图像检索,并实现了一个图像检索原型系统。本文主要的创新与研究工作总结如下:1.在先前提出的鲁棒联机聚类算法(ROC)的基础上,通过引入以样本类标号形式给出的监督信息,提出了一种半监督的鲁棒联机聚类算法(Semi-ROC),在人工数据集和国际标准数据集上的实验验证了算法的有效性。2.提出了两种模糊核聚类算法SKFCM和SKPCM,并分别在国际标准数据集和人工数据集上进行了实验验证。同时将SKFCM算法应用于半监督的图像分割,取得了较好的结果。3.在先前工作基础之上,对半监督降维技术在图像检索上的应用进行了较为深入的研究,并在国际标准数据集上验证了半监督降维算法的有效性。基于上述研究工作,我们利用VC++6.0开发工具构建了一个基于内容的图像检索原型系统。该原型系统主要包括实时图像检索以及信息存储等部分,为后续理论和算法研究提供了一个真实的实验平台。
其他文献
通用处理器是关系到国家命运的战略产业,其发展直接关系到国家的安全和技术创新能力,是国家的核心利益所在。中科院计算所从2001年开始研制龙芯系列处理器,经过十多年的积累
Internet作为一个典型的复杂网络实例,其拓扑结构的分析及建模是当前的研究热点。目前相关的研究工作主要集中在拓扑统计特性的分析上,并且当前的拓扑模型大多是基于“现象”的
挂马网页是最近几年非常流行的一种恶意代码分发的形式,其对于互联网的用户和企业等造成的威胁和影响也是日益严重,而新近出现的智能挂马网页更是给信息安全研究带来的新的挑
液晶屏多媒体播放机已成为广告业中一种新的业务模式,在一些楼宇、商场、超市里等都可以见到。从目前情况来看,大多传媒公司这种室内液晶屏多媒体广告播放机采取的是单机循环播
随着嵌入式系统的广泛应用,嵌入式浏览器随之备受关注,也成为一个研究热点,开发和研究浏览器的公司也如雨后春笋般纷纷涌现。然而,嵌入式浏览器开发涉及到一个广泛的技术标准集合
目标识别和图像拼接是计算视觉中二个重要课题,在军事、医学、宽视角的高分辨率图像拼接、航空图像处理等多方面均有广泛应用。基于特征点的目标识别和图像拼接具有直观、匹配
随着WLAN应用的不断深入,在给人们的生活带来极大方便的同时其安全方面的问题也愈来愈突出,已经成为一个研究的热点。本文针对无线局域网安全接入方面的问题进行了研究分析,
随着Internet的广泛应用而兴起的网络IP电话,正以其资费低廉,维护成本低而受到越来越多的人们的关注。会话初始化协议SIP正是在此基础上应运而生的,它是一个基于网络的用来建
移动对象数据库主要用于处理随时间连续变化的对象,其核心内容为移动对象存储结构和拓扑分析操作。交通网移动对象数据库是在空间数据库、时空数据库基础上研究在特定环境中
Web Services是一个支持计算机在网络上交互的软件技术框架,现有的大部分工作集中在Web Services的开发和接口的实现上,而QoS在Web Services中的支持,仍然是一个正在发展的研