多示例学习的研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:LIUANQING5201314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多示例学习起源于对药物活性预测问题的研究,由于其具有独特的性质和广泛的适用性,目前被认为是与监督学习、非监督学习以及强化学习并列的一种新型机器学习框架。本文针对多示例学习领域有待解决的问题,做了三方面的工作。 首先,本文通过定义特殊的全局误差函数,提出了基于神经网络的多示例分类算法BP-MIP和基于神经网络的多示例回归算法BP-MIR。在此基础上,本文将属性选择机制引入多示例神经网络中,显著提高了BP-MIP算法的学习能力。此外,本文利用神经网络集成技术,分别构造了BP-MIP集成和BP-MIR集成,取得了比单个多示例神经网络更强的泛化能力。 另一方面,本文提出了一种监督学习算法向多示例学习算法转化的一般性准则,即将监督学习算法的注意焦点从对示例的区分转化为对包的区分。在此基础上,考虑到集成学习技术和混合学习技术可以有效地提高监督学习算法的泛化能力,本文将集成学习技术和混合学习技术引入了多示例学习领域。实验结果表明,基于集成学习技术和混合学习技术,均能产生泛化能力更强的多示例学习算法。 此外,本文还对基于多示例学习的CBIR技术进行了研究,提出了一种新颖的图像包生成方法ImaBag。实验结果表明,ImaBag方法可以产生语义保持较好的多示例包,取得了与其他图像包生成方法相当的实验效果。在此基础上,本文设计并实现了一个基于多示例学习技术的图像检索原型系统MillR。
其他文献
本文探讨了社保行业数据仓库建设的必要性和可行性,社会保险是我国信息化建设较为成熟的一个领域,经过十几年持续的建设,已基本形成了稳定的应用并积累了海量的数据,这就使建设以
随着软件系统愈来愈复杂,软件设计的核心已从"算法+数据结构"转向对系统总体结构的设计和规范,亦即软件体系结构这一层次上的设计.体系结构是软件系统的高层抽象,用于描述整
扩展标记语言(XML)是一种元标记语言。就像在广域网协会(World Wide Web Consoctium,W3C)的XML 1.0规范中所说明的,XML可以让用户定义自己的标记语言,从而可以在XML文档中描述
随着经济全球化和知识经济时代的到来,企业之间的竞争日益激烈,在这种情况下,企业如何提高自己的产品质量,降低质量成本,增加客户的满意度日益成为企业管理的重要内容.在质量
UML是一种在工业界得到广泛应用的系统建模语言.然而由于缺乏形式化的语义而限制了它向更广泛的应用领域发展.形式化语言虽以其精确语义著称,却无法从现实世界中直接获取模型
随着社会的发展,信息显得越来越重要,而信息安全则是社会广泛关注的问题,密码技术是实现信息安全的核心技术之一,它被广泛的用在军事、政治、商业、金融等领域,现在,越来越多的人用
该文首先介绍了移动IPv6和切换相关协议和技术,然后以平滑切换为切入点,通过分析移动环境下实时传输的要求,提出移动IPv6平滑切换需要解决的问题.针对这些问题,该文研究和设
移动Ad hoc网络是一种由无线移动主机/节点组成的动态自治网络,具有不需要使用固定基础设施的特性.可以用于没有无线设施存在或出于费用和安全方面的考虑不方便设置无线设施
进入二十一世纪以来,信息技术以更加迅猛的速度飞速的向前发展,软件产品在社会各个领域的应用也越来越广泛,软件产品的质量自然成为人们共同关注的焦点。不论软件的生产者还是软
基于内容的图像检索技术(CBIR),是计算机视觉领域的一个研究热点。传统的基于内容的图像检索方法,提取图像的颜色、形状和纹理等底层特征来建立索引,并进行图像检索。但是,这种基于