论文部分内容阅读
多示例学习起源于对药物活性预测问题的研究,由于其具有独特的性质和广泛的适用性,目前被认为是与监督学习、非监督学习以及强化学习并列的一种新型机器学习框架。本文针对多示例学习领域有待解决的问题,做了三方面的工作。
首先,本文通过定义特殊的全局误差函数,提出了基于神经网络的多示例分类算法BP-MIP和基于神经网络的多示例回归算法BP-MIR。在此基础上,本文将属性选择机制引入多示例神经网络中,显著提高了BP-MIP算法的学习能力。此外,本文利用神经网络集成技术,分别构造了BP-MIP集成和BP-MIR集成,取得了比单个多示例神经网络更强的泛化能力。
另一方面,本文提出了一种监督学习算法向多示例学习算法转化的一般性准则,即将监督学习算法的注意焦点从对示例的区分转化为对包的区分。在此基础上,考虑到集成学习技术和混合学习技术可以有效地提高监督学习算法的泛化能力,本文将集成学习技术和混合学习技术引入了多示例学习领域。实验结果表明,基于集成学习技术和混合学习技术,均能产生泛化能力更强的多示例学习算法。
此外,本文还对基于多示例学习的CBIR技术进行了研究,提出了一种新颖的图像包生成方法ImaBag。实验结果表明,ImaBag方法可以产生语义保持较好的多示例包,取得了与其他图像包生成方法相当的实验效果。在此基础上,本文设计并实现了一个基于多示例学习技术的图像检索原型系统MillR。