论文部分内容阅读
近年来,主动学习已成为模式识别领域的研究热点问题。主动学习就是要挑选出最具有信息的数据样本来进行标注,通过反复迭代提高分类器的性能。然而先前的方法仅仅是考虑了数据样本空间的全局结构,忽略了局部流形结构。本文主要是提出了一种新颖的主动学习算法,这种方法考虑了数据空间的局部结构。也即为,每个数据样本可以用它的邻居线性表出。给定每个样本数据的局部线性重构系数,这种方法我们叫做基于局部线性重构关系的主动学习方法。局部线性重构通过把局部线性重构系数引入到主动学习中,能够很好解决将流形结构引入主动学习的问题。本文对基于局部线性重构系数的主动学习进行了深入的研究与改进,具体内容包括以下几个方面:1、综述了主动学习的概念以及几种经典的主动学习算法;2、在流形适应性实验设计方法的基础上引入局部线性重构系数,提出流形图模型方法并给出算法具体步骤;3、通过在基准图像数据库和文本数据库进行大量的实验,同时与以前经典的算法相比较,结果表明我们提出的算法取得了更好的分类效果。