论文部分内容阅读
在计算机视觉和机器学习中,我们研究的对象(三维模型,图像,文档)常常可以被认为是由一些不同的成分或部分所构成的整体。在分类或者基于内容的信息检索等问题中,这样的对象可以用所谓成分数据(和为常数的正实数向量,即单纯形上的点)来表示。从概率的观点来看,成分数据可以理解为是一组互补且互斥事件的概率。这样,成分数据的表示形式有非常广阔的应用背景。本文研究了面向成分数据的几个基本的机器学习问题,包括降维,度量学习,以及多示例学习中的核方法。
本文的贡献主要包括以下几个方面:
1.成分数据所特有的单纯形约束及其相关的统计特性对传统的降维问题提出了新的挑战。本文提出了一种针对成分数据的降维(特征抽取)方法,该方法利用了单纯形到自身的线性变换族和单纯形上的狄利克雷分布的特性。
2.成分数据中的变量直接对应于对象的成分或部分,这些成分或部分之间常常有不可忽略的语义关系。本文提出了一种无监督的度量学习方法,该方法发掘并利用这些关系为成分数据定义了一个更合理的距离度量。这个距离度量可以用于分类,聚类,和信息检索等算法中。
3.三维模型,图像,文档的分类问题也可以被抽象为多示例学习的问题,即单个待分类对象可以看作一些示例或特征的包。这些包的类别是由其内的示例的类别按照特定的规则决定。我们利用成分数据来表示包中各种示例所占的比例,并提出一个针对成分数据的核方法[26],它可以自动区分并适应不同的多示例学习问题中的“包类别产生机制”。该方法给出了一个“广义多示例学习”的新框架。
本文所提出的一系列方法在理论和应用上都有一定的价值。其中面向成分数据的非监督度量学习和降维方法分别利用了单纯形上的狄利克雷分布族的两方面特性,在将来的工作中有望建立一个统一的理论框架。另外,本文提出的“广义多示例学习”是对传统多示例学习概念的自然理论拓展,可以作为后续研究工作的基础。