论文部分内容阅读
跨媒体信息检索技术是指在现有的基于内容的多媒体信息检索基础上,建立不同类型媒体之间的关联关系,在检索结果中可以返回和检索请求媒体类型不同的媒体对象。在跨媒体检索系统中需要处理海量的高维媒体特征,为了提高检索效率,需要研究和开发高效的索引技术来管理特征数据。
在高维索引中,“维度灾害”会严重影响索引的效率。跨媒体信息检索中,媒体的特征维度通常都比较高,所以必须进行降维处理,才能保证检索的效率。跨媒体检索中需要根据媒体特征的相似度来返回检索结果,是一种近似匹配,它与传统的面向精确匹配的高维索引技术不同,如何让高维索引技术支持跨媒体检索一直是信息检索领域研究的热点问题。针对上述问题,本文在充分分析现有研究技术的基础上,提出依据跨媒体检索中的语义概念进行局部降维处理的方法,在较小的特征空间信息损失的情况下,降低“维度灾害”的负面影响;提出在特征降维的基础上,根据特征相似度进行R树的节点分裂和查询算法,提高媒体特征相似度查询的效率。本文围绕这一思路做了如下几点工作:
(1)在分析了基于Ontology的跨媒体检索技术的基础上,有针对性地设计了一种两级索引技术,支持高效的跨媒体检索处理。该索引结构中的第一级索引管理Ontology中的语义概念所对应的特征信息;第二级索引管理语义概念下的单个媒体的特征信息。两级索引结构相互配合,完成查询媒体的跨媒体检索和相似度排序。
(2)在跨媒体检索中,媒体的检索特征都具有较高的维度,所以降维处理是媒体特征索引前的重要环节。本文提出了一种基于语义概念的局部降维技术方案。该方案利用相同语义概念下的媒体,其特征通常具有很好的相关性这一特点,获得了很好的降维处理效果。
(3)在R树索引结构的基础上,提出了一种适用于跨媒体检索相似度查询的快速索引方案。该方案基于媒体特征向量的相似度进行R树结构中节点的分裂处理,并基于媒体特征的欧式距离实现快速查询。该方案在保持R树索引结构的高效性基础上,还能支持媒体检索的相似度排序。
基于关键技术研究成果,本文设计实现了一个基于多媒体Ontology的跨媒体检索原型系统。实验结果表明本文的索引技术在跨媒体检索系统上有很好的应用效果。