面向跨媒体检索的索引技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:yuan6391
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨媒体信息检索技术是指在现有的基于内容的多媒体信息检索基础上,建立不同类型媒体之间的关联关系,在检索结果中可以返回和检索请求媒体类型不同的媒体对象。在跨媒体检索系统中需要处理海量的高维媒体特征,为了提高检索效率,需要研究和开发高效的索引技术来管理特征数据。   在高维索引中,“维度灾害”会严重影响索引的效率。跨媒体信息检索中,媒体的特征维度通常都比较高,所以必须进行降维处理,才能保证检索的效率。跨媒体检索中需要根据媒体特征的相似度来返回检索结果,是一种近似匹配,它与传统的面向精确匹配的高维索引技术不同,如何让高维索引技术支持跨媒体检索一直是信息检索领域研究的热点问题。针对上述问题,本文在充分分析现有研究技术的基础上,提出依据跨媒体检索中的语义概念进行局部降维处理的方法,在较小的特征空间信息损失的情况下,降低“维度灾害”的负面影响;提出在特征降维的基础上,根据特征相似度进行R树的节点分裂和查询算法,提高媒体特征相似度查询的效率。本文围绕这一思路做了如下几点工作:   (1)在分析了基于Ontology的跨媒体检索技术的基础上,有针对性地设计了一种两级索引技术,支持高效的跨媒体检索处理。该索引结构中的第一级索引管理Ontology中的语义概念所对应的特征信息;第二级索引管理语义概念下的单个媒体的特征信息。两级索引结构相互配合,完成查询媒体的跨媒体检索和相似度排序。   (2)在跨媒体检索中,媒体的检索特征都具有较高的维度,所以降维处理是媒体特征索引前的重要环节。本文提出了一种基于语义概念的局部降维技术方案。该方案利用相同语义概念下的媒体,其特征通常具有很好的相关性这一特点,获得了很好的降维处理效果。   (3)在R树索引结构的基础上,提出了一种适用于跨媒体检索相似度查询的快速索引方案。该方案基于媒体特征向量的相似度进行R树结构中节点的分裂处理,并基于媒体特征的欧式距离实现快速查询。该方案在保持R树索引结构的高效性基础上,还能支持媒体检索的相似度排序。   基于关键技术研究成果,本文设计实现了一个基于多媒体Ontology的跨媒体检索原型系统。实验结果表明本文的索引技术在跨媒体检索系统上有很好的应用效果。  
其他文献
WWW技术的迅猛发展为企业和组织提供了良好的契机,同时也产生了大量的Web点击流数据。对Web服务器上的点击流数据进行有效的分析和挖掘能够发现大量潜在有用的信息,能够帮助管
随着智能手机的普及以及微信、微博等社交媒体的迅速发展,图像已经越来越广泛地融入到人们的日常生活当中。一图胜千言,图像在为人们的生活、教育和商业带来便利的同时,也为视觉
博客作为一种个人发布工具,逐渐成为信息时代不可或缺的资源,随着社会网络的高速发展和社会化软件的普及,互联网正逐步跨入社区时代,博客吸引了越来越多的人的目光,数以百万
数据挖掘是目前信息科学领域最前沿的研究课题之一。应用数据挖掘技术可以发现一些隐藏在大量数据背后的、潜在的有用信息来预测事物的发展趋势,这些信息极大提高了决策支持的
图像分割技术的研究虽然有很长的历史,但一直以来都是医学图像处理领域的一个研究热点.尽管现有的图像分割方法多种多样,而且新的图像分割算法层出不穷,但由于人体解剖结构的
时钟扭斜规划(clock skew scheduling)是同步时序电路的一种优化手段。它通过控制时钟信号到达不同触发器的传播时间,实现提升芯片工作频率的目的。长期以来,它一直在全定制设计
学位
随着经济的发展,交通运输问题越来越突出,迫切要求采用现代化的管理方法来实现交通管理,这样就引发了对智能交通系统(ITS)的研究。车辆辅助驾驶是智能交通系统的重要组成部分
计划评审技术(Program Evaluation and Review Technique,PERT)是在一个给定的项目中对潜在任务进行分析的一种方法。其建立的目的是为了简化大而复杂的项目的计划,合理分配任
随着计算机与通讯技术的迅速发展,人们对信息的需求变的越来越高,信息的容量也越来越大,海量的信息对信息管理系统的性能提出了挑战。为了解决信息管理系统过载问题,有些学者
在大型回转窑氧化铝生产过程中,回转窑内部烧结工况往往受到各种条件变化及不当操作等因素的影响而造成系统的不稳定,导致系统性能降低和氧化铝产品质量降低。在我国的大型回