论文部分内容阅读
当前成像技术的快速发展,使数码相机、可拍照手机等设备日益普及,各种各样的图像数量飞速增长。同时,互联网的诞生与快速发展极大地促进了人们之间的信息交流,也使图像传播变得更加快捷。越来越丰富的图像资源使用户难以在浩如烟海的数据中找到其真正需要的信息,因此,对网络信息进行有效的管理与检索成为迫切需要解决的问题。
在图像检索过程中,用户关心的是在概念层次上图像的内容,即图像所表达的语义内容,但是,限于目前计算机对图像理解的技术水平,直接从图像的像素数据或低层视觉特征推理出图像的高层语义还十分困难。于是,当前的一些研究工作就着手从其他途径建立底层特征与高层语义之间的联系,从而帮助计算机从语义上理解图像。本文将主要从两方面对该问题进行探讨:其一,如何通过机器学习和数据挖掘的方法尽可能的建立起高层语义与底层特征之间的中间桥梁,这里可借助的信息包括大规模的网络资源和小规模但高质量的已标注图像集合;其二,为了绕过图像理解技术的局限,在检索过程中引入人的参与,即通过有效地相关反馈技术使检索用户提供对检索系统的指导,让系统通过用户的反馈信息逐渐领会他们的查询意图,从而有效的提高检索性能。
本文主要针对图像检索系统中的自动图像标注,相关反馈以及网络图像的语义挖掘等关键技术进行了深入的研究,主要成果和创新之处包括以下几个方面:
·讨论并分析了自动图像标注问题,提出了一种统一的基于图学习的图像标注框架,并采用该框架模型对大多数传统的图像标注工作进行了合理的解释。在这个框架下,图像标注过程被分为两个阶段来完成,即基本图像标注与图像标注改善,其中基本图像标注阶段是通过以图像间相似性关系为依据的图学习过程来实现的,而在基本标注结果基础上的标注改善是通过以词汇间语义关联关系为依据的图学习过程来实现的。
·在基于图学习的图像标注框架下,提出了所涉及到的各子问题的解决方法,它们是基于最近邻生成链(Nearest Spanning Chain,NSC)的方法来实现图像间相似关系的估计,分别基于统计特性与网络检索技术的标注词汇之间的相关关系的估计,并将它们综合起来有效地实现了图像的自动标注。
·提出了一个与传统相关概率模型相对偶的跨媒体相关模型来解决图像的自动标注。这一模型有效地将图像检索技术、网络搜索技术融入到图像标注任务中,克服了传统方法对训练数据的依赖,并从一定程度上缓解了“语义鸿沟”的障碍以及由巨大的图像规模所带来的推广性问题等。
·提出了一种基于图学习方法的多层次的相关反馈模型,它从用户检索习惯出发,引入了三种反馈方式:前进式、后退式与重启式的反馈,以此作为隐式的反馈信息,而用户的相关性判断则作为显式的反馈信息。系统将综合这两类反馈信息来改善查询表示,并调整检索过程中的距离度量,然后在基于图学习的框架下将各种信息融合在一起,进而给出符合用户要求的检索结果。
·设计了一套借助网络搜索引擎来完成基于语义的图像挖掘方案。它可以自动地获取与特定语义概念相关的网络图像,并且具有较好的可扩展性,能够通过完全自动的重复操作收集到大规模的语义相关图像集。