论文部分内容阅读
随着互联网的快速发展以及各种数字化设备的普及,现代社会中多媒体信息的数量在迅猛增长,多媒体信息管理的研究得到越来越多的关注。图像数据库系统在多媒体信息管理的研究中占有特别重要的地位,图像不仅是视频的基础,而且图像数据库技术可以直接应用于:数字图书馆、数字博物馆,医学、地理图像数据库,公共安全以及国防等多个领域。 图像数据库检索的研究可以分为两个阶段。随着图像数据规模越来越大,上个世纪70代出现的以人工标注为基础的图像数据库检索系统,已难以满足应用的需要。90年代出现的基于内容的图像数据库检索系统,由于采用图像处理、计算机视觉等技术实现了图像视觉特征的自动提取,使得大规模图像数据库系统的应用更具现实性。 目前,基于内容的图像数据库检索已成为图像数据库研究的主流,其核心是基于内容的图像相似性检索。基于内容的图像检索遇到的主要问题是检索的准确性需要进一步提高,即如何改善检索效果是基于内容图像数据库检索研究中的首要问题。 为了改善图像数据库检索的效果,本文对基于长期学习策略的用户相关反馈以及用户模型和反馈记录的分析效率等图像检索中的关键性问题进行了探索和研究。针对存在的问题,提出基于长期学习策略的图像检索框架,并在此基础上从用户模型,用户反馈模式,反馈日志的利用效率方面提出多个具有较好性能的图像检索方法,并且对传统图像检索中检索目标分布的问题进行了讨论,给出了新的检索方法。 本文主要研究内容如下: ■ 基于长期学习策略的图像检索框架 为了克服传统长期学习方法难以满足检索中图像语义的灵活性以及用户检索的个性化要求的缺点,本文引入用户协同过滤方法对用户反馈记录日志进行在线分析,并在此基础上给出一个基于用户反馈日志分析的图像检索相关反馈框架。本文根据该检索框架实现了一个图像检索原型系统,并与传统图像检索相关反馈方法进行了对比实验。实验显示基于本文框架的图像检索方法的检索效果明显优于传统的反馈方法。 ■ 基于用户反馈序列模式分析的图像检索方法 本文对交互式图像检索中的用户模型问题进行讨论,给出一个结合长期学习策略的用户模型,并提出用户检索的反馈模式概念。在此基础上提出了一个基于用户反馈序列分析的图像检索方法,该方法把用户在检索中所进行的反馈操作序列(用反馈例编号表目录示)作为用户的反馈模式记录入数据库中,进行新的检索时使用协同过滤方法对用户反馈的序列模式进行分析,进而有针对性地对数据库中的图像与当前检索的语义相关性进行预测以改善检索效果。对反馈历史数据的概念聚类以及采用信息过滤的图像检索方法针对图像检索中单纯利用用户反馈信息的长期学习方法存在的一些问题,本文给出一个结合检索样本图像特征和用户相关评价两方面内容的反馈记录分析方法(称为信息过滤),并且根据用户的评价信息对反馈记录中检索样本图像进行半指导的模糊聚类(semi一suPervision Fuzzy Clustering)以提高反馈一记录的分析效率。基于多聚类中心的图像检索方法传统图像检索方法通过用户给出的相关反馈图像来寻求唯一的全局最优检索点与权重。由于图像内在的复杂性,唯一的全局检索点通常难以准确覆盖用户的检索目标,使得反馈对检索效果的改进表现出不稳定性。为解决这一问题,本文使用模糊聚类的方法对反馈图像集进行分析,并在此基础上给出了一个基于反馈图像的多聚类中心的相关反馈方法。