论文部分内容阅读
互联网的快速发展为用户提供了大量的图像资源,如何从海量的图像资源中获取自己感兴趣的图像成为急需解决的问题。基于内容的图像检索技术是解决上述问题的有效手段,与传统的基于文本的图像检索不同,基于内容的图像检索直接分析图像的视觉特征,在图像库中检索返回视觉特征相似的图像,更加直观和有效。本文获得如下研究成果: 1)鉴于主流二进制描述子仅基于灰度值比较,易受噪声影响,鲁棒性低,本文提出利用灰度值、灰度变化率等像素属性,并利用基于学习的属性选择算法选择描述能力较强的属性,进而生成一种基于多维属性的二进制描述子MBF。实验表明,MBF的描述能力相比传统二进制描述子提高10%,计算速度相比实值描述子提高近2个数量级。 2)传统的海明距离匹配效率低,不适合应用于大规模图像检索。本文提出一种面向二进制特征的分级匹配算法,其包括基于倒排索引的二进制索引(提高匹配速度)和辅助特征校验(提升检索准确率)两部分。相比传统海明距离匹配,本文提出的分级匹配算法匹配速度提升3个数量级,召回率提升3.5%,准确率提升3%。 3)为了解决大规模图像库特征数量多、占用空间大、检索缓慢问题,本文提出一种鲁棒特征筛选方法,在保证准确率基本不变,召回率小幅度下降的情况下,特征数量减少80%,检索速度则提升5倍。最后结合MBF、分级匹配算法和特征筛选方法,构建了一个大规模的图像检索系统,通过采用GPU的特征提取技术,在百万级图像库上,召回率82.6%,准确率为98.0%的情况下,平均单幅图像的特征提取和匹配耗时约23ms,达到了实时检索分析的要求。