论文部分内容阅读
视觉显著性机制是人眼视觉系统的重要组成部分,指人在面对复杂场景时,会将注意力快速集中在少数感兴趣的区域,然后利用有限的处理能力对该区域进行优先处理。传统的基于局部特征的物体检测方法是先对图像采窗,再提取特征,最后用分类器判别。这种方法由于需要对图像进行大量地采窗,并对每个窗分别进行特征提取和分类操作,计算量非常大。若将视觉显著性机制应用到物体检测中,能够快速地提取与目标相关的显著区域,对图像中的显著区域和非显著区域进行不同的处理,可以减少背景对物体检测的干扰,将有限的计算资源用于处理感兴趣区域,提高物体检测的效率和准确率。本文研究了将视觉显著性机制应用到物体检测中的方法,提出了一种基于图像分类框架的自顶向下的视觉显著性计算模型,学习了目标物体和背景噪声的信息,能在提取目标物体的同时抑制背景噪声。该模型包括特征提取、特征编码、局部特征合并和显著性检测四个步骤。实验结果表明,与已有的显著性检测模型相比,该模型能有效地检测出与目标相关的显著区域,并同时抑制与目标物体无关的非显著区域。文章在上述模型的基础上,提出了基于尺度选择的特征合并算法。由于不同尺度的特征合并对显著性检测的结果有着重要的影响,该算法从多个尺度中选择出一个最优尺度来对图像的局部特征进行表示。实验结果表明,与其它尺度相比,最优尺度上的特征合并能明显提升显著性检测的结果。而与其它显著性模型相比,本文模型在KLD和P-R曲线两项评价标准的结果都是最优的,在最优尺度上的平均KLD值更小,表明该模型的显著性检测结果更接近于真实标注。同时,其P-R曲线表现出能同时具有较高的检测率和精确度,说明本文模型更适合应用于物体检测中。