论文部分内容阅读
在效率优先的今天,人们对于信息检索的要求越来越高,从海量文件中以最高效、快速的方式实现有用资源的查找定位显得极为重要。因此,基于内容和语义的视频检索技术应运而生,并逐渐成为多媒体研究领域的热点之一,而实现这一技术的首要前提是视频对象的分割提取。针对这个课题,本文进行了有益的探索和研究。
鉴于视频文件的压缩存储特性和视频检索的高效快速要求,本文直接以压缩码流信息作为问题分析的突破口,以应用广泛的MPEG-2视频文件为处理对象,研究了MPEG运动目标的提取。选择压缩域分析的优势在于数据处理量显著降低,同时可以节约完全解码的时间,提高对象分割的速度,进而有效地改善视频检索的实时性能。在文中,首先介绍了运动对象提取和视频编码技术的基本知识,接着分类综述了常见的MPEG压缩域运动对象提取算法,并对它们的性能进行了分析比较。然后在此基础上提出了两个算法:基于运动相关性聚类的提取算法和基于分水岭的时空联合算法,分别进行了实验仿真,验证了算法的有效性。最后,总结论文所做工作同时针对进一步的研究进行了相关展望。
基于运动相关性聚类的提取算法以宏块的运动矢量为主、DCT残差系数为辅完成了运动目标的分割,其理论依据是相同对象宏块的运动矢量具有相关性。该算法在全局运动补偿的基础上运用四阶矩检测器进行初步的运动检测,然后根据运动幅度和运动角度的相关性测度进行相似宏块的聚类处理,最后通过DCT残差系数对聚类结果进行多尺度修正。实验表明,该方法运算量小复杂度低,能够以实时的速度实现运动对象的宏块级提取。
基于分水岭的时空联合提取算法充分利用时域的运动信息和空域的灰度联系进行分割提取,是一种典型的时空域联合方法。该算法首先分别进行时间域的运动检测和空间域的分水岭分割,而后采用时空投影的方式完成融合处理,提取出最终的运动对象。算法的最大特点是在空域处理时针对重建的DC图像应用了经典的分水岭变换进行区域分割。实验结果显示,该方法简单有效,具备较好的提取效果和实时性能。
综合来看,两种算法的特点是立足于压缩域信息,以较快的分割速率实现运动目标的块级提取,适用于对边缘精度要求相对不高的快速检索场合,抑或是作为精确分割的前端步骤,为后续细化处理缩小范围,从而有助于从整体上改善实时性能,提高检索效率。