论文部分内容阅读
视频已经成为人类获取信息的主要的来源。视频所包含的信息量很大,人们采用视频压缩技术来解决巨大的数据吞吐量和有限的传输带宽之间的矛盾。视频压缩技术的关键在于减少视频的冗余,即视频的空间冗余和时间冗余。运动估计和运动补偿(ME+MC)编码是减少视频时间冗余的最好方法。基于块的运动估计和补偿是国际视频压缩标准中最通用的算法。。块匹配法有其局限性,只能应用到刚性物体做理想的平移运动这种情况,没有考虑物体的非刚性运动以及环境照明变化和运动遮挡等多种情况。
为了解决ME+MC的不足之处,本文提出一种新的背景估计的模式识别方法,并将其应用到背景不断变化的化工厂Chemical Plant视频编码。模式识别是采自组织特征映射网络(Self-organizing feature Map,SOM)算法实现。
由于背景变化可以看成是背景运动,背景运动有很多种,有平移的刚性运动,也有旋转等非刚性运动,化工厂Chemical Plant视频的背景运动是由摄像机的平移运动引起的,因此可以看成刚性运动,可以采用(ME+MC)的算法对其进行压缩传输。同时也可以采用背景估计的模式识别算法对其进行压缩传输。
本文的安排如下,首先分析视频编码中运动估计的局限性,详细地介绍块匹配法,因为它是国际标准中常用的,随后介绍块匹配法的几种快速搜索算法。
其次,本文要详细研究背景估计的模式识别算法。视频模式库的训练和模式识别是模式识别方法的两个阶段。模式库的训练是为了建立最佳模式库,在这个阶段采用SOM算法对大量的视频序列进行学习训练。模式识别就是将输入视频图像块与模式库中的模式进行匹配,找出最匹配的模式并将其选为运动模式。
最后,本文将上述两种方法同时应用到化工厂Chemical Plant视频序列当中,实验表明,背景估计的模式识别算法比运动估计和运动补偿(ME+MC)算法有更好的预测编码性能,重建视频图像的质量也更好。