论文部分内容阅读
自从ITU-T提出第一代视频图像的压缩标准H.261以来,经过十多年的发展,视频的压缩技术目前已经广泛应用于移动通信、视频会议、数字电视等诸多领域。为了获得更高的图像信噪比及更高的图像压缩比,ITU-T与ISO/IEC联合推出了最新的H.264标准,标准在保持原有框架的基础上引入了若干的细节改进:如宏块(MicroBlock)的多模式选择、1/4像素的引入、帧内预测的引入、DCT变换整数化等。
这些新技术的引入大大提高了算法对硬件的要求,其中运动评估(ME)尤甚。运动评估本来就是整个算法中运算量最大的部分,而多模式选择以及1/4象素预测均是针对运动评估进行的改进,所以要实现H.264的工程化,最重要工作就是研究运动评估的特点,减小运动评估部分的运算量使之适于硬件实现。
文中提出了一个基于硬件的运动评估模块的完整的高性能解决方案。实现过程分成五个主要部分:首先,文中研究了运动评估中各组成部分的运算量,并以此为依据制定了算法宏块级的流水线;其次,研究了EPZS算法在硬件中实现的可能性,并优化选择了算法的预测点以及模板,更为重要的是确定了片上并行内存的结构;再次,针对H.264中各模式间相关度很高的特点,将各模式分成大尺寸及小尺寸两组,设计了一种高性能的分裂一合并算法;然后,算法沿用模式的大尺寸及小尺寸分组,提出了一种多参考帧的解决方案;最后,文中分析了整个算法在硬件实现中的若干难点,并在FPGA中进行了具体实现。本文设计在保持图像PSNR的基础上,大幅降低了算法的运算量。最终实现中,时钟频率为100MHz,宏块处理时间仅为1312时钟周期,具备D1视频的实时处理能力。
最后,文中还就H.264算法在红外图像中的应用进行了讨论。解决方案中提出了一种针对红外图像的目标分割算法,提取图像中感兴趣的目标部分,从而保证算法的压缩率及目标的PSNR。