基于H.264/AVC的帧内预测快速模式选择算法的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:lmd1028
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的迅猛发展给人们的生产生活带来了深远的影响。相对于文字、语言之类的抽象信息表示形式,视频、图像具有直观、生动、易于理解、通用性强等特征。但是由于视频图像的数据量非常大,不利于存储与传输,因此就要用到视频压缩技术来解决这一实际问题。   2003年5月,ITU-T/ISO正式公布了H.264/AVC视频压缩标准,与以往的视频编码标准相比,H.264/AVC具有出色的编码性能。其性能的提高得益于采用了许多新技术,如新的帧内预测方法、整数DCT变换、环路滤波、率失真优化技术、4×4块的运动估计、多参考帧选择、内容自适应的二进制算术编码等。但是H.264性能的提高是以增加编码复杂度为代价的,利用RDO技术计算每种模式RD的时候都要经过一个完整的编码过程,即对残差块进行DCT变换,量化,反变换,反量化,熵编码等。因此编码器的计算复杂度非常高,由此可见,如何有效地降低帧内预测的计算复杂度具有重要的应用价值。   本文首先介绍了H.264/AVC视频编解码标准,以及H.264中采用的主要技术,包括H.264的编解码器、H.264的档次和级、H.264的编码格式、H.264帧内和帧间预测、整数变换与量化、去方块滤波等,并详细地介绍了帧内预测中4×4亮度块、16×16亮度宏块、8×8色度块的预测模式,分析了帧内预测编码的运算复杂度。然后介绍了边缘检测与纹理分析的方法与应用,并在此基础上提出了基于边缘检测的帧内预测快速算法和基于纹理方向的帧内预测快速算法。对于前一种方法,首先将图像块下采样为3×3大小的图像块,再利用四方向的sobel算子进行边缘检测,根据边缘检测的结果选择少数的几个预测模式进行RDO计算。对于后一种方法,通过分析帧内图像的纹理方向,确定了一个预测模式的子集,该集合中预测模式的数量要少与全搜索下帧内预测模式的数量,因此可以有效地降低编码的复杂度。
其他文献
概念可以分为三个不同的层次:上层,中间层(基本层)和下层。大多数研究表明,人类在进行信息提取的过程中,大脑会首先提取某一层次上的信息,这种现象称为基本层加工优势。然而也
虚拟现实中场景的生成对实时性要求很高。场景中模型量的大小和模型的复杂度对场景渲染的实时性影响相当明显。当模型量很高或者模型非常复杂时,虚拟仿真系统的实时性降低。
随着压电陶瓷的广泛应用,压电陶瓷性能参数的测量已经在整个电子测量行业中占有重要的地位。压电陶瓷的性能参数与其制造工艺,化学成分,形状,极化效果等有关。阻抗分析仪是进行压
21世纪是信息的时代,信息成为一种重要的战略资源,信息安全事关国家安全和社会稳定。可信计算技术从硬件和操作系统做起,从整体上采取综合措施,能够行之有效地提高计算平台的
随着计算机应用技术的发展,以网络和多媒体技术为基础的网络教育越来越普遍,已成为新一代教育的发展方向。教师和学生能建立在线网络课堂,在网络上实时地进行语音视频教学,师生交
人脸的自动识别是模式识别和计算机视觉等领域的研究热点之一。然而,人脸图像的特征维数通常情况下都非常高,直接对这些高维数据进行处理,不仅使得计算复杂度非常高,而且会带
问题求解是人类思维最常见的一种方式,是人类重要的高级智能活动之一。启发式问题求解会对问题的求解空间进行一定的限制,使搜索朝有利于问题解决的方向进行,而不是盲目搜索
随着Internet和Web的高度普及,大量的信息充斥着整个网络。人们每天都要从中获取有用的信息以及知识,这也就导致了信息检索技术的迅速发展。关键词的自动抽取是信息检索的基础
可信计算立足于终端,在终端构建一个信任根,以信任根为起点,通过完整性度量技术,建立信任链,实现信任由信任根扩展到硬件平台、操作系统,直至整个网络,保证整个计算环境的可
随着经济飞速发展、科技不断进步,互联网技术在近几年得到了迅速的普及,人们的生活、工作越来越依赖于计算机和网络。伴随着经济利益的诱惑,木马病毒等恶意程序在用户不知不觉中