【摘 要】
:
H.264/AVC是最新的视频编码标准,较以往的视频压缩标准具有更高的压缩比、图像质量和友好的网络特性.为了获得最优的编码性能,H.264/AVC采用了非标准化的率失真优化(RDO,Rate Distortion Optimization)技术.从而使编码器的复杂度大幅度增加,很难应用于实时性要求较强的场合.本文提出利用Sobel算子建立边缘方向场,构建编码块的预测模式直方图(prediction
【机 构】
:
南京航空航天大学自动化学院,南京,210016
论文部分内容阅读
H.264/AVC是最新的视频编码标准,较以往的视频压缩标准具有更高的压缩比、图像质量和友好的网络特性.为了获得最优的编码性能,H.264/AVC采用了非标准化的率失真优化(RDO,Rate Distortion Optimization)技术.从而使编码器的复杂度大幅度增加,很难应用于实时性要求较强的场合.本文提出利用Sobel算子建立边缘方向场,构建编码块的预测模式直方图(prediction modes histogram),根据预测模式直方图的分布确定率失真优化候选预测模式.试验结果表明,该方法在保证图像率失真度和码率性能的前提下,大幅度地加快了帧内预测模式决策速度。
其他文献
使用区分真实照片与人工图片的算法进行图像的预分类与识别,对于提高基于内容的图像和影片检索的成功率有着较大的现实意义.区别于目前大部分相近的侧重于图片宏观特性的研究,本文主要考虑了图片的微观特性,包括纹理的粗细、能量、走向、信息量,以及纹理的颜色、亮度分布等特征,并使用支持向量机(SVM)的算法,对这些指标进行整理,达到了对图像进行分类的效果。
随着光电传感器在舰载武器系统中的大量应用,光电目标的信息处理技术也越来越重要.特别是光电目标自动检测与识别技术,已成为光电目标信息处理中的一项十分关键的技术,对"发射后不管型"的导弹末制导具有重要的意义.传统的最大对比度和模型匹配目标检测与跟踪方法难以满足复杂背景下目标自动检测的需要,寻找新的目标检测与识别方法仍然是一项迫切而艰巨的工作.近30年来,出现的分形理论为光电目标的自动检测与识别提供了新
关节角度的变化能够有效反映人体运动的主要特性.该文提出了一种基于关节角度信息的步态识别方法.首先对运动人体腿部建模,采用最小二乘法拟合边界,获取大腿和小腿关节角度的时序信息;根据步态运动的准周期性,将关节角度时序信息按傅立叶级数形式展开,采用遗传算法搜索各次谐波的系数并进行尺度变换,生成特征向量;最后使用KNN分类器进行分类识别.该文在CMU库上进行实验,得到了令人满意的识别结果,而且当步态发生遮
基于国标中晶粒度的定义,提出一种自动进行晶粒度测量评级的方法.推导了通用的尺寸标定公式,论述了应用该方法过程中进行二值化变换、消除噪声、提取晶界和通过连通区域成分标记及链码表示判断闭合计算晶粒个数,最终进行评级的算法及实现.给出了典型实验结果,并对该方法与国标定义的其它方法作比较.结果表明,该评级方法避免了晶粒度测量评级中人为因素和晶粒大小均匀性的影响,比其他方法如截点法、截圆法等具有更高的准确性
本文将机器视觉系统引入到连续运动的布匹表面色差检测中,并用CCD相机取代传统的分光光度计进行颜色测量.在色差检测的过程中,首先利用异常点检测的方法剔除图像中的奇异点,提取出布匹的颜色特征值,再将该特征值与标准样本比较即可得到色差值.然而,布匹在线检测通常比较的是前后色差,CCD成像系统在实际应用中又往往会受到各种干扰,因此其测量结果在时间上前后并不完全一致.为了克服CCD相机这一缺陷,对标样物颜色
Earth Movers Distance(EMD)算法用计算最小代价的方法来进行相似度度量,具有速度快准确性高的优点.但它度量准确的前提是描述图象的概率模型被合适地建立,传统的直方图方法或矢量量化器(VQ)建立的概率模型不能较好地描述图片包含的信息.本文提出使用高斯混合的期望最大(GMEM)算法进行图象描述,为EMD算法提供更恰当的概率模型(简称为GMEM+EMD算法).实验结果表明这种GMEM
图像盲复原是在降质过程的所有信息或部分信息未知的情况下,利用降质图像的特征来估计原始图像和降质点扩散函数(PSF)的过程,对降质PSF的类型和参数进行识别称为模糊辨识技术,它是图像盲复原的关键.本文设计了一种基于频域零值的散焦与运动模糊模型参数求解的详细流程,利用由散焦模糊与运动模糊造成的降质图像对本文算法的性能进行了验证,实验结果表明本文算法是可行且有效的。
针对数字图象稳定应用对于实时性的要求,本文提出了一种基于下采样和亚象素相位相关性的全局运动估计算法.该算法能够有效降低运动估计的计算负担,并且与基于子图象的相位相关方法相比,本算法在运动估计范围和抗干扰能力方面都有着明显的优势。
针对普通光照条件下的彩色唇读图像,提出了一种结合多种颜色空间及Fisher变换的多级唇部检测定位方法.首先在CbCr空间建立肤色模型进行人脸检测和定位并由人脸几何特征得到唇部大致区域;然后结合唇色特征对该区域进行Fisher变换以使肤、唇色区别明显化;进而根据亮度信息对Fisher变换结果进行预处理后再用Otsu法自动确定二值化阈值,实验结果表明在唇读图像分割中本文方法较经验阈值法更有效;继而在r
在矢量地图中隐含水印信息,地图数据的质量往往由于水印的嵌入而受到影响.可逆水印技术(又称无损数据隐藏)具有完整恢复载体数据的能力,因而更加适用于矢量地图.本文基于差值扩大的思想,提出了一种应用于矢量地图的无损数据隐藏算法.算法根据矢量地图对数据精度的特殊要求提出了相应的水印嵌入条件,并通过修改地图中相邻顶点坐标间的差值来嵌入水印信息.水印的提取过程不仅能够得到隐藏信息,而且能够准确无误的恢复原始地