基于视觉显著度的视频编码优化技术研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:yeyeye5122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着视频编码技术的不断深入,传统编码技术更多地和诸如心理学和认知学等领域的知识结合起来,以便得到更好的视觉效果。近年来,随着生物学、心理学的发展,关于视觉显著度的研究被应用于计算机领域中,并成为图像和视频处理中的一个热点。   视觉显著度(saliency),英文为saliency或者salience,是神经科学和符号语言学中的术语,指的是某一物体或者信号相对于其周围物体或信号的显著程度。这种显著程度通常和人的感知相联系,是综合了客观的信号自身属性和主观的人的高级认知能力的结果。视觉显著度已被广泛应用在认知和注意研究、图像压缩、视频摘要、数字水印以及视频编码中。本文重点研究了视觉显著度在视频编码中的应用。   首先,本文针对当前视觉显著度提取方法存在的准确度和稳定性不够的问题,提出了基于结构性信息提取视觉显著度图的方法,并在现有的Itti模型的基础上加入肤色检测和频谱残差方法,综合以上各种方法对视频每帧的视觉显著度提取进行优化,使得视频每帧的视觉显著度图更加准确。   其次,本文对已提取出的每帧视觉显著度图在时域上做出调整,依据视频特性、视觉显著度变化特点、编码特点以及人的主观感知等方面,使得调整后的视觉显著度图更符合人眼感受,且更利于视频编码。   最后,本文以提取出的视频视觉显著度图为依据,基于H.264/AVC编码标准,分别对帧层和宏块层的码率分配策略进行改进。用较少的码率对视觉显著度较低的区域进行编码,节省出的码率用于视觉显著度较高的区域的编码,使得视觉显著度高的区域编码更精细,质量更高。达到在整体码率相同的情况下,视频总体主观质量更好的效果。   详细实验结果显示,本文的方法对视频的视觉显著度提取更加准确,基于视觉显著度的编码与传统编码相比,关键区域更精细,主观质量更好。  
其他文献
主题数据库规划是信息资源规划的一个重要过程。只有对主题数据库进行合理的规划,才能使数据库应用系统发挥更高的效率,保持长期性、稳定性,适应应用的多变性。但是由于没有
虚拟现实[Virtual Reality]技术是一种能够给人提供虚拟世界体验的技术,随着计算机软硬件技术的飞速进步与发展,虚拟现实系统受到各行各业越来越多的关注。地理信息系统[GIS,
熵解码是视频解码的核心算法之一。随着高性能编解码标准的出现和高清晰度视频的应用,熵解码处理的数据量和计算复杂度大幅增加,采用软件处理的方法难以满足多种格式高清视频
可逆数值映射(reversible contrast mapping,RCM)是早期可逆水印算法中比较经典的基于整数变换的算法,本文进一步扩展了RCM可逆水印算法并进行了改进,由传统的两点组扩展到任
随着计算机的普遍应用和网络技术的迅速发展,计算机深刻地影响了社会经济生活各个方面。由于计算机的体系和计算机网络都采用开放式的结构,在结构上存在着安全缺陷,因此引发
学位
BIND是目前最流行的DNS服务器软件。版本9的BIND重新写了底层实现,进一步的提高了DNS的安全性和可靠性,新的多线程架构也对多处理器硬件提供了更好的支持。   但是当从本
并发环境中共享对象的互斥访问是并发系统设计与管理需要着重考虑的问题。事务内存(Transactional Memory)是近年来提出的一种解决这类问题的方法。其中,Harris提出一种软件
在公共上机实验环境中,每台计算机都安装有固定的操作系统和软件,学生不能自由添加删除程序,学生的私人数据文件只能保存在计算机的公共磁盘或网络磁盘上,没有独立性和安全性,容易
在印刷过程中,印刷品质量的好坏取决于与预先设计的印刷图案是否一致。在基于机器视觉的印刷品质量检测方法中,先由相机等设备将印刷品拍摄并传输到计算机中,再由计算机对印
目前RFID技术及应用已成为国内外研究热点。但绝大多数RFID应用仍是闭环应用,其关键原因在于,缺乏一套可靠高效的RFID公共服务基础设施和信息共享机制。RFID编码解析服务是核