视频编码并行化关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:cjwxwq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本研究分别针对实时视频编码和视频转码两种应用对实时性的不同需求提出并实现了不同层次的并行化编码算法。针对实时视频编码应用提出的并行化编码算法可以有效降低每帧图像的编码耗时,针对视频转码应用提出的并行化算法则可以有效降低多核处理器平台尤其是CC-NUMA(Cache Coherent-Non Uniform Memory Access)架构多核处理器平台运行视频转码算法时整体视频编码的耗时。本文的主要贡献和创新成果如下:  1.提出并实现了一种静态负载均衡宏块级并行编码算法。该算法可有效加速一帧图像的编码速度,提高实时视频编码应用的实时性。在该静态负载均衡宏块并行编码算法基础上进一步提出并实现了一种动态负载均衡宏块并行编码算法,该动态负载均衡宏块并行编码算法能够更进一步提高实时视频编码应用的实时性。在龙芯3B双路处理器开发平台上的测试结果表明在并行度为4时动态负载均衡宏块并行编码算法能够减少一帧图像54%~65%的编码耗时。  2.提出并实现了一种宏块级帧级组合并行编码算法。该算法既继承了宏块级并行编码算法大幅加速一帧图像编码速度的优点,也继承了帧级并行编码算法通过并行编码多帧图像提高视频编码实时性的优点,两者的结合大幅扩展了实时视频编码算法的并行度。在龙芯3B双路16核平台上的测试结果表明并行度为16的宏块级帧级并行编码算法相比于并行度为16的X264帧级并行编码算法编码速度提升幅度可达45%~110%。  3.提出并实现了一种CC-NUMA自适应的GOP级帧级并行编码算法。该算法充分结合了GOP级并行高并发度但存储空间消耗较大的特点,帧级并行编码算法在并行度较低时编码性能随并行度提升而线性提升且比较节省存储空间的特点,各GOP编码进程(线程)间几乎不存在编码依赖的特点和CC-NUMA系统本地访存效率较高的特点,设计实现了一个将GOP编码进程绑定在特定的CC-NUMA结点上,GOP编码进程内部采用帧级并行以降低存储空间开销的并行视频编码器。龙芯3B双路4结点CC-NUMA平台测试结果表明并行度为16时的CC-NUMA自适应GOP级帧级并行编码算法相比于并行度为16的X264帧级并行编码算法性能提升达一倍。
其他文献
随着医学信息学发展和医疗业务流程的复杂化,医疗服务规范化和流程化的必要性逐渐加强。医疗工作流作为规范诊疗流程、提高医疗效率的标准化解决方案,获得了越来越多的研究和应
学位
随着现代视频技术的发展,数字视频的获取变得越来越容易,基于人工注释的传统方法已经不能满足人们的需要,因此,基于内容的视频检索应运而生,成为了近年来视频检索的研究热点
多媒体技术与互联网技术的快速发展导致人们可以获得的多媒体数据尤其是视频数据呈现爆发式的增长趋势。由于大量视频处理工具及网络攻击的存在,视频数据的可信性正遭受到日
科学计算可视化技术广泛应用于自然科学和工程领域。地震数据可视化技术在地震数据解释过程中占有重要位置,其直接决定了油气藏勘探的准确性和有效性。本文主要针对地震数据
如今,随着科技的发展,数字图像的分辨率越来越高,然而在实际应用中,图像极易受到外界各种条件的干扰,在很多情况下,要获得高分辨率的优质图像就变成了一件难事。例如,受到传
计算机和网络技术的快速发展,给人们的学习、工作、生活模式的改变带来了深远的影响。随着计算机辅助教学的技术不断成熟,检测教学质量,评估学生学习效果的考试模式也将发生巨大
随着“互联网+”行动计划被列入中国政府报告,物联网、大数据等相关产业得到迅猛发展,作为物联网纽带中极其重要一环的无线传感器网络也吸引着越来越多来自不同领域学者们的关
随着信息化进程的发展,各大医院纷纷建立了信息化系统用于辅助医院的日常工作。其中电子病历是医学信息系统的主体,是医疗分析管理决策系统、医师临床诊断、远程会诊的数据中心
随着大数据时代的来临和发展,对这些海量的、复杂的数据进行数据的降维是一个必然趋势,深度学习在这块取得不错的成果。本文构建一个深度稀疏自编码神经网络,用以学习和研究深度