基于深度学习的视频压缩方法研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wdbbzl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自20世纪90年代以来,随着数字高清电视、数字立体电视、网络流媒体、无线移动视频通信、高清视频监控等视频应用的广泛普及,海量视频数据的存储和传输成为亟需解决的两大难题。深度学习已经在人脸识别、目标检测及追踪、动作识别、视频内容审核等多个视频领域取得了重要突破,然而深度学习在视频压缩领域并未被充分研究。本文将利用深度学习在视频处理方面的优势,使用深度学习来提升视频压缩的性能。视频压缩方法有两种思路,一种是通过压缩单张视频图像以去除视频图像中的空间冗余,另一种是通过视频插帧以去除视频帧间的时间冗余。基于这两种思路,本文主要研究以下内容:(1)为了去除视频图像中的空间冗余,本文首先设计了基于显著性图的自编码网络。编码时,将待压缩的视频图像帧输入网络,然后通过卷积层逐步减少图像的特征图数目和空间尺度,将图像从像素空间映射到新的特征空间。然后通过量化、CABAC熵编码去除特征空间内的统计冗余,通过显著性图指导像素分配,最后输出码流得到编码结果。实验结果表明,在标准kodak测试集上,本文提出的自编码网络在同等低码率情况下压缩效果优于JPEG,同时优于近期发表的一种基于长短时记忆网络的压缩方法以及另一种基于变分自编码器的压缩方法。(2)为了去除视频中相邻图像帧之间的时间冗余,本文设计了一种基于多尺度卷积网络和对抗训练的视频插帧方法。采用多尺度结构更能捕捉物体的运动信息,而对抗训练能使插帧结果更符合人类的视觉系统。该方法通过GAN的生成器得到插帧结果,通过GAN判别器判别插帧结果的准确性。最后通过实验对比了损失函数的选择和多尺度结构对插帧结果的影响。实验结果表明,与近几年提出的基于光流估计的深度卷积网络(OFP)、基于深度立体像素光流的卷积网络(DVF)以及另一种基于多尺度网络的工作(ByondMSE)相比,本文提出的方法在UCF101以及HMD5-51视频数据集上均能取得更好的插帧效果。
其他文献
期刊
本书由中国建材工业出版社连续出版。面向国内外公开发行,拥有众多国内外读者。本书已向国家工商行政管理总局商标局申请注册商标,已在公告中,这将是我国粉体行业首部获准注册的
2011年7月29日,正北方网(原北方新闻网)正式通过国务院新闻办审批,具有了国家一类新闻网站资质,这意味着正北方网从此真正成为了具有与传统媒体同等新闻采访权和新闻首发权的独立网络媒体,今后重大新闻现场都将有正北方网记者的身影。正北方网申请获得国家一类新闻网站资质,将进一步壮大内蒙古网络新闻外宣力量,不仅能够充分整合新闻资源,还为世界了解内蒙古、内蒙古走向世界打开了一扇窗口。同时,正北方网还将成为
期刊
运用大体解剖学方法,研究了双峰驼前后脚标本。结果表明,双峰驼指(趾)部的弹性结构上指(趾)枕垫包囊、半月形纤维鞘和指(趾)垫构成。每指(趾)的指(趾)垫由前部的三个脂肪垫和后端的一个弹
华北克拉通中元古界地层中多个潜山油气藏、扬子克拉通震旦-寒武系安岳气田以及塔里木盆地寒武系盐下油气的发现均已证明中国中新元古界-下古生界具有良好的油气勘探潜力。作
2013年1月29日,天津美术学院终身教授、原副院长孙其峰先生获在京颁发的第二届”中国美术奖·终身成就奖”。获此殊荣的还有方增先、杨之光、李焕民、候一民、詹建俊等著
施工过程质量控制是指工程开工之后,进入全面施工阶段的质量控制,包括土建工程和设备安装工程中所有分部分项的施工作业过程。它是工程质量生产的关键环节,而且具有量大、面
校本课程开发已然成为当前各高校课程与教学改革的主要策略,尤其是具有地域与民族特色的校本课程往往成为非专业地方院校关注的焦点,但在此过程中,也暴露出不少问题。本文以作者
<正>~~
期刊