论文部分内容阅读
随着时代的发展,技术的进步,人类对高清画质的欣赏需求与日俱增,同时“信息大爆炸”随之而来的大容量信息存储,都对高效压缩技术提出了迫切的要求。因此,提升图片压缩效率的同时改善实时性,成为当今的研究热点之一。本文主要从提高图像压缩比角度提升实时性,压缩比的提升意味着使用更少的比特消耗,较少的带宽消耗一定程度上可以降低网络时延,加快传输速度,增强传输实时性。本文在提升实时性的同时,也注重视频图片的还原质量,特别是针对低码率图片,既提升压缩比,也保证视频图像的压缩恢复效果。基于此,本文主要做了如下工作:1.完成了基于深度学习图像压缩框架的Round函数自适应性优化,并完成了基于图像理解的图像压缩适应性训练;2.以深度稀疏自动编码器作为压缩框架基础:利用图像分块和图像聚类算法在模型训练之前对原数据进行预处理,选择使用粒子群寻优算法在解空间域中寻找合适模型的最优解,并且使用交叉验证的方法来测试改进MSAE模型的稳定性和可靠性,同时还设计了新的量化方式、提出新的压缩特征先验建模方法并引入了率-失真优化,实现了“速率-失真”权衡,改善了压缩效率,提升了压缩比。3.完成了基于语义理解的图像兴趣区域感知算法的设计与优化。针对目前图像压缩中存在的“读图”效率低,抗干扰能力弱等问题,提出多结构感兴趣区域,一方面,实现由低层特征到语义特征的有效转换,做到“读懂图片”;另一方面,通过有效组合相似的类,并跨类共享相同特征,减少了同一类属的无关紧要的“细枝末节”的干扰,有效增强了区域感知的鲁棒性,提高了目标区域感知的识别准确率。4.同时在特征提取过程中,将获取的图像方向特征改换为更显著的边缘特征,并在显著图生成时注重不同尺度不同维度特征的相互融合,引入纹理特征描述,综合线性融合方法,在形成特征图的过程中特别地加入类似人类视觉的关注点,完成了对图片兴趣区域感知机制算法的优化,使得后续图像还原“有的放矢”,有效提升了图像压缩还原质量。5.最后通过兴趣感知实验验证了本文提出的多级兴趣区域感知机制能够有效抵抗多种类型的噪声干扰,即使在低码率图片模糊的情况下,也能有效降低“块效应”,在提高对目标兴趣区域的识别准确率的基础上,提升图片压缩复原效果;基于多种标准图片集实时性压缩对比实验验证了本文所提出的压缩框架有效地提高了压缩比,即在同等视觉感受下有效地降低了图像尺寸空间的比特消耗,提高了实时性,同等视觉效果及相同图像参数指标值下,能够有效减少图片比特消耗数在3%左右,达到了“速率-失真”权衡,保证了图片复原质量,达到本文通过提高压缩比来提升实时性的研究预期。