论文部分内容阅读
人类获取的信息绝大部分来自视觉,视觉是人类认识和改造世界的一个主要途径。虽然传统的二维成像技术已趋向成熟,但它们无法记录和重现出现实物理世界的三维信息。而三维成像技术可以突破以往二维技术的缺陷,更加真实地记录三维场景。 三维成像技术包括了三维场景的采集、处理以及显示。光场显示是未来的三维显示技术。光场显示的内容源于场景的采集与处理,采集与处理的场景信息需要光场显示技术才能重现。因此,光场显示的迅猛发展必然会促进采集、处理及相关技术的发展。然而国内外关于三维成像技术的研究与应用仍存在着诸多关键性问题,如:三维场景采集处理的质量与速度、三维显示的深度感与舒适度、显示质量等。针对这些问题,本文基于计算光场理论和平行系统对三维成像技术做优化,研究开发面向计算光场三维成像系统的场景采集、处理与显示,形成三维成像生成和展示优化平台。基于GPU开发出了高质量的多相机阵列采集、处理与显示实时系统,实现了由采集处理到显示再到优化的整个过程,并应用于光栅光场三维显示、移动端裸眼三维显示和VR显示等。本文主要贡献可以概括如下: (1)计算三维采集与处理:改进了基于光场的深度图获取方法,在极线平面图像(EPI)上提取一致性线索,包括局部一致性和全局一致性。并通过光场重构提取重聚焦线索,结合虚拟合成孔径,提高重聚焦的易控性。最后,根据一致性线索和重聚焦线索,提出并实现了一种鲁棒性较高的自适应双线索深度估计方法;提出并实现了一种实用性较高的深度图优化方法,并通过基于深度图的视差扩张自由视点渲染算法,提高后续三维显示的立体感;通过最小化非凸正则能量函数,提出并实现了一种基于极线平面图像(EPI)的自由视点渲染方法,提高自由视点渲染的质量与速度;提出并实现了一种通过多视点冗余信息以及增加窗口的光场重构自由视点渲染方法,减少渲染时自由视点图像的模糊度。通过场景光场重构和非线性的聚焦搜索,提高搜索效率,并应用于六自由度VR显示。 (2)计算光场显示标定:通过有监督的学习,提出并实现了一种基于计算全局光场采集的优化方法对视点子像素进行分配标定,标定准确度显著提高;提出并实现了一种移动设备自标定方法,可标定任意未知光学参数的光栅面板(或微透镜阵列)以及未知子像素参数的移动设备,并应用于移动端的裸眼显示。 (3)计算光场显示优化:提出并实现了一种光线反跟踪和子像素权重融合算法,对子像素颜色进行校正,减少三维显示中的串扰现象,并实现了不同视点间的平滑融合;为消除显示时视点间的跳跃现象,提出并实现了一种子像素复用的超多视点渲染算法,并提供了显示参数的设计方案。通过解决有包围盒的整数最优化问题,进行复用渲染;为增大三维显示的观看角度,提出了一种分段分配标定的方法进行仿真,可结合人眼跟踪技术,增大观看角度。 (4)平行显示优化系统:提出了一种光场显示深度感知平行系统,综合考虑多种深度感知影响因素并建立显示评估模型,优化光场显示中视觉聚焦点位置、视频明暗对比度以及视频模糊度等,并进行相应地数据处理与修正,从而渲染出强深度感、高舒适度的三维显示;结合视频目标物体跟踪做深度感知优化,基于平行学习理论,提出一种训练数据增强算法,用少量真实图像产生多个虚拟训练图像,提高训练跟踪的准确度。为光场显示深度感知平行系统的实现提供了技术支持。