基于风格转换的人眼图像合成方法研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:blnxy541
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人机交互、自动驾驶等领域,人眼视线估计发挥着巨大的作用。目前人眼视线估计方法的效果深受其训练数据的质量所影响,视线估计的训练数据主要包含两个类型:人眼真实图像和人眼合成图像。真实图像更符合实际场景的要求,但图像中的干扰因素较多、需人工标注;合成图像受外界干扰因素少、可以自动标注,但缺少真实性、数据分布没有真实图像丰富。因而,使用这两种人眼图像训练出来的视线估计模型,在实际场景测试时效果都很不理想。针对合成图像训练出的视线估计模型泛化性差,真实图像采集和标注成本大、干扰因素多的问题,本文创新性地将风格转换的思想引入视线估计中,提出了一种基于风格转换的人眼图像合成方法,重点对人眼真实图像进行改善,并结合现有人眼合成图像分布均匀、易于学习的优势。具体地,将真实图像的标注信息作为内容信息,将合成图像的分布作为风格信息,通过使用本文方法生成的图像训练出更为鲁棒性的视线估计模型进而提高视线估计的精度。该方法包含三部分,语义分割网络、特征提取网络和损失网络。针对传统风格转换方法对瞳孔和虹膜这些局部信息保留不充分的问题,在本文方法中设计了一个语义分割网络来获得局部瞳孔和虹膜区域信息。通过本文改进的特征提取网络分别学习人眼全局和局部特征。在损失网络中本文提出了一种新的损失函数来计算风格损失和内容损失,以减少合成图像和真实图像之间的分布差距,得到最终的输出图像。输出的人眼图像在保留原始真实图像的瞳孔和虹膜这些重要标注信息的同时,减轻了光照等因素的干扰,还尽可能地学习到了合成图像的颜色、纹理等分布。最后,为了更充分、全面地证明本文方法的有效性,采用主观定性和客观定量的评价标准,分别就风格转换任务和视线估计任务进行了对比实验。在风格转换任务中,与基准方法相比,本文方法可以更好地保留参考风格图像的颜色、纹理信息,同时满足实时性的要求。在视线估计任务中,为了验证本文方法能够有效提高视线估计的精度,将本文生成的改善后的真实图像与原始真实图像在五种视线估计基准方法中进行对比实验,实验结果证明在多个公开数据集上本文方法均取得了最优的视线估计精度。
其他文献
地图构建与定位是无人驾驶研究领域的关键技术之一。基于激光雷达及其它传感器构建高精度地图是当前的主流方式,然而受传感器性能及成本等限制,再加上无人车行驶环境的复杂性
随着物联网技术的发展,传感器网络逐渐趋向产业化。其中作为物联网核心的RFID技术的应用也越来越广泛,例如仓库管理、物品防伪和目标追踪等。近年来,分类的RFID系统引起了学
近年来,随着海底油气管道服役时间的增长,管道内腐蚀泄露问题日益凸显,已严重威胁到管道的安全运营以及海洋的生态稳定。如何对海底油气管道内腐蚀进行合理的预测,准确判定海
同一种癌症可以细分为许多种不同的亚型,而不同的癌症亚型对治疗方案有着截然不同的预后反应和治疗结果。癌症亚型的发现和确定在癌症的治疗过程中至关重要,它是为癌症患者提
图像显著性检测是计算机视觉领域中的关键技术之一,在实际的计算机视觉任务中也起着重要作用,其主要目标是模拟人类视觉注意系统来寻找到人们所感兴趣的区域。因此显著性检测
步态特征是一种生物特征,它具有其他生物特征不具备的优势,如可远距离获取、不易伪装和非接触即可获得等。在监控场景下,由于摄像头与行人的距离较远,不仅常用的指纹和虹膜特
自主驾驶技术是世界各国共同关注和积极推动的面向未来的交通新技术。目前,自主驾驶的主要研究方式是通过实车测试或仿真测试收集不同道路场景数据来训练和优化车辆模型,解决
在故障诊断研究中,对残差信息采用不同的度量将对模型和数据驱动方法产生至关重要的影响。通常采用欧式距离作为经典的残差度量方式,尽管能够反映系统偏离正常行为的程度,但
在雾霾恶劣的天气条件下,悬浮在大气中的微小颗粒对光线的散射和吸收作用,导致采集到的图像对比度、能见度和饱和度降低,色调偏移,颜色失真,这严重影响了户外视觉系统的效用
多目标跟踪(Multi-object tracking,MOT)是视觉监控领域的前沿课题,其重要的军事和民用价值引起了广泛的关注。本论文在公开监控序列集和检测响应集的基础上,以图像序列中行