【摘 要】
:
作为水下计算机视觉的基础任务,精准的深度估计能够提升水下机器人的测距、定位以及目标抓取等任务的水平;高质量的颜色校正对于水下目标检测、识别等图像处理技术的发展具有重要意义。水下深度估计是对水下RGB图像中每一个像素相对拍摄源的距离进行估计;颜色校正解决图像中由水体环境导致的光衰减和后向散射等问题。但是,相较于陆上环境所具备的数据量大、技术研发成熟等优势,光照不均和能见度低等恶劣环境导致水下成像存在
论文部分内容阅读
作为水下计算机视觉的基础任务,精准的深度估计能够提升水下机器人的测距、定位以及目标抓取等任务的水平;高质量的颜色校正对于水下目标检测、识别等图像处理技术的发展具有重要意义。水下深度估计是对水下RGB图像中每一个像素相对拍摄源的距离进行估计;颜色校正解决图像中由水体环境导致的光衰减和后向散射等问题。但是,相较于陆上环境所具备的数据量大、技术研发成熟等优势,光照不均和能见度低等恶劣环境导致水下成像存在图像模糊、杂质较多等问题,为水下图像的准确标注以及高效高质量的图像处理带来了大量的不确定性。因此,有必要首先借助可靠的图像转换模型,合成大量的水下数据,缓解真实水下数据缺乏监督信息的问题。并且,深度信息与水体环境中的光衰减和后向散射的形成密切相关,水下图像中编码了大量的距离信息,而水下图像的颜色失真也与场景中的距离具有相关性,因此将水下深度估计任务和颜色矫正任务联合起来,实现多任务学习,有助于提升两者的结果。针对上述问题及解决方案,本文设计了一个端到端的非监督网络结构。该网络在没有成对的水下图像训练集的情况下,通过风格转化合成大量有效的水下图像数据集;之后,利用大量生成的水下图像,同时进行深度估计和颜色矫正的多任务学习,借助彼此的特征信息相互促进性能的提升;最后,通过特征域适应策略,缩小合成的水下数据与真实水下数据之间的域差异,进而提升网络面对真实水下场景的适应能力。本文的主要贡献如下:(1)基于生成对抗网络的多域水下图像风格转化框架。针对不同的水下场景,该框架可以利用有效的域标签信息对大量的陆上数据集进行风格转换,合成水下图像数据集。(2)水下图像的深度估计和颜色矫正的多任务学习框架。两个子任务均采用编码器-解码器结构,并且,在两个子任务进行学习的过程中,对解码器的各层的特征图进行交互,使得两个子任务能够学习到更多有用信息,实现互利。(3)教师-学生结构的特征域适应策略。教师网络和学生网络都是完整的任务网络结构,学生网络负责合成图像域中输入输出关系的建模,而教师网络则指导学生网络向真实水下图像域进行迁移,从而提升对真实水下场景的适应能力。为了验证本文提出的水下图像的联合深度估计和颜色矫正网络的有效性,本文在多个公开数据集进行训练和测试,在RMSE、PSNR、SSIM等多个客观指标和主观指标上与之前的方法进行对比,均能获得较为优异的性能。
其他文献
随着人工智能技术的快速发展浪潮,各种类型的机器人在人们的日常生产生活中得到了广泛的应用。其中,在能源化工行业中,由于危险气体泄漏引发的重大安全事故不断增加,防爆型巡检机器人也开始得到研究者的广泛关注。尤其是四轮独立驱动与转向的轮式机器人凭借其控制性好、灵活性高和机动性强的特点,在应对高危环境的巡检场景中成为研究应用的热点之一。防爆巡检机器人在执行巡检任务时,需要采用路径规划技术。基于已知环境信息,
行人重识别旨在判断行人在不同的摄像机视域下是否出现过,是图像检索的一个子问题。随着深度学习在计算机视觉领域的广泛应用,基于深度学习的行人重识别已经成为主流模型,并且在效果上远远超出基于传统机器学习的行人重识别方案。但在在实际的应用场景中,由于存在摄像机分辨率太低、姿态变化、光照变化频繁和遮挡严重等一系列问题,行人重识别任务仍然具有很大的挑战性。如何提取对光照变化、姿态变化和遮挡鲁棒的、有区分性的特
随着高通量技术的发展,产生了大量的生物组学数据,从生物组学数据中提取有意义的信息对于理解复杂的生物过程至关重要。生物组学数据的特点是“小N大P”,即特征数大,样本量小。传统的特征选择方法忽略了每个特征(生物分子)之间的复杂相互作用,因此从系统、宏观的网络层面研究特征(生物分子)之间的相互作用具有重要意义。本文对特征(生物分子)间的相互作用进行研究,提出了两种基于网络的生物标志物筛选方法。提出了基于
随着数字化时代的进步,基于云计算的机器学习预测也变得越来越广泛,然而传统的机器学习算法需要访问原始数据,这给用户数据带来了潜在的安全风险,尤其是一些隐私数据,比如医疗记录、财务数据等其他进入第三方渠道的信息。为了保护隐私数据不被泄露,实现安全的机器学习预测,可以在预测前对原始数据进行加密处理。同态加密技术可以对加密后的隐私数据做计算,这种隐私保护的方法使得安全预测成为可能。然而由于加密方案的巨大开
在现代国防的防空作战体系中,战场局势复杂且瞬息万变,使用AI进行动态辅助决策成为了一种迫切的需求。传统的依靠专家规则的AI模型过分依赖规则和专家的知识,而且不够灵活。基于深度强化学习的AI模型可以通过模拟或者真实的战场数据学习,使得决策更加灵活可靠。游戏环境一直都被认为是AI研究最理想的实验环境之一,在模拟仿真上的效果也很好。经过调研发现塔防游戏在游戏目标和操作上和防空作战有着一定的相似性。因此可
轮式移动机械臂由轮式移动平台和机械臂组合而成,由于其可以在空间内自由移动,故具有工作空间大、应用场景丰富、环境适应性强等优点。将轮式移动机械臂引入到智能工厂中,控制其按照参考轨迹进行加工作业,不仅可以代替传统固定式机械臂,还能提高加工效率,创新加工模式。为解决轮式移动机械臂结构复杂和多变量等问题,本文对轮式移动机械臂的加工作业过程进行划分,建立相应的数学模型和控制方法,以保证轮式移动机械臂在智能工
随着现代化信息技术的不断提高,互联网、物联网、5G等应用被广泛普及,海量数据是一种客观的存在,它们发挥着越来越重要的作用。时序数据为海量数据中的一种重要的结构化形式数据,如何高效的对各类时序数据进行异常检测是一个重要的研究课题,其旨在能够准确地从海量数据中识别出异常数据,为操作人员提供所监控设备各个部件的健康情况。本文借助深度学习强大的学习能力,对时序数据异常检测任务进行了深入的研究。针对时序数据
近年来,随着科技的进步,无人机机型向着小型化、低成本的方向不断发展。凭借着易部署、可控制、移动性的优点,无人机尤其是可悬停的旋翼无人机被大量应用在民用和商用领域,比如目标跟踪与检测、物流、辅助通信等等。其中,无人机辅助无线通信是目前的研究热点。在无人机辅助无线通信中,无人机可以通过安装小型的通信设备,为地面用户提供通信服务、作为中继节点为距离较远的收发设备建立连接、或作为移动汇聚节点采集地面无线传
近年来,随着各种人工智能(AI)应用不断地融入现实生活中并受到了日益广泛的关注,由深度神经网络(DNN)驱动的AI智能应用已经成功应用于许多现实领域。本文所研究是由DNN驱动的人工智能应用推理请求在5G移动边缘云(MEC)中的任务卸载策略问题,目的是在满足应用程序严格的延迟要求的前提下,尽可能多的处理DNN推理请求,以提高移动设备、基站和边缘服务器的能源效率。随着各种AI智能应用对精度、速度和能耗
自2007年发布以来,Android操作系统逐渐在智能终端的操作系统领域占据领先地位。官方平台和许多第三方市场都允许用户轻易地查找,下载以及使用大量的第三方应用程序,具有较好的用户体验。但与此同时,Android平台逐渐变成了恶意软件的主要攻击目标,恶意软件广泛存在各大应用市场,对用户的使用安全造成威胁。因此,高效地提高恶意软件的检测效率,提升模型鲁棒性,对其在现实背景下的实用性和维护Androi