【摘 要】
:
语义分割是计算机视觉中的一个基本问题。实际应用中,它一般被视为一个逐像素分类的问题,大多数分割模型都使用一个逐像素损失作为其优化的目标函数。但是,逐像素损失会忽略图像中像素点之间的依赖性。之前已经存在一些利用像素之间的关系来增强分割效果的方法,例如,条件随机场,基于像素亲和力的方法,以及基于对抗生成网络的方法。然而,这些方法通常需要额外的模型分支,大量的计算机额外内存或更多的推理时间。在本文中,开
论文部分内容阅读
语义分割是计算机视觉中的一个基本问题。实际应用中,它一般被视为一个逐像素分类的问题,大多数分割模型都使用一个逐像素损失作为其优化的目标函数。但是,逐像素损失会忽略图像中像素点之间的依赖性。之前已经存在一些利用像素之间的关系来增强分割效果的方法,例如,条件随机场,基于像素亲和力的方法,以及基于对抗生成网络的方法。然而,这些方法通常需要额外的模型分支,大量的计算机额外内存或更多的推理时间。在本文中,开发了一种区域互信息损失函数,以更简单有效地对像素之间的依赖关系进行建模。区域互信息损失与将像素视为独立样本的逐像素损失相反,使用一个像素及其相邻像素来表示此像素。然后,对于图像中的每个像素,可以得到一个多维的点,该点自然而然地对像素之间的关系进行了编码,然后图像就可以视为这些多维点的一个高维分布。因此,分割模型的预测分割图片和和真实分割图片就可以通过最大化它们高维分布之间的互信息来实现更高阶的一致性。此外,由于很难计算出互信息的实际值,本文导出了互信息的一个下界,并最大化这个下界的一个有限近似值以最大化互信息的实际值。区域互信息损失在模型训练阶段仅需要少量的额外计算资源,并且在推理过程中没有任何开销。实验结果表明,区域互信息损失可以帮助一些当前先进的语义分割模型在一些标准语义分割数据集中实现实质且一致的效果提升。
其他文献
Delta算子系统研究是控制领域的研究热点之一。目前Delta算子系统的研究仍然存在一些亟待解决的技术难点问题。比如,在Delta域中对饱和非线性的研究尚浅。另外,随着网络化控制技术的发展,在复杂网络环境下的Delta算子系统的研究也引起广泛的关注。因此,对带有饱和约束及复杂网络环境下的Delta算子系统的研究更具挑战性。本文主要研究Delta算子系统的饱和约束以及网络化控制等问题。主要研究内容概
基于静态相机的智能监控系统对于交通、安防、金融、电力等领域有着重要的实际意义。智能监控系统利用计算机视觉技术对于图像序列的信息自动进行分析和理解,并输出自然语言描述的结果。背景减除算法作为计算机视觉技术的重要一环,其处理的结果直接影响后续的算法效果。 简单的背景减除算法能够满足实时性的要求,但是对于复杂场景有着较频繁的误检现象发生;复杂的背景减除算法能够满足准确率和检测目标完整的要求,但是在实时
时滞现象普遍存在于能源、物质、信息的传输过程中,在自然和工程系统中均不可避免。时滞的存在通常会导致系统性能下降,甚至直接导致系统不稳定。因此对于时滞系统的稳定性研究引起了国内外很多学者的关注。在近二十年的时间里,Lyapunov-Krasovskii(L-K)泛函构造技术的改进和线性矩阵不等式(Linear Matrix Inequality, LMI)方法成为了时滞系统分析研究的主流方法。随着平
随着计算机技术、自动化技术以及机器视觉技术的不断发展,机器人技术作为上述技术的一种综合体也获得了快速发展。其中,机械臂视觉伺服控制技术由于具备理想的工作环境适应能力而受到广泛关注。然而在实际应用中,机械臂视觉伺服系统会受到多方面的限制和约束,例如机械臂关节角度的物理限制、摄像机视场范围的限制、图像速度信息是否可得、机械臂末端点工作面约束以及机械臂死区非线性约束等。如果不充分考虑这些限制因素,会严重
现代工业控制过程日趋复杂,且对系统控制性能要求不断提高,传统单一系统往往难以满足日益复杂且严格的生产需求。针对这一问题,切换系统应运而生。切换系统由多个子系统(或模态)以及切换信号组成,切换信号根据实际控制需求选择相应工作的子系统。切换系统可以用多个简单子系统模型表征复杂的控制任务,因而具有重要的理论与应用研究意义。本文主要研究基于时间约束切换的切换系统的稳定性分析问题,并考虑实际系统常见的时延、
随着人口的快速增长和能源的急剧消耗,节能环保变得越来越重要。在此背景下,人们对汽车发动机系统在燃料效率和低排放方面的性能有了更高的要求。电子节气门(Electronic throttle, ET)系统在实现这一目标中发挥着重要作用。它通过控制进入系统发动机的空气流量来控制空气-燃料混合比,能有效减少环境污染和优化燃料消耗。电子节气门系统由节流阀本体、传感器、齿轮组和控制节气门阀板开度的直流电机等部
随着高校办公信息化水平的不断发展,计算机已经成为各类公文管理的主要工具。在高校教务部门中经常需要处理大量的公文,在文件保护方面有着一定的安全要求。为了确保这些公文内容可以得到有效保护,仅在安全环境下可以操作和访问,需要采用一定的技术手段为其提供保护服务。 本文针对上述需求,为某高校教务部门设计和研发了一套文件透明加密系统,该系统能够在用户无法感知的情况下,实现对指定文件类型在内核环境下进行加密解
随着医院信息化建设的快速发展,医学影像自助服务系统(MISS)得到了初步推广。但因其识别率低、数据存储时间短、不利于分享、运维不便等问题,应用推广得到了严重限制。本文在实地走访客户、分析存在问题、整理需求的基础上,设计实现了医院云影像自助服务系统(HSSBCI)。 HSSBCI(Hospital Self-service System based on Cloud Image)系统采用基于深度学
目前,伴随着移动社交的广泛普及和云计算的蓬勃发展,人们愈发倾向于通过网络获取知识与存储信息,互联网中的数据呈现爆炸性的增长趋势。与此同时,信息安全领域的问题也日益严峻,个人、企业等信息遭到泄露的事件频频爆出,鉴于以上因素,大数据环境下的数据安全成为了研究学者的关注热点。属性基加密机制作为密码学的一个重要分支,通过访问结构与属性集之间的匹配关系实现用户对数据访问权限的控制,高效地解决了“一对多”的秘
多标签分类任务是机器学习中极为重要的任务之一,近些年来受到了广泛的关注。绝大多数已有的多标签分类算法旨在利用标签之间的关联信息以提升算法的性能。然而,已有的算法或者是穷举了所有可能的关联信息,或者是随机生成一些标签集合以期捕捉到标签之间的关联信息,或者是用标签嵌入的方式来捕捉标签的关联信息,而忽视或只是隐式地去利用数据集中标签之间的共现信息。实际上,标签之间的共现信息往往表明标签之间存在强烈的正相