基于元学习的3D点云语义分割方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:chengyfei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能技术的飞速发展与我国人口老龄化进程的加快,机器人已经逐渐被应用于各个领域,尤其是一些从事简单工作的劳动力行业。房屋装修作为房地产相关服务的重要组成部分,装修质量和周期至关重要。同时,随着生活质量的高和国家对未来绿色建筑的倡导,人们对房屋装修的要求越来越高。在此背景下我国房屋装修行业逐渐向机械化、专业化、智能化方向转变。随着数据获取技术的发展,语义分割对象已经由二维图像转向体素、点云等三维数据,并且使用海量数据进行基于深度学习的语义分割方法的相关研究已经十分成熟,越来越多的学者希望可以将模型现有学习特征应用于新环境中。元学习方法是继深度学习之后的一种新兴算法,旨在通过少量数据样本让模型快速应用到新环境中。基于上述背景,本文对自主装修机器人在装修场景中的语义分割进行研究。首先,在实际装修环境中使用Faro Focus扫仪获取3D点云数据并进行预处理;然后,为了高模型的泛化能力,本文根据点网络模型(PointNet)出一种基于模型无关元学习算法(Model-Agnostic Meta-Learning,简称MAML)的3D点云语义分割算法;最后,为了验证模型的泛化性,将该模型应用到实际装修场景中进行语义分割。本文具体研究内容如下:(1)本文实现了实际装修场景中3D点云数据集的构建,主要包括数据的采集、冗余处理、双边滤波去除噪声、等距降采样、ICP算法拼接和数据标注等步骤。(2)本文出了一种基于MAML的3D点云语义分割算法,主要包括基础学习模块和元优化模块。在基础学习模块,使用PointNet模型学习支持集的特征,并利用查询集评估该模型,从而获得损失值。在元优化模块中,根据该损失值更新整个模型的参数,从而高模型泛化能力。该算法与PointNet模型相比,训练时间加快了一倍;与AMTI(Attention-aware Multi-prototype Transductive Inference)方法相比,总体准确率高了0.7%,平均类别交并比高了0.4%。(3)本文将(2)出的算法应用到实际装修环境中。首先,本文在S3DIS数据集上进行预训练,使模型学习点云数据的共性特征。然后,使用实际装修环境数据集对模型参数进行微调和测试。最终的实验结果取得了较好的准确率,不仅表明了(1)中数据预处理方法的有效性,同时也表明了(2)中算法准确性。
其他文献
随着卫星技术、高速光纤传输技术的逐渐成熟,天地一体化融合网络理念逐渐被大众接受并推广。SDN作为一种较为新型且技术生态相对完整的网络架构,通过解耦控制层与转发层,以软件形式实现了对全网资源的掌控与调度。通过SDN技术将天网与地网协同一体,可以极大程度发掘出天网的潜力。星地协同中传输链路的传输质量会受到基站所处的地理位置、地形、天气等外在因素的影响,因此为了最大限度保障服务质量,本文通过SDN控制器
经历多年发展,分布式数据库领域逐渐细分,可以按处理方式不同将其划分为面向事务处理的数据库(OLTP型),面向数据分析的数据库(OLAP型)以及较新颖的混合两种功能的数据库(HTAP型)。其中AP和TP类型的系统发展已经相对成熟,而当前市面上虽然已经存在不少的HTAP实现方案,但大部分是基于行列混合存储的方式实现,事务的实现仍依赖于行式引擎,列式引擎数据需要从行式存储中同步得到,而直接面向列式存储的
近年来,随着互联网大数据的发展,各种形式的多媒体数据(图像、文本、视频、音频等)呈现出爆炸式的增长。而对大规模多媒体数据精准、有效的检索也随之成为一个新的研究热点和难点。多媒体检索的任务目标是实现以一种数据类型作为查询来检索得到本类型或其他类型的相关数据。例如,用户可以使用文本检索相关的图片或视频。本文针对大规模多媒体检索的重点和难点问题进行研究,深入探索了大规模多媒体检索已有方法存在的一些问题及
在深度学习领域,视觉问答一直是热门的研究方向,这一任务的定义如下:一个视觉问答系统涉及视觉和文本的处理。由自然图像和形式自由、开放式的自然语言问题作为输入,以生成一条自然语言答案作为输出。目前的视觉问答方法通常基于物体检测的模型,计算速度慢且缺乏可解释性。并且训练依赖大量样本缺乏少样本学习能力。在本文中通过使用纯Transformer结构或卷积与Transformer相结合的方式对图像特征进行提取
主流的软件开发模式从瀑布模型一直演进到敏捷开发方法,即从面向文档的线性开发模式转变成面向用户的迭代开发模式,是为了提高软件产品的交付效率。但更快的软件迭代速度加剧了开发团队与运维团队之间的隔阂,使得交付软件的质量下降。DevOps思想在此种背景下被提出,它提倡通过开发与运维团队之间的紧密协作来保证高速率地交付可靠软件,通过促进团队成员之间进行知识分享来加强成员之间的交流联系,但企业在实践DevOp
交通预测是智能交通系统领域中的一个经典方向和研究热点,它有助于交通控制、路线规划、车辆调度等任务,对于缓解交通拥堵以及保障公共交通安全具有重大的作用。影响交通预测的主要因素包括道路网络结构的空间相关性和路况非线性动态变化的时间依赖性。最近的工作将各种深度学习方法应用于交通预测,主要利用图神经网络进行空间相关性建模,利用循环神经网络进行时间依赖性建模。然而,大多数现有方法假设空间相关性是静态的,时间
数据稀疏、知识不完备等问题是制约知识图谱发展的重要因素,因此,完善知识图谱的知识补全算法是领域内的研究热点。现有的知识补全算法无法有效利用知识图谱内知识,以及对开放世界和知识包含的时间信息的忽视导致知识图谱中的知识存在失效情况,无法为基于知识图谱的问答系统提供可靠的知识支持。针对上述问题,本文展开对面向文本问答的开放世界知识补全技术的研究。通过构建面向开放世界的知识动态融合模型,引入开放世界知识补
目前正在研发的VVC、AV1、AVS3等新一代编码标准提高编码效率的手段主要是通过更多模式或更复杂的变换来提高压缩效率。本质上是在用巨大的时间复杂度换取有限的空间复杂度。本文则从主观视觉质量的角度探寻提高编码效率的可能性。传统视频编码技术一直使用客观评价指标作为失真衡量方法,仍然难以代替人眼主观效果评判。本文以基于主观效果的视频编码优化技术为研究主题,重点研究人眼主观感受指标的建模。进一步使用主观
近年来物联网迅速发展,物联网终端规模迅速扩大。然而对大量物联网终端的电池进行更换,需要高昂的维护成本。因而终端的功耗成为限制物联网长期大规模部署的主要因素之一。终端功耗居高不下的原因在于通信与计算的功耗。为降低物联网终端功耗,近几十年来出现了环境反向散射通信技术已经能将终端的通信功耗从mW级降至以W级。其中Wi-Fi反向散射通信系统,因可以借助现有Wi-Fi设备部署,具有易部署的优点。然而现有的W
近年来物联网取得了快速的发展,如何为大量的物联网设备供能成为了当今物联网领域急需解决的关键问题之一。由于具有体积小,寿命长,免维护的优势,使用环境能量采集技术的无源系统在物联网中得到广泛应用。但是,由于能量短缺以及能量采集功率与计算功率不匹配的原因,无源计算系统目前在实际应用中仍然受到较高的任务响应时间的困扰。如果能够进行合理改造使其满足实时计算对于响应时间的要求,无源系统就可以快速响应网关,获得