家庭服务机器人自然语言指令解析到目标映射的研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:bsbs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能和机器人技术的不断提高,面向日常生活的家庭服务机器人也越来越普及,使用自然语言指令提高人机交互体验势在必行。但机器人很难识别并解析人类的自然语言,所以将自然语言指令解析成机器人能够处理的形式完成目标的映射是人机交互最为重要的一环,本课题将围绕此任务展开,并细化为以下几个方面。首先,自然语言指令解析需要进行意图检测和槽填充,为了利用这两者之间的关联性,提出了一个基于Graph LSTM和注意力机制的自然语言理解联合模型。Graph LSTM联合注意力机制对原始指令进行信息提取,经运算得到意图检测结果。意图检测参数连同预处理的槽填充类别作为槽填充输入,使用注意力机制进行信息提取后经双向循环神经网络和条件随机场单元处理并输出槽填充结果。其次,为了实现从指令到目标的映射,搭建了一个交互式图像指令融合网络,该网络采用级联沙漏网络对环境图像中的目标物体进行信息提取,提取到的参数与预处理后的自然语言指令参数拼接后经运算生成目标物体位置热力图和不确定性热力图。若这两幅热力图相似,则机器人能确定目标物体。若这两幅热力图不相似,说明目标物体或指令存在二义性,将启用问答网络进行目标确认。然后,对于目标物体或指令存在二义性的情况,设计了一个问答系统。机器人可向用户询问所需要补充的信息,得到的结果会被拼接到原始指令。图像指令融合网络重新解析环境图像和拼接后的指令,最终得到目标物体的置信热力图以完成指令到目标的映射。最后,通过实验验证了本文提出算法的有效性以及系统的可行性,对比了其他相关的实验,并分析了本文提出算法的实验结果。
其他文献
鱼类图像识别是监测鱼类种群与研究渔业资源的重要基础,然而图像中的鱼类目标在背景、形态、大小等方面都存在着较大的差异,这使鱼类图像识别面临着诸多的挑战。随着深度学习技术的发展,该领域中的卷积神经网络模型具备良好的图像特征提取能力和优异的泛化性能,这为鱼类图像识别提供了新的解决思路。本文从鱼类图像分类和鱼类目标检测两个方面开展鱼类图像识别工作的研究,通过对相关卷积神经网络模型进行研究及改进,以达到更好
随着人工智能的迅速发展,深度强化学习算法被广泛地应用在机器人领域,以解决机器人操作技能学习问题。推动和抓取技能是家庭服务机器人最基本、最主要的技能。针对家庭服务机器人目标推动与抓取操作技能学习阶段面临训练成本高、动作效率低等诸多问题,本文结合深度强化学习算法并加以改进,基于此设计更加高效的家庭服务机器人目标推动与抓取操作技能学习算法,以提高家庭服务机器人在复杂环境下的感知能力和自主决策能力,具体研
近年来,国内多个地区受雾霾气候影响较为严重,对生态环境和人们的身体健康形成危害。PM2.5浓度超标是造成雾霾的主要原因之一,探究PM2.5浓度变化的规律成为空气质量预测研究的主要内容。精准有效的空气污染物浓度预测方法有助于预防雾霾气候所带来的影响,同时可为制定大气污染治理策略提供参考价值。空气污染物在时间维度上的预测可看作为一个多变量的时间序列预测问题,而当前所提出空气质量预测方法中,绝大部分忽视
随着机器人技术的快速发展,对移动机器人路径规划问题、导航问题、定位问题的研究提出了新的挑战。围绕路径规划问题,日趋复杂的应用场景,对机器人规划算法的要求不断提高。单一的规划算法已不能满足机器人在真实工作环境中的需求。针对此问题,本文以QBot2移动平台为研究对象,围绕移动机器人的全局轨迹规划问题、多移动机器人局部避障问题、复杂环境下移动机器人混合轨迹规划问题这几个方面展开研究。首先,分析了QBot
在计算机视觉领域中,行人检测技术可以应用到很多场景中,所以一直是众多学者研究的热点之一。行人是城市道路交通的重要参与者之一,因此开展行人检测的研究对城市智慧交通、自动驾驶、智能安防等的发展都具有十分重要的意义。由于深度学习技术能够提取更为有效的特征,行人检测算法大多采用基于深度学习的方法来进行研究,但这些行人检测算法仍旧存在着一些弊端,大部分的检测算法很难达到检测效果与检测速度共赢的局面。本论文针
作为生命活动中必不可少的大分子,蛋白质-RNA相互作用预测的研究对生物信息学及相关医学领域(如新冠疫苗的研发)有着极大的影响和意义。传统的方法检测蛋白质-RNA相互作用消耗时间长、费用高,因此利用高效快速计算方法以及全面的数据特征表示成为了蛋白质-RNA相互作用预测的研究趋势。同时随着数据量的暴增,在这些海量的蛋白质和RNA数据中有着大量的信息很难被人工发现,因此利用高效的可视化手段对这些复杂的数
现代社会发展越来越迅速,各国在公共安全方面投入的人力物力越来越多。伴随着监控技术的不断发展,许多公共场所都设有监控摄像头,比如公园、学校、医院、超市、车站等。面对复杂的海量的监控视频数据,人工处理效率越来越低,使用计算机处理海量的监控视频变得非常重要。因此,计算机视觉中的行人重识别是一个经典的值得讨论的问题。行人重识别是利用计算机视觉技术,在跨摄像头监控视频中识别并找到需要寻找的特定行人。它对建设
本文提出使用一个非最大任意的五粒子态和一个非最大任意的二粒子态作为量子通道,隐形传送任意的三粒子态的方案。在本方案中发送者要进行三次Bell测量,接收者根据另一个可能接收者的Hadamard操作及测量结果引入辅助粒子并进行幺正变换,则可以概率性的成功实现隐形传送。
近年来,由于计算机技术、控制技术、以及网络技术的发展,使得遥操作技术得到了越来越多的研究者以及社会的注目。由于遥操作系统中加入了公共网络于是出现了“网络化遥操作系统”。但是,网络化遥操作系统中的时延也变得比旧有的遥操作系统更为复杂。而且对于任何遥操作系统来说,时延的存在可能会影响到系统的性能,如果时延过大,则甚至有可能会系统的不稳定。由此可知研究网络化遥操作系统的稳定性具有十分重要的价值。本文主要
异构网络表示学习,是在现实世界各类实体及其复杂关系构成的网络中,学习网络低维稠密独立的向量表示过程;该向量表示解决了大规模网络分析的高维稀疏和可扩展性差等瓶颈问题,成为当前研究热点。现有研究大多是由领域专家事先给出的元路径实现随机游走,然而随着网络节点数量的增加,元路径的选择十分困难且缺乏灵活性。本论文主要对基于随机游走异构网络表示学习进行研究,在考虑了网络的结构信息和语义信息基础上,给出比现有基