【摘 要】
:
建立可以与人类进行自然交流的智能聊天机器人一直是人工智能领域的巨大挑战。特别是开放域对话系统长期受到语料库和建模方法的限制,难以实现没有任何场景及话题约束的自由聊天。随着深度学习与大数据技术的发展,一种基于深度学习的回复生成方法被提出。该方法建立的聊天机器人可以与聊天者就任意感兴趣的话题进行聊天,具有良好的扩展性。然而这种基于深度学习模型的序列到序列的建模方法利用的是最大似然概率来生成回复语句的每
论文部分内容阅读
建立可以与人类进行自然交流的智能聊天机器人一直是人工智能领域的巨大挑战。特别是开放域对话系统长期受到语料库和建模方法的限制,难以实现没有任何场景及话题约束的自由聊天。随着深度学习与大数据技术的发展,一种基于深度学习的回复生成方法被提出。该方法建立的聊天机器人可以与聊天者就任意感兴趣的话题进行聊天,具有良好的扩展性。然而这种基于深度学习模型的序列到序列的建模方法利用的是最大似然概率来生成回复语句的每个词语,会导致模型生成很多的通用回复,例如“我不知道”这样的回复。这种通用回复过于单一,严重降低了聊天者继续聊天的意愿。为此,本论文设计一种新的回复生成模型MSDialog,以提升回复多样性。首先,观察现实生活中的对话发现,针对一条输入语句,多条回复语句都是语法正确且语义合理的,即输入-回复之间可能存在多种对应关系。首先基于训练语料库对输入语句与真实回复语句之间的一对多映射关系进行建模,然后基于序列到序列模型来生成多条回复语句。此外,通过对输入语句应用主题推导模型来得到对应的主题单词,在生成回复词语时,通过结合主题词可以进一步减少通用回复语句的出现概率。通过在Cornell Movie和Daily Dialog两个公开数据集上进行性能评价,证明本论文设计的MSDialog模型可以生成多样化的回复。另一方面,已有的开放域对话系统,通常都是根据聊天者输入的语句来生成回复,即回复是与输入语句是直接相关的,机器人不会主动改变聊天话题或者进一步产生挖掘用户可能感兴趣的其他聊天内容。在本论文中,创新地设计了一种主动对话生成模型DUDialog,它能根据聊天者的输入语句,生成一条回复语句和一条建议语句。通过建议语句给聊天者以话题提示,从而延长双方对话的轮次。为实现这一功能,本论文设计的模型结构包含了两个解码器分别生成回复语句和建议语句。特别地,在生成建议语句时,通过融合节点将输入语句和回复语句的信息进行了融合,使生成的建议语句与输入和回复语句保持了上下文一致性。由于这是一个全新的对话模型,目前还没有针对这种主动式对话的语料库,本论文通过对多轮的Daily Dialog数据集进行预处理,模拟了主动式对话的过程,从而实现了对DUDialog模型的训练和评价。实验结果表明,新模型确实能实现同时生成回复和建议语句的功能,两条语句也与输入语句具有较强的相关性。
其他文献
在当今数字化时代,高动态范围(High Dynamic Range,简称HDR)图像可以带给大众更极致的视觉体验。当前HDR图像重建计算可以被归为两大类:基于单帧低动态范围(Low Dynamic Range,简称LDR)图像的HDR图像重建任务及基于多帧LDR图像的HDR图像重建任务。经过调研发现,目前,基于单帧LDR图像的HDR重建由于在亮曝区域存在信息缺失,导致重建结果在该处易出现亮斑和伪影
近年来,深度学习及其相关模型在安防、金融、交通、医疗等众多领域均有应用,是智能化信息化系统的核心技术,而其样本数据关系到深度学习算法的有效性与可用性,再加上深度学习算法具有良好泛化能力的同时也伴随着极度的脆弱性,导致其容易遭受攻击,且后果难以估量。对抗样本的出现对深度学习模型的安全性产生了严重威胁,只有在了解对抗样本的前提下,才能构建出更加稳固的模型。因此,本文立足于深度学习模型的安全性及可用性,
近年来,网络安全攻击行为变得越来越频繁。其中,恶意URL在网络攻击中扮演着重要的角色,如钓鱼网站、身份盗窃、金融诈骗、恶意软件、垃圾邮件等。如何有效地检测恶意URL,成为防范不断增加的网络攻击的关键问题。传统的恶意URL检测方法由于需要大量的特征识别工作,已经无法跟上恶意URL的快速增长速度。利用深度学习技术构建可泛化的模型以实现对URL的识别与分类,已经成为URL检测领域的研究问题。本课题的主要
行人属性作为一种最利于人类理解的生物特征,是智能视觉监控系统中最重要的识别目标之一。行人属性识别旨在从给定的图像中找到目标行人所具有的属性标签,由于能够提供关于人类语义特征的重要信息,该类算法已经越来越多地被集成到安全、商业等领域的实际应用中。本文以基于深度学习的行人属性识别为研究内容,通过对现有算法的分析,发现现有算法倾向于通过在网络中联合全局与局部两个路线以利用人体区域信息取得更好性能,但仍具
人对机器人的信任程度很大程度上会影响到人机协作的效果。目前为止,国内外对于人机的信任度研究成果有限,但是人机的信任度研究已经逐渐成为国内外一个热点问题,而基于外骨骼机器人的人机信任程度研究更是一片空白。随着截瘫助行外骨骼机器人临床测试工作的深入,其信任度对于人机协作效果的影响也逐渐凸显出来。信任作为人的主观因素,对其影响因素的分析与测量是研究的前提。本文针对该问题,对人与外骨骼系统的信任度影响因素
目标检测是计算机视觉领域最重要的任务之一,是其他更高级任务(例如实例分割、行人重识别等)的基础,在智能监控、无人驾驶和医疗影像识别等领域已经得到广泛的应用。然而由于小尺寸目标本身存在的特性(像素点少、边缘模糊等),主流的目标检测算法对小目标的检测仍然存在漏检率高和识别率低等问题。为了解决小目标检测中存在的问题,本文在基于关键点的目标检测算法上展开研究,分别从以下三个方面对现有工作进行改进:(1)提
随着计算流体力学(CFD)应用的精度需求不断提升,网格量越来越大,CFD产生的流场数据量达到了TB甚至PB量级。流场数据的时空复杂性提升,会导致时空特征难以辨认,也需要研究者耗费更多的时间人工抽取关键信息帮助认知流场中的复杂流动机理。如何自动抽取流场特征及关键时间步,将成为研究的热点,也是研究者面临的巨大挑战。近年来,深度学习的快速发展给各领域解决问题提供了新的思路。深度学习技术可以对海量数据进行
随着互联网技术的高速进步,传统工业领域应用互联网技术的情况越来越普遍。工业系统中数据的重要性不言而喻,而传统行业中的企业在数据管理方面能力的欠缺以及数据管理工具的缺失,加之数据来源多样化且异构性高,导致大量工业数据或是质量不高、或是同一企业分布在不同业务系统中的数据之间形成信息孤岛等等,使得数据中的信息得不到有效利用,这其中蕴藏的大量宝贵财富被浪费。针对上述场景,如何高效地集成及清洗多源异构数据,
推荐技术可以发掘用户感兴趣的商品,已经被应用到了互联网的各个领域。一般的推荐系统,通常基于用户的完整个人信息和历史行为做出推荐决策。但在某些情况下,用户的登录和访问是匿名的,其个人信息和长期配置文件往往不能直接获取,并且用户的兴趣又是动态变化的,具有较强的即时性,因此,需要考虑基于用户当前正在进行的会话(Session,又称匿名会话)做出推荐决策,即会话推荐(Session-based Recom
同步理论的起源来自于17世纪C.Huygens发现的单摆同步现象,在这之后的数百年里,同步现象被大量的学者发展和完善,并在众多领域中展现了其应用价值。近些年来,研究人员在微观尺度下观察到了类似的同步现象。依托量子力学的独特性质,使经典同步理论很难准确的描述和分析量子系统的同步现象。所以,量子同步理论成为了一个新的研究热点。量子同步理论作为量子力学、信息学与控制论的交叉学科,其主要研究目标使给出量子