基于用户特征及行为指导的人机对话问答交互研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:godmouse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人机对话与问答,是指让机器能够理解并运用人类语言进行人机互动交互。通过对话与问答交互方式,人类可以从计算机获得实时信息查询、问题解答、任务办理以及闲聊对话等服务。近年来,随着移动互联网和高速网络通信的发展,人机交互日益渗透到人类生活的方方面面,因此也受到了学术界和工业界的广泛关注。
  已有的人机对话问答研究,主流算法是从自然语言处理语义分析角度出发,利用所查询问题与备选答案之间,或者是对话上文与下文之间的语义匹配相关度来进行探索。这些算法模型框架,通常在深度神经网络模型中做各种组件堆叠,包括循环神经网络、卷积神经网络、记忆网络、多种注意力机制结合等方式进行大量实验,以获得最佳模型效果。尽管这些方法已经取得了令人瞩目的进展,仍然面临着诸多挑战:(1)在人机对话问答交互过程中,没有考虑用户个胜化的主观需求,因此算法给出的结果千篇一律,无法做到千人千面。(2)对话与问答内容通常以短文本形式存在,仅仅从词法、句法等语言模型层面进行语义理解,由于所提供的信息有限,无法进一步提高算法的性能。(3)让机器学会跟人一样进行思考与回答,需要参考人类的思维和行为方式。以往做法往往以实验导向为模型构建标准,无法很好地利用人类专家知识和模仿人类行为在模型框架设计上体现。(4)人机对话与问答,需要关注上下文语境对于当前状态的影响。如何像人类一样对于上下文有深层次的认知和逻辑推理能力,现有方法还有待改善。
  基于以上几大挑战,提出了“以人为本”的思想宗旨,充分分析人类在对话问答场景中,是如何进行思考和认知,从人类通识行为以及人类个性化行为两个角度来指导计算机人机交互。分别进行了用户画像、用户社交网络、用户思维认知、用户行为指导四个工作的调研,在实际应用场景中验证我们的思想,在不同对话与问答任务中提升了模型的推理与预测能力。具体而言,做了以下几个工作:
  针对用户个性化需求问题,提出了结合用户画像和多示例深度学习框架,在用户对社区问答服务答案满意度预测任务中进行了验证。认为一个被解决的问题,至少包含一个满意答案,即多示例学习概念中一个正包中至少有一个正例,符合弱监督模式下的多示例学习的设想。通过结合用户画像建模与基于深度学习的文本语义表征,在神经张量网络中进行了个性化的满意度预测。实验证明所提出的框架MIDL结合用户画像和多示例深度学习框架的有效性。
  针对对话问答短文本数据稀疏问题,提出了结合用户社交网络附加信息和深度学习框架,在社区问答服务相似问题检索任务中进行了验证。认为用户的社交网络信息可以体现该用户的喜好与关注点,可以为社区问答相似问题检索提供有价值的附加信息。通过结合用户社交网络信息、问题的类别信息以及问题本身的语义信息,采用了基于随机游走的异构网络深度学习框架进行相似问题检索。实验证明所提出的框架HSIN能有效缓解相似问题检索任务的短文本稀疏表征问题。
  针对模仿人类专家知识在模型设计上的问题,提出了结合交互式注意力机制、记忆网络和自查机制的深度学习框架,在抽取式问答阅读理解任务中进行了验证。认为人类在做阅读理解题目时所进行的阅读方法具有科学参考意义,因此深入研究了人类进行阅读理解过程的思维方式。发现了对于问题和答案的多轮交互式学习,对于词层面的细粒度理解和最后的答案检查,都能有效提高阅读理解的正确率。实验证明所提出的框架Smarnet能在抽取式阅读理解任务上取得良好的性能表现。
  针对学习人类对上下文感知的逻辑推理问题,提出了结合结构化注意力网络和条件随机场深度学习框架,在对话行为识别任务中进行了验证。认为在人机对话场景中上下文语境的感知依赖对于对话理解至关重要。通过参考人类在对话中以对话隐式分割和隐式组合的方式进行上下文感知,提出将条件随机场与结构化注意力机制结合的方式进行上下文结构化依赖学习。实验证明所提出的框架CRF.ASN能在对话行为识别任务上比其他前沿方法对上下文感知能力更强。
其他文献
图像修复的目的是对破损图像或部分物体移除后的图像进行修复,以保持图像的完整视觉效果。作为图像处理领域中的研究热点,图像修复技术在老照片修复、目标物体移除、特效制作等方面都具有重要的研究价值。  论文首先阐述了图像修复的背景和研究意义;概述了图像修复的过程,简要介绍了近年来比较流行的图像修复算法,重点讨论了两种大区域图像修复算法,并对这两种算法当前所面临的主要问题做了分析。  其次,论文对基于马尔可
学位
近年来,随着三维模型建模技术的发展以及低成本采集设备的出现,三维模型数据规模日益庞大,已经成为文本、图像、视频、音频以外的一种新模态大数据。由于三维模型能够更加真实的表征自然界中物体的空间结构特性和外观特性,三维模型已被广泛的应用于智能制造、数字娱乐和虚拟现实等领域。面对指数级增长的三维模型大数据,如何实现便捷的三维模型获取和管理已成为亟待解决的难题。因此,基于内容的三维模型检索关键技术成为了当前
极化码(Polar Codes)是基于信道极化(Channel Polarization)现象的一种新型信道编码。信道极化是指对N=2n(n为任意正整数)个相互独立的二进制输入离散无记忆信道(Binary-input Discrete Memoryless Channel, B-DMC)W,通过引入一些相关性操作得到一组有相互依赖关系的极化信道的过程。当参与操作的信道数量N趋于无穷大时,对应得到的
学位
图像质量对于各种图像任务都有着至关重要的作用,在一定程度上决定着任务的困难程度以及完成的效果,利用超分辨率技术恢复图像质量成为研究的热点,但是超分辨率重建任务是一个病态问题,因为要从低分辨率图像中恢复更高分辨率的图像。为了提高图像的分辨率,可以采用升级图像图像采集硬件或延长图像采集时间的方法,但是会增加系统成本,或是增加了对病人的辐射剂量等。因此,从软件的角度来提高图像分辨率是更好的选择,即通过超
学位
随着多媒体和互联网技术的发展,视频数量飞速增加,使得视频智能化应用的发展受到了广泛关注。视频行为识别旨在对视频内容进行理解,以准确识别视频中目标的运动类别,其在视频检索、智能监控、人机交互领域具有广泛的应用前景,目前已成为计算机视觉领域的热点研究课题。视频行为识别的关键在于获取能够准确描述视频内容的特征表达。近年来,深度学习在特征学习方面表现出了优异的性能,被广泛应用于各类计算机视觉任务中。本文以
学位
频谱资源是无线网络中的一个主要组成部分,对这种有限的资源持续且固定的分配会导致频带的耗尽。因此,这种资源的共享能力将持续作为一个主要的研究方向,对研究人员有莫大的吸引力。近来,新兴的对现有资源的扩展、应用和服务例如运载性自组织网络,在大多数情况下对可利用频带的需求越来越大。  因此,对频谱资源低效的利用以及其匮乏的现状促生了一个新的无线通信范例,在这个范例中可用的频谱资源能被机会性地调用。且在该范
随着社会经济的发展以及人民生活水平的提高,中国拥有车辆家庭的比重越来越高。调查显示随着车辆的逐年增多,交通事故也逐年增多。因此高级驾驶辅助系统(Advanced Driver Assistant Systems,ASAS)成为一个研究热点,其中车道线检测技术是最为关键的一步。但恶略的天气情况以及树荫的遮挡等,都会严重影响车道线检测的准确率。当算法过于复杂时,又很难满足车辆在高速行驶时的检测速度要求
论文以河南某工厂加热炉实际控制系统的总体设计和分析为背景,详细调研了加热炉控制系统及控制策略的国内外研究现状。通过分析加热炉的结构和工作方式,以及工业现场存在的问题,明确了加热炉被控对象,设计了基于PLC的加热炉控制系统,并完成系统软硬件选型、控制程序编写、WinCC监控界面组态,以及系统通信网络构架。通过配置OPC通信协议,实现WinCC与MATLAB之间的数据交互。  在加热炉系统中,决定其热
学位
双级矩阵变换器—永磁同步电机系统具有能量可双向流动,功率因数可调节和无需大体积的直流储能环节等优点,在驱动电机方面具有重要的意义。传统的双级矩阵变换器直接转矩控制具有结构简单,控制性能好的优点,但由于输入电流正弦度较低,转矩磁链波动大等缺陷限制了其广泛应用,本文针对该问题进行了研究并提出了占空比优化控制策略,通过新建立的影响因子表来改善系统的动静态性能。论文的主要安排如下所示:  首先介绍了传统的
实际生活中存在大量系统可以用切换正系统描述,如:经济、生物、交通等领域。切换正系统足一类特殊的切换系统,其子系统间的切换特性和系统状态的非负特性使得对此系统的研究充满了复杂性和挑战性。尽管切换正系统的研究已经取得一些进展,但还处于初步研究阶段,大量的分析和综合问题亟待解决。因此,研究切换正系统的相关问题具有重要的应用价值及理论意义。本文主要研究切换正系统的稳定性、观测器设计及控制器设计等问题,主要