【摘 要】
:
近年来问答对话系统不断受到热捧,问答对话系统主要分为基于特定任务的对话系统和开放域的对话系统。随着技术的不断提升,以及对话场景的丰富性,在特定的场景中,通过与机器对话的方式来解决用户问题的任务型对话系统备受关注。本文研究的对话系统基于金融机构的业务催收场景来构造一个系统主导的问答对话平台。随着深度学习在自然语言处理中的不断发展,目前深度学习已经逐渐被引入到问答对话系统中来,主要研究方向包括针对问答
论文部分内容阅读
近年来问答对话系统不断受到热捧,问答对话系统主要分为基于特定任务的对话系统和开放域的对话系统。随着技术的不断提升,以及对话场景的丰富性,在特定的场景中,通过与机器对话的方式来解决用户问题的任务型对话系统备受关注。本文研究的对话系统基于金融机构的业务催收场景来构造一个系统主导的问答对话平台。随着深度学习在自然语言处理中的不断发展,目前深度学习已经逐渐被引入到问答对话系统中来,主要研究方向包括针对问答对话系统中自然语言理解模块和对话管理模块的设计,本文的主要研究内容包括:(1)自然语言理解模块引入了深度学习相关的算法模型进行意图分类识别,并与传统的机器学习模型进行对比。针对文本分类问题,介绍整个文本预处理流程,利用Fast Text算法模型进行词向量训练以及文本分类,通过n-gram特性增加文本的局部特征信息,增强短文本分类的准确率。(2)传统Word2vec和Fast Text训练词向量分类效果仍存在一定的误差,因此采用了Bert模型进行词向量训练,通过训练好的词向量模型进行迁移学习并针对文本分类任务进行微调。本文利用Bert和线性分类器融合的方式进行文本分类,实验结果比Fast Text有了较大的提升。同时也提出来Bert-CNN的融合算法,在基于Bert训练的词向量基础上添加CNN卷积神经网络对局部范围的文本信息特征进行提取,通过实验证明多轮对话文本分类的平均准确率达到95%以上。(3)基于有限状态机设计对话管理模块,构造一个系统主导的金融业务催收问答对话系统。通过系统提问,用户问答的方式进行多轮对话。根据回答内容通过训练好的分类模型进行判断,针对不同的意图进行状态跳转并通过问题语料库进行下一轮对话,并通过前端页面进行展示。
其他文献
人体SPECT是一种先进的大型医学影像设备,它通过复杂的机电系统驱动一个或多个探测器靠近或环绕人体部位运动,探测注入体内的放射性示踪剂得到器官图像信息,广泛应用于多种疾
鱼腥蓝细菌PCC 7120(Anabaena sp.PCC 7120)是一种丝状、光合自养型微生物,,是研究信号转导和细胞分化的理想材料。当环境中化合态氮源缺乏时,在鱼腥蓝细菌PCC 7120的菌丝上
从2014年开始,我国实行商事制度改革,工商注册登记便利化,各类市场主体迅猛增长,工商市场监管形势日益严峻,监管手段需要改进,监管技术需要提高,监管制度需要完善,工商部门如
随着新能源汽车产业结构的调整,增程式电动汽车(Extended Rang Electric Vehicle)因在纯电动汽车的基础上配备了辅助动力系统,不会在长途行驶时因为续航产生焦虑,成为纯电动汽车发展过程中很好的过渡车型,具有广阔的发展前景。传统的增程式电动汽车采用基于规则的能量管理策略,不能根据行驶状态实时调整作出最优控制,导致能量利用率较低,燃油消耗偏高。为减少增程式电动汽车行驶过程中燃油消
STEAM理念是一种以项目学习、问题解决为导向的课程组织方式,它将科学(Science)、技术(Technology)、工程(Engineering)、艺术(Art)以及数学(Mathematics)有机的融合在一起,有利于培养学生的创新能力。基于STEAM理念的小学科学课程的教学指的是把STEAM理念运用于小学科学课程中。已有研究大多只是指出STEAM理念与小学科学课程的结合具备一定的可行性,但
当前,我国正处于经济社会发展的转型阶段,农村人口流动更加频繁、社会结构更加多元、组织形式更加多样、利益关系更加复杂,面对新形势新任务,为解决新矛盾新问题,党的十九大首次提出了实施乡村振兴战略的决策部署,这是党和国家对未来一个时期农村工作的重要部署,影响深远、意义重大。村级组织作为直面群众的最基层组织,既是各级政府联系农村的重要桥梁和纽带,又是落实上级政策、维护社会稳定的重要组织,对我国实现乡村振兴
心血管疾病是威胁人类健康的主要疾病之一。近些年,随着人们生活节奏的加快和工作压力的加大,越来越多的人不幸患有甚至死于心血管疾病。由于心血管疾病具有发病突然、死亡率
目的:探讨鬼针草水煎液对高脂高糖诱导的小鼠非酒精性脂肪肝的防治作用及可能的作用机制。方法:100只Balb/c小鼠适应性喂养1w后,随机选取其中80只小鼠,用高脂高糖饲料喂养8w,建立非酒精性脂肪肝(non-alcoholic fatty liver disease,NAFLD)动物模型,其余的20小鼠用常规动物饲料喂养;对NAFLD模型动物进行血清学指标的测定和肝脏组织结构及病理结构分析,然后将
一般本体理论认为本体是“共享概念模型的明确的形式化规范说明,它确定了领域内共同认可的词汇和词汇之间的相互关系。”但随着时间的推移,这些概念和概念之间的关系会发生变
细胞表面展示技术是指通过锚定蛋白与外源蛋白融合表达,借助锚定蛋白可结合到细胞外膜的特性将外源蛋白携带到细胞的表面,一方面克服了因为细胞膜的阻隔而造成底物和酶蛋白无