一种网络聊天机器人的研究与实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:qiming1155
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着语音识别和自然语言处理技术的进步,聊天机器人(Chatbot)以其更友好体验被看成是人机交互的未来,市场上出现了大量的聊天机器人产品。然而,当前基于知识检索模型或生成模型的聊天机器人远没有达到期望的效果,甚至不实用。伴随着当前Web服务/APIs的大爆发,在这一背景下,本文提出了一种基于服务匹配的聊天机器人。该系统根据用户的输入,借助中文自然语言处理技术进行服务匹配,通过调用Web服务来响应用户意图。该系统可以解决知识检索模型维护知识库困难的问题以及生成模型很不成熟的问题,能给用户返回直接的和结构化的信息,在一定程度上使得聊天机器人可以代替现有APP。本文提出了聊天机器人服务匹配算法。通过中文分词、词性标注和命名实体识别等技术从用户输入的文本中提取关键词和命名实体,然后通过关键词搜索合适的API,根据API的信息,将提取的关键词和命名实体与API的调用参数匹配。本文采用CRF-BiLSTM模型进行中文分词,基于SIGHANBakeoff2005数据集对该模型分词效果进行了实验分析。结果证明较基于词典的机械分词方法MWSEG,CRF-BiLSTM的准确率、召回率和F值有接近10%的提升,达到了 Bakeoff 2005大赛Open组的最好水平。本文提出了适用于网络聊天机器人的RESTbot风格。RESTbot基于REST风格实现,针对网络聊天机器人的使用场景做了进一步的规范。聊天机器人调用RESTbot风格的Web服务无需人工编写格式转换代码,直接供前端使用,减少了重复的无意义的数据格式转换工作。然后本文针对RESTbot风格,提出了推荐的可视化方案。最后对RESTbot的可扩展性进行论述。最后,本文采用微服务架构实现了该网络聊天机器人系统。本文对网络聊天机器人系统的微服务架构、API网关、服务管理器和Web服务的实现细节进行了介绍。
其他文献
随着人类基因组计划的完成,生物数据增长的速度非常快。传统的生物实验的方法在庞大的数据前显得十分乏力。如何快速而又准确的利用生物信息学方法准确,高效的从生物数据中挖
表面缺陷检测在工业生产中对产品质量可以起到有效的监督控制作用,磁性材料在加工过程中产生的表面刀纹缺陷严重影响着其质量,人工去检测这些缺陷效率会比较低,并且容易受到
互联网已成为现代社会最重要的信息基础设施和人们工作、生活的重要组成部分。目前互联网采用的是一种“尽力而为”的传统模式,但是这种模式无法满足多媒体应用和各种用户对网
由硅基材料制造的电子计算机的计算能力持续增长。然而当硅基微电子器件线宽低于10纳米后,计算能力增长遇到技术问题:电路板路线安排问题、晶体管集成技术等。为了克服硅基器
OLAP(On-LineAnalyticalProcessing,联机分析处理)是随着数据仓库技术出现的一种数据分析处理技术,它允许用户快速地从不同的角度和层次分析大量多维数据,主要用于决策支持。随着
基于模拟鸟群及鱼群觅食行为的粒子群优化算法自被提出之后便得到诸多领域内学者的研究。因其具有自组织、自学习、模型简单、容易实现等特点,粒子群优化算法已被广泛应用于工
无线传感器网络(Wireless Sensor Network; WSN)是由大量传感器节点以自组织和多跳的方式组成的网络,这些节点随机分布在被监测区域中,感知、采集和处理被监测区域内感知对象
移动互联网的发展和智能移动终端的普及带来了移动服务的大规模兴起,并改变了服务平台交互模式,为用户数据信息增添了新的维度,推动了社交化、本地化、移动化的三合一混合概
随着互联网上数据的急剧增长,关键字检索的不足逐渐显现出来。关键字检索只能提供有限的结构化查询能力,丢失语义信息;此外,关键字检索不具备查询优化的能力,造成返回的检索结
人脸对齐是计算机视觉中的经典问题之一,其目的是自动计算出给定人脸图像中的面部关键点坐标。精确的人脸关键点定位结果对许多视觉任务具有重要意义,如人脸识别、3D人脸重建