论文部分内容阅读
近年来,随着语音识别和自然语言处理技术的进步,聊天机器人(Chatbot)以其更友好体验被看成是人机交互的未来,市场上出现了大量的聊天机器人产品。然而,当前基于知识检索模型或生成模型的聊天机器人远没有达到期望的效果,甚至不实用。伴随着当前Web服务/APIs的大爆发,在这一背景下,本文提出了一种基于服务匹配的聊天机器人。该系统根据用户的输入,借助中文自然语言处理技术进行服务匹配,通过调用Web服务来响应用户意图。该系统可以解决知识检索模型维护知识库困难的问题以及生成模型很不成熟的问题,能给用户返回直接的和结构化的信息,在一定程度上使得聊天机器人可以代替现有APP。本文提出了聊天机器人服务匹配算法。通过中文分词、词性标注和命名实体识别等技术从用户输入的文本中提取关键词和命名实体,然后通过关键词搜索合适的API,根据API的信息,将提取的关键词和命名实体与API的调用参数匹配。本文采用CRF-BiLSTM模型进行中文分词,基于SIGHANBakeoff2005数据集对该模型分词效果进行了实验分析。结果证明较基于词典的机械分词方法MWSEG,CRF-BiLSTM的准确率、召回率和F值有接近10%的提升,达到了 Bakeoff 2005大赛Open组的最好水平。本文提出了适用于网络聊天机器人的RESTbot风格。RESTbot基于REST风格实现,针对网络聊天机器人的使用场景做了进一步的规范。聊天机器人调用RESTbot风格的Web服务无需人工编写格式转换代码,直接供前端使用,减少了重复的无意义的数据格式转换工作。然后本文针对RESTbot风格,提出了推荐的可视化方案。最后对RESTbot的可扩展性进行论述。最后,本文采用微服务架构实现了该网络聊天机器人系统。本文对网络聊天机器人系统的微服务架构、API网关、服务管理器和Web服务的实现细节进行了介绍。