论文部分内容阅读
近年来,以机器人为代表的智能制造掀起了世界范围内生产技术领域的风暴。物联网、大数据、云计算、人工智能等信息技术的重大突破,使得机器人的应用范围从工业制造向医疗健康、军事、农业等领域不断扩展。有着中国版“工业4.0”规划之称的《中国制造2025》将机器人产业列入重点战略,但是因为机器人产业涵盖了机械、电子、传感检测、计算机、生命科学等多个学科,对机器人设计提出了较高的要求。
目前,基于知识图谱的问答系统已被用于很多特定领域,如医疗、农业、教育等领域。本文将问答系统引入机器人设计领域,提出一种基于专利知识图谱的关于机器人设计的问答系统,该问答系统能够回答用户提出的关于机器人设计方面的自然语言问题,并为机器人设计者与研究者在了解与设计机器人的过程中提供解决方案和专利推荐。
基于专利知识图谱的机器人设计问答系统是以机器人领域的专利知识图谱为基础来开发。首先,使用问句模板和问句解析的方法将用户问题转为查询模板或问句查询图;再根据第三方概念知识库和词向量模型对用户问题中的实体等概念进行语义角度的扩展;最后将扩展后的查询模板或问句查询图与专利知识图谱建立查询匹配关系。本文具体工作如下:
(1) 将无结构化的用户查询自然语言问句转化为结构化表示。对用户查询问句,使用句子相似度进行模板匹配,构建问句查询模板;或使用Stanford CoreNLP工具解析后构建问句查询图,实现查询问句结构化。
(2) 针对自然语言歧义问题将问句进行扩展。使用ConceptNet和Microsoft Concept Graph第三方概念知识库,和本地专利数据词向量模型,对结构化询问句中的实体进行同义词、相关词的扩展,并采取一定的过滤策略。
(3) 对扩展后的结构化查询问句与专利知识图谱进行查询匹配。对问句查询模板和问句查询图采用精确匹配、模糊匹配两种方式,同时处理问句中关系缺失问题。
(4) 对基于专利知识图谱的机器人设计问答系统进行设计与实现。使用Neo4j图数据库存储专利知识图谱,将不同的部分构建模块化设计;使用Django网页框架进行后台处理、用户界面设计;使用jQuery框架完成用户交互设计。
目前,基于知识图谱的问答系统已被用于很多特定领域,如医疗、农业、教育等领域。本文将问答系统引入机器人设计领域,提出一种基于专利知识图谱的关于机器人设计的问答系统,该问答系统能够回答用户提出的关于机器人设计方面的自然语言问题,并为机器人设计者与研究者在了解与设计机器人的过程中提供解决方案和专利推荐。
基于专利知识图谱的机器人设计问答系统是以机器人领域的专利知识图谱为基础来开发。首先,使用问句模板和问句解析的方法将用户问题转为查询模板或问句查询图;再根据第三方概念知识库和词向量模型对用户问题中的实体等概念进行语义角度的扩展;最后将扩展后的查询模板或问句查询图与专利知识图谱建立查询匹配关系。本文具体工作如下:
(1) 将无结构化的用户查询自然语言问句转化为结构化表示。对用户查询问句,使用句子相似度进行模板匹配,构建问句查询模板;或使用Stanford CoreNLP工具解析后构建问句查询图,实现查询问句结构化。
(2) 针对自然语言歧义问题将问句进行扩展。使用ConceptNet和Microsoft Concept Graph第三方概念知识库,和本地专利数据词向量模型,对结构化询问句中的实体进行同义词、相关词的扩展,并采取一定的过滤策略。
(3) 对扩展后的结构化查询问句与专利知识图谱进行查询匹配。对问句查询模板和问句查询图采用精确匹配、模糊匹配两种方式,同时处理问句中关系缺失问题。
(4) 对基于专利知识图谱的机器人设计问答系统进行设计与实现。使用Neo4j图数据库存储专利知识图谱,将不同的部分构建模块化设计;使用Django网页框架进行后台处理、用户界面设计;使用jQuery框架完成用户交互设计。