基于领域本体中文自动问答系统相关技术的研究与实现

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:wkkyo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,信息量暴增,给人们的生活发生了翻天覆地的变化。现在,人们已经习惯于在互联网上获取各种各样的信息。这主要归功与搜索引擎技术的发展。然而,传统的搜索引擎仍然有一些缺陷。比如,用户只能通过关键字词进行检索,这并不能充分表达用户的搜索意图;又比如,传统索索引擎返回许多相关的候选结果,待用户从中找到其目标结果,这样的召回率往往很低,用户体验较差。针对以上问题,自动问答系统运用而生。用户使用自然语言问句向自动问答系统提问,系统返回的是对问句最直接最简单的答案。本文首先对现在已有的问答系统中的技术理论进行了分析,阐述了各个模块所使用技术的优势和不足。然后,参照国外一些本体构建工程,按照这些本体工程提出的构建方法论和经验,构建了小型的零售领域本体知识库,用于检索面向受限领域的知识。以本体在问答系统中的应用为出发点,提出了基于零售领域本体库的问答系统的答案抽取方法。用户使用自然语言问句向系统提问,经过分词、去停用词、语义标注等步骤,使用浅层语义分析技术对问句进行分析,得到问句中的已知和未知信息,在此基础上生成问句向量。最后使用SPARQL查询语言从本体库中查找问题答案。由于是直接查找问题的答案,有效地提高了系统的召回率,改善了用户体验。基于以上理论,设计并实现了面向零售领域的自动问答系统模型。通过应用验证了本文提出的相关技术,证明了本系统相关理论的可行性。
其他文献
随着物联网时代脚步的临近,嵌入式系统的在网络端的应用与日俱增。然而目前主流的IPv4协议由于其有限的地址位,是无法满足物联网时代海量的地址分配需求。因此采用128位的地址,
在无线传感器网络应用中,节点的位置信息对传感器所采集数据的有效应用起着重要作用,节点定位技术因而成为无线传感器网络研究领域的关键技术之一。传感器网络应用环境的开放性
软件测试按测试的执行阶段可划分为单元测试、集成测试、系统测试和验收测试。作为软件测试的第一阶段,单元测试只对软件中的最小可测试单元进行检查和验证,相对于其他阶段的
信息技术的快速发展和应用,加快了现代人的生活节奏,影响了人们的生活方式。Internet技术在个人生活、企业管理以及电子商务的应用,使人们能够更加快速和便捷的获取想要的信息,使
在枪弹外观缺陷检测领域,人工检测方法在测量精度、效率、实时性方面不能满足生产需要,因此,论文提出基于信息融合及图像处理技术的智能检测方法,该方法具有精度高、速度快、生产
随着集成电路制造工艺的不断发展,单芯片上可集成的晶体管数不断增多,芯片的功能和性能不断提高,内部结构越发复杂。这对流片成功率,高可靠软件系统开发等带来了更大的挑战,因而,需
随着互联网的飞速发展,网络数据迅速膨胀,信息超载和信息迷航的问题日益突出,用户想要快速地从众多的数据中找到符合自己需求的信息越来越难。为了解决这个问题,研究者们提出
社会对字体需求的增加,人们对个性化字体的追求,推动了汉字智能造字技术的不断发展。而基于笔画拼组的汉字智能造字技术需要不同风格的笔画库作为依托。在此应用背景下,本文通过
随着集成电路制造工艺的快速发展,处理器与主存之间的性能差距不断扩大,访存延迟对处理器性能的制约日益严重。同时,电源电压等比例缩小趋势的放缓导致单位面积芯片的功耗不断增
随着数字化信息资源的日益增长,大量的文本数据不断涌现,为了有效的管理和使用这些文本数据,人们提出了文本自动分类技术,它可以处理和组织庞大的非结构化的文本数据,提高文