基于规划识别的智能问答系统的研究

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:linjing912977
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,全球数据呈现爆炸式增长,这虽然给人们提供了更丰富、全面的信息资源,但是也给信息检索带来了困难。搜索引擎作为人们获取网络信息的主要手段,在新的时代背景下,还存在一些不足,比如:噪声数据多、返回结果重复、不够精简等。为了解决上述问题,问答系统应运而生,并凭借其快速、高效、准确的优点得到了快速发展和广泛应用。但在实际应用中,输入语句不完整、语义表述不清等问题对问答系统的性能产生了很大影响。因此,本文采用规划识别的思想来设计问答系统。规划识别是人工智能领域的研究热点之一,其特点在于可根据观察到的智能体片段、琐碎的动作,推导出其可能的目标。本文根据规划识别的这一特性,提出了一种基于加权目标图的问题匹配方法,设计实现了一个基于规划识别的问答系统。本文所做的主要工作如下:(1)对问答系统中所运用到的自然语言处理技术进行了研究,针对TF-IDF计算指标单一且未考虑同义词的问题,提出了改进的S-TF-IDF算法。S-TF-IDF通过词语的词频、词性、长度以及位置信息进行权重计算,同时采用《同义词词林》作为同义词度量标准,在计算逆文档频率时,统计出所有包含特征词或其同义词的文档。最后,将S-TF-IDF算法运用到百度百科词语相似度计算中,并通过Words-240数据集进行验证,结果表明基于S-TF-IDF的百度百科词语相似度计算可有效提高算法的精准率和召回率。(2)深入研究了规划识别的一些常见方法、分类及应用,通过对比分析各种方法的优缺点和适用领域,提出了一种基于加权目标图的问题匹配方法。该方法中加权目标图由节点和加权边组成,其中节点为用户输入问句的关键词、知识库中的问题及其构成词,加权边值(支持程度)为词语权重和词语相似度。实验证明,该方法取得了较好的问题匹配效果。(3)设计并实现了一个基于规划识别的问答系统,并通过实验验证了该系统具有良好的性能。此外,在系统加入评分功能,允许用户对系统给出的答案进行评分,当评分低于一定的阈值时,管理员可查看该条数据,并进行修改完善。
其他文献
三元层状(MAX相)陶瓷具有很多显著的特点,其具有较低的硬度和密度、较高的模量以及优良的导电和导热性能、另外其还具有一定的抗损伤容限性、优良的高温抗氧化性能和抗热冲击性
绩效管理是公共管理学提出的概念,属于人力资源管理的范畴,在西方得到广泛的应用。实践证明,建立完善的绩效管理体系,有助于促进个人的发展,保证组织目标的实现。我国处于社
自21世纪初以来,移动和网络技术已进入快速发展阶段,我们生活的各方各面都受到互联网技术的影响,随之兴起的交叉领域互联网金融也因其良好的前景在最近几年迅猛发展,各类理财APP如喷井般涌现,市场竞争越来越激烈。与此同时,随着理财APP逐渐饱和,获取新用户不仅成本越来越高同时也越来越困难,而新用户下载应用之后,却有很高比例的人没有进行理财,这对理财平台是极大的损失,因此关注新用户理财转化有很大现实意义的
人类经济飞速发展,对能源的需求越来越大,但当前现状并不乐观,传统能源被过度使用,材料利用率较低,释放出大量的废热,环境被污染,各国正极力探寻解决问题的措施,当前备受关注
在过去的十几年里,拓扑能带理论的发展为电磁波的操控提供了新的有效的方法。利用光子晶体、人工表面等离激元晶体等人造晶体结构,观测到了一系列有趣的光学拓扑现象,如受拓
由于生物学反应的复杂性,传统的体相检测技术可以检测到反应过程的总体变化,但很难对生物反应的分子过程和瞬时状态进行直观的检测。近些年来兴起并逐渐成熟的单分子技术包括
北特鲁瓦油田位于滨里海盆地东缘,沉积环境主要以碳酸盐岩台地相为主,其主要为带凝析气顶和边底水的构造-岩性复合型层状碳酸盐岩油气藏。随着油田进入全面开发的阶段,目的层
离子液体是化学化工领域的一类新型绿色介质,具有良好的稳定性、导电性、可设计性、特殊溶解性以及不易燃、蒸汽压小等特性。其中烯丙基类离子液体与传统烷基类离子液体相比,
高原低涡是造成高原及其东部周边地区降水的主要天气系统,掌握其活动的规律及变化特征有着十分重要的科学意义。本文主要分析了在夏季青藏高原的低涡系统与高原地表感热的自
在众多聚合物中,聚四氟乙烯(PTFE)凭借良好的摩擦性能,广泛应用于航空工业、机械、电子电器等领域。PTFE作为一种理想的自润滑材料,在高载、低速滑动工况下摩擦因数可低至0.0