【摘 要】
:
随着互联网技术的快速发展,在线问答系统已经成为人们生活中获取知识和信息的必要工具。然而互联网的信息繁杂多变,如何能将准确的信息及时地提供给用户,从而提高问答系统的
论文部分内容阅读
随着互联网技术的快速发展,在线问答系统已经成为人们生活中获取知识和信息的必要工具。然而互联网的信息繁杂多变,如何能将准确的信息及时地提供给用户,从而提高问答系统的时效性,是当前需要解决的一个问题。现有的问答系统已经能够通过对用户问题的检索,从海量的问答资源中找到并返回给用户有帮助的答案,但是对于一些时效性较高的问题的回答还不够好。如果能在系统中加入时间维度,对问句进行时间分析并且对答案进行时间上的约束,则能在一定程度上提高答案的准确性和时效性。本文针对问答系统在时效性上的不足,对问句进行了时间的分类,同时通过对问句时间域的解析,增加了对答案的时间约束。主要工作如下:(1)从在线问答社区中抽取金融类问句作为语料,用Fleiss’Kappa系数对标注结果进行一致性评估。(2)结合词、句法关系和语义对问句进行特征抽取。(3)考虑到语料中时间敏感问句和非时间敏感问句的比例,分类阶段引入了AdaBoost算法对语料进行平衡。然后结合机器学习的三种分类算法:决策树、朴素贝叶斯和SVM进行测试,最终得到的F平均值为83%左右。(4)本文提出了解析问句时间域的方法,其中包括时间词和时间敏感词的提取,相应时间约束的设置以组合规则。并将使用该方法解析出来的时间域应用到最终的答案生成部分中去,过滤出最终的答案。在系统评测过程中,系统内部通过和只用文本搜索得到的答案进行对比,精确率提高了近7个百分点。将问句时间解析的结果对百度知道和SOSO问问的返回结果进行约束,正确率也有所提高。
其他文献
本文以嵌入式数据库软件原型的研究开发为应用背景,采用面向对象方法、软件构架技术等软件方法论,以及XML和ACME等形式化描述工具,建立嵌入式数据库文件管理软件构架,并采用
随着网络技术的快速发展,网络安全问题逐渐成为人们关注的焦点。为了有效地保障网络的安全,人们提出了将入侵检测系统与具有安全特性的网络设备进行联动,来构建一个动态防御
本论文先介绍了数据仓库的相关理论、ETL(数据抽取、转换和装载)技术、OLAP(联机分析处理)与数据挖掘相关概念及其与数据仓库的关系。然后对利安公司现有数据进行分析整合,针
双目视觉是场景三维重建中的一种很重要的技术,它利用由相机所拍摄的两幅双目图像,依据相机的几何成像关系将物点的深度信息计算出来,进而计算出其三维坐标信息。该技术在计算机
本文针对一个C/C++程序静态安全检查工具,设计与实现了一种基于状态机的安全漏洞检查机制,该机制为安全检查工具提供定义安全检查所遵循的安全规则的支持及依此查找安全漏洞
随着移动通信、无线网络和多媒体技术的发展,视频应用的场合也越来越广泛,许多视频系统要求终端不仅能够实现低复杂度的解码,并且具有实时的编码和传输等功能,比如移动视频电
20世纪90年代中期,量子计算(Quantum Computing, QC)的研究引起了人们广泛的关注。借鉴量子态的叠加,纠缠和并行等特性,人们将进化计算(Evolutionary Computation, EC)与量子
随着计算机和网络技术的飞速发展,经济全球化的浪潮席卷世界每个角落,传统的纵向经济运营模式逐渐开始横向发展,项目管理也越发盛行。项目管理起源于单一项目,单一项目具有自
随着3G网络的发展,Internet和移动通信网的逐步融合是必然趋势,Home NodeB (HNB)解决方案以远程跨运营商域的方式通过固网运营商的IP网络连接到移动网络的家庭基站网关Home N
作为一种分布式数据库的查询优化方法,由于其本身的局限性,SDD-1算法所生成的查询计划的通信费用并非最小,而且当连接查询涉及到的站点数目较多时,会因其生成查询计划的时间