【摘 要】
:
自然语言处理各种底层技术的不断发展,如分词、词性标注、句法分析等技术的逐渐成熟,为更深层次的研究奠定了基础。目前,越来越多的研究人员开始把目光转向自然语言理解。复
论文部分内容阅读
自然语言处理各种底层技术的不断发展,如分词、词性标注、句法分析等技术的逐渐成熟,为更深层次的研究奠定了基础。目前,越来越多的研究人员开始把目光转向自然语言理解。复述研究作为自然语言理解中的一个重要方向,在信息检索、自动文摘、机器翻译、自动问答等领域有着广泛的应用,也受到了越来越多的关注。复述是指语言中用不同的方式来表达同一个意思的现象,它在问答系统中起着重要的作用。复述识别技术是复述研究的基础,它在自动问答的问题分析、答案抽取等环节有着广泛的应用。本文根据复述识别技术在问答系统中的应用,重点对以下几个问题进行了研究和解决:首先,本文在对不同种类的复述现象综合分析的基础上,提出了一个规则与有监督学习相结合的复述识别算法,该算法根据复述现象的不同类型采取不同的识别策略,分别使用简单句子语义相似度、基于句法结构变换的语义相似度和基于有监督学习的语义相似度进行复述判别。其次,在复述识别算法的基础上,本文还进行了从网络中抽取大量句子级复述实例的研究。数据的来源选择了百度知道和天涯问答的问答对,从一个问题和它的相关问题中进行复述实例的抽取。在复述识别算法的基础上,本文还充分利用了问题的答案,从而有效提高了抽取的准确性。最后,本文对复述的一些相关技术进行了系统的研究。尤其是在对《知网》概念相似度计算进行有效调整的基础上,实现了一个基于《知网》的词语语义相似度计算方法,更好地满足了研究的需求。为了能更好地展示复述在实际中的应用,本文还实现了一个复述的实验与演示系统,系统可以利用用户的反馈来改善自己。
其他文献
各种不同网络安全设备每天都产生大量的信息,并且不同的网络设备之间的安全事件存在一定内在的联系。安全态势值提供了一个宏观报警的方法,安全态势评估则是将安全信息数据的
BitTorrent(简称BT)作为一种高效的P2P文件共享协议为越来越多的人所使用和关注,也成为学术界研究的热点。目前的BT发布站点或搜索引擎在效率、全面性、安全性上存在着或多或
航空产品是一种较为特殊的产品,生产周期长,质量要求高,造价高昂,所需的零配件品种繁多。单独的企业可能没有必需的技术与能力来满足所有的制造生产要求。但是在引进某些合作
人脸识别技术尽管取得了较好的发展,并在安全访问控制、基于内容的检索和新一代人机界面等领域中有了初步应用。但现阶段算法在速度,准确性,鲁棒性等方面尚不能满足实际需求
计算机人脸表情识别技术是指计算机从人脸图像中分析并提取表情特征,应用人工智能和模式识别的方法加以归类和识别,进而理解人的情感。它是图像处理、模式识别、心理学等领域
随着流体力学、科学计算可视化、计算机图形学、网络三维游戏等的发展,可视化技术得到了广泛的应用。流线可视化技术是矢量场可视化技术中的一种,主要包括流线的计算与流线的
影视作品是以视频的形式呈现在观众面前的,因此对影视作品进行对白单元切分,实际上就是对视频进行对白单元切分。本论文的工作目标是希望通过对视频中张嘴说话状态的检测来分
信息物理融合系统(CPS)是指在环境感知的基础上,深度融合了计算通信和控制能力的网络化物理设备系统,通过计算、通信和控制技术(3Cs)的深度协作,旨在实现大型工程系统的实时感知、动
随着现代企业的发展和信息化程度不断提高,企业的各种信息系统日益庞大和复杂,系统安全形势也日益严峻。企业应用系统的每个环节都有可能遭到安全威胁,应用系统需要保护众多的资
随着信息技术的发展,不同语言之间的沟通和交流变得越来越重要,在此背景下机器翻译等自然语言处理技术得到长足发展。作为当前研究热点之一,命名实体识别及翻译技术正广泛应