【摘 要】
:
文本推理的目标是识别文本对之间的蕴含关系和矛盾关系,这是一项语义层面的自然语言处理问题。文本推理可以应用于智能检索和问答系统等诸多领域。 本义的研究对象是简体
论文部分内容阅读
文本推理的目标是识别文本对之间的蕴含关系和矛盾关系,这是一项语义层面的自然语言处理问题。文本推理可以应用于智能检索和问答系统等诸多领域。 本义的研究对象是简体中义义本的推理关系识别,主要围绕NTCIR-9会议的文本推理评测任务展开。该评测任务要求判定给定文本对之间的推理类型,推理类型包括蕴含关系及其方向性、矛盾关系和独立关系。 本文介绍了一个基于词汇对齐和机器学习方法的自动文本推理系统。算法的核心思想是将句子推理的问题转化为词语推理的问题。文本推理过程可以分为词汇推理和句子推理两个阶段。 在词汇推理阶段,本文使用了中文数字编译器、中文概念词典CCD和网络资源来对文本对间的蕴含词对进行识别和提取,并计算蕴含概率。在句子推理阶段,本文提出了基于阈值的方法和基于机器学习的方法:基于阂值的方法直接对词汇蕴含概率求算术平均得到句子蕴含概率,然后通过与设定的阈值进行比较得到推理类别:而机器学习方法则通过已经得到的词汇蕴含概率和句法结构信息计算出特征.并训练得到一棵决策树模型来对测试语料中的文本推理关系对进行预测。 在数据分析阶段,本文对基于阈值的方法和基于机器学习方法的实验结果进行了比较,发现使用机器学习方法可以带来系统性能的提升。
其他文献
数据在迁移中的安全是信息安全中的一个重要课题,尤其是在安全存储领域。数据的丢失、篡改,非法人员对数据的盗取以及恶意程序的侵入等安全威胁不断向数据的安全迁移提出新的挑
随着嵌入式设备上3D应用程序开发的飞速发展,OpenGLES图形标准由于其跨平台和方便的特性,得到迅速普及。但是由于发展时间较短,基于OpenGLES图形标准的应用程序不能满足用户的需
近年来,Android应用市场迅速扩大,应用程序功能激增,越来越多有趣且多样化的功能被用户所喜爱。然而,Android手机电池续航时间短,应用程序耗能太快,逐渐成为消费者对Android手机不
伴随产品制造业的不断发展,先进的产品制造技术日益涌现,同时也呈现出许多新的挑战,其中尤为突出的难题体现在以下几点:设计团队的扩充以致地域不断分散,设计过程愈发复杂(呈
NTRU公钥密码体制(NTRU PKCS)是一种典型的快速公钥系统,其解决了困扰PKCS的速度问题,更因其密钥体积小、生成方法简单等特点,可广泛应用于电子商务、嵌入式、通信等领域。 N
统一建模语言(Unifled Modeling Language,UML)是一种通用的可视化建模语言,已经成为面向对象建模领域公认事实上的工业标准。由于UML图从系统的需求、静态结构、动态行为以及
随着互联网的迅速普及和web2.0近年来深入人心,标签得到了大量的应用。标签所天然具有的极广泛用户参与度,使得非法信息在其中能够以极低成本爆发性的传播。图书馆对于非法信
公钥密码体制的安全性都是基于一些难解的数学问题,其中,许多密码体制的安全性基础是离散对数的计算困难性。离散对数问题最初作为一个数学问题,在数论中具有较长的历史;但是,随着
随着信息技术的迅猛发展,信息化程度的不断提高,全球数据量呈现出爆炸式增长。面对当前PB级的海量存储需求,传统的文件系统在容量和性能的扩展上存在瓶颈。云存储以其扩展性强、
云计算具有资源按需供给、支持应用弹性伸缩等优势,已逐渐成为广泛使用的计算泛型。当前,越来越多的应用系统已经或正在向云计算环境部署和迁移。但是,云应用的部署和配置费时费