自然语言文法分析与学习

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:lszh123321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
成分文法学习与分析是自然语言处理领域重要的一个任务,因为其能够表示语言的结构化信息以及表达语言的含义。成分文法分析使用语法树表示语言的结构化信息和生成过程。很多工作已经证明这种结构化信息有助于自然语言理解和生成的任务。为了得到更好的文法分析结果,研究者通常使用机器学习的方法自动扩展并细化一个基础的概率上下文无关文法。其中一个有效的方式是细化概率上下文无关文法中的句法类别。这种方法为每个句法类别关联一个隐变量,用来表示该句法类别在特定语法树中所呈现的子类别。本文主要探究这种包含隐变量的上下文无关文法模型。本文的主要贡献可分为如下三部分:  本文提出隐向量文法框架,这种创新的文法框架是对之前隐变量文法模型的一种扩展。在这个文法框架中,每个非终止符关联一个连续的隐向量空间,用来表示该非终止符子类型的集合。对于每个文法规则,隐向量文法在其非终止符子类型上定义一个权重函数,以此来建模文法规则的子类型空间。本文证明现有的隐变量文法和组合向量文法是隐向量文法的一种特例。  本文提出混合高斯隐向量文法作为隐向量文法的一种特例。混合高斯隐向量文法使用混合高斯函数在非终止符子类型空间上定义文法规则的权重函数。得益于混合高斯函数在加法,乘法,边缘化操作上的闭合属性,配分函数和文法规则子类型的期望值可以通过动态规划算法高效求解,进而能够应用混合高斯隐向量文法进行文法学习与分析。  本文实现混合高斯隐向量文法并将其应用到词性标注和成分文法分析中。词性标注实验显示混合高斯隐向量模型始终优于隐变量模型,混合高斯隐向量文法在成分文法分析的实验中同样优于隐变量模型,在测试数据集上的F1分值比Berkeley Parser高0.92%。
其他文献
新疆地区职业院校中存在大量少数民族学生,因此应普遍开设国家通用语言课程,旨在培养与提升少数民族学生应用国家通用语言能力.受到一些因素的影响,国家通用语言课的教学效果
单片集成技术是当今光通信领域最热门的技术之一,随着用户带宽需求不断增大,传统光通信技术遇到了很大的瓶颈。随着40G/100G技术在核心网中广泛使用,400G、1T高速传输技术的
该论文首先分析了移动计算的基本模型,根据当前移动计算环境中的一个热点研究课题——移动计算环境的网络层解决方案,详细分析了移动IP协议的体系结构.由于IPv6是因特网未来
本文在简要介绍了WAP协议族各层规范的基础上,着重介绍了WTP和WSP两层的一些规定。从WAP网关实现的角度分析了WAP协议的机制和原理。第二部分着重介绍了WAP网关主要功能的实现
传统基站广泛采用专用集成电路来实现基带信号处理,而专用集成电路在灵活性和可编程性上存在很大的不足,使得移动运营商在进行网络升级时不得不更换设备。基于通用处理器平台的
交互式电子白板具有强大的资源整合和交互性功能,能够丰富课堂教学形式,激发学生互动参与的学习兴趣,从而提升课堂教学的质量与效率,但关于其在高职语文课堂教学中的应用的研
提高课程教学质量,促进语文教学活动的深入开展是当前语文教师探究的重点问题.当前社会不断发展,人们的物质生活水平逐步提高,要想进一步适应社会的发展需求,必须要创新教学
该文详细介绍了我们已开发的一套基于高性能普通PC机的IP电话网关系统的设计与实现过程,分析了其实现总体框架、数据流模型、呼叫控制模型以及组件模块等重要方面.话音质量始
随着新课程改革工作的顺利实施,培养小学生的核心素养也成为教育教学的基本需求,借助多样化的阅读指导策略,提高小学生的语文素养,让他们在学习的时候,不断积累知识,达到学以
本文首先分析了小学语文群文阅读的重要意义,展示了小学语文群文阅读的主题阅读法、串联阅读法、背景阅读法、对比阅读法等方法,然后指出了小学语文群文阅读内容、主题、形式