基于自注意力机制和依存句法的Highway Bi-LSTM模型的语义角色标注

来源 :东南大学 | 被引量 : 0次 | 上传用户:Ideal
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义角色标注(Semantic Role Labeling,SRL)是自然语言处理的基础应用,目前主要采用深度学习的方法,例如Highway Bi-LSTM模型。虽然该模型中的Highway结构可以加快网络收敛速度,但是存在以下问题:1)主要利用词形、词性、是否谓词等信息,很少利用句子结构信息,例如依存句法结构等。2)需要根据句子长度进行相应时间步的计算,难以在长句中距离较远的词之间建立语义联系,导致在长句上的性能较低。针对以上问题,本文主要工作如下:(1)针对Highway Bi-LSTM模型很少利用句法结构的问题,本文提出DRT_Highway Bi-LSTM模型。主要是抽取句子中词之间的依存关系类型(Dependency Relationship Type,文中将其简称为DRT),并将其融入Highway Bi-LSTM模型的词向量表示。实验结果表明,和经典的Highway Bi-LSTM模型比较,DRT_Highway Bi-LSTM模型在中文Chinese Proposition Bank(CPB)数据集上,F1值提高了0.62;在英文CONLL2012数据集上,F1值提高了0.44。(2)针对Highway Bi-LSTM模型在长句中性能较低的问题,本文在Highway BiLSTM模型的基础上增加自注意力(Self-Attention,文中将其简称为SA)机制,形成SA_Highway Bi-LSTM模型。自注意力机制可为长句中距离较远的词建立直接的语义联系,有助于提高在长句上的性能。本文利用中文CPB和英文CONLL2012数据集构造了长句测试集。实验结果表明,和经典的Highway Bi-LSTM模型比较,SA_Highway BiLSTM模型在中文长句测试集上的F1值提高了1.15;在英文长句测试集上的F1值提高了0.09。最后将依存关系类型(DRT)和自注意力(SA)机制相结合,形成DRT_SA_Highway Bi-LSTM模型。实验结果表明,和SA_Highway Bi-LSTM模型比较,DRT_SA_Highway Bi-LSTM模型在中文数据集上,F1值提高了0.15;在英文数据集上,F1值提高了0.42。和DRT_Highway Bi-LSTM模型比较,DRT_SA_Highway Bi-LSTM模型在中文数据集上,F1值提高了0.09;在英文数据集上,F1值提高了0.04。
其他文献
学位
学位
蒙特卡洛树搜索算法(MCTS)在完全信息博弈领域内的诸多成功展示了其非凡的探索和学习能力,也证明了有选择性的搜索和规划在复杂环境中的必要性。虽然这些成功的案例中的一部分已经被扩展到非完全信息博弈的领域中,但目前它们还不能达到和那些优秀的博弈论算法相同水准的实际表现或理论收敛保证。在德州扑克这样的规模较大的环境中,MCTS算法的改良受到更大的挑战,成功的应用寥寥无几。一方面,局部搜索的MCTS算法无
云计算环境下带软截止期约束的随机独立任务调度广泛存在于Mesos、Openstack、Kubernetes等架构或应用场景。保证这类任务的服务质量通常是使其在截止期之前完成,从而最小化时延。在异构云环境下,如何合理地调度随机到达的一组任务以最小化这组任务的总时延是一个有挑战性的NP-hard问题。考虑总时延最小的随机独立任务异构云资源调度问题,本文提出两阶段带反馈机制的调度框架TSSF(Two-S
白居易,中唐著名的诗人,也是伟大的造园家。他的园林思想,既融合了诗的意境,也蕴含了他处世的智慧,对中国后世造园以及日本平安时代以来的庭园艺术发展都产生了十分深远的影响。首先,笔者通过查阅文献资料,按照时间顺序梳理了白居易生平的迁居轨迹与造园实践以概括这一过程中其园林思想的连续性转变,并按照“日本文学影响庭园”这一脉络分别归纳整理、分析比较了日本文学和日本庭园对于白居易的受容,尤其侧重于受容的方式和
随着近些年物联网、大数据处理、人工智能等技术的不断发展,“新零售”这个概念于2016年应运而生。自动售货机作为零售业重要组成部分,因为其工作、部署不轻易受到地点、时间等外在条件限制,越来越受到运营商青睐,它的发展与壮大已然成为必然趋势。对于通用型自动售货机,国内外研究主要集中于传统销售动作实现与信息统计和远程监测。本文设计与实现了一种基于ARM处理器的面向新零售应用的智能终端,支持各种通信协议,可
协作通信技术能够有效克服无线信道的多径衰落与路径损耗等问题,提高无线网络的覆盖范围、信道容量以及信息传输的可靠性,是当今无线通信系统中十分重要的一项技术。传统的无线协作中继多采用半双工(Half-Duplex,HD)模式,即中继节点信号的接收与发送占用不同的时间或频带资源,从而造成通信资源的浪费,导致频谱效率降低。随着射频技术特别是自干扰(Self-Interference,SI)消除技术的不断发
随着互联网和信息技术的飞速发展,在线社交网络已经成为人们分享生活和获取信息的重要媒介,同时也成为了商家进行商品推广的重要渠道。商家在对商品进行推广时通常会采用“病毒式营销”的方式,即选择一定数量具有影响力的用户免费试用,通过用户间的口碑效应使得社会网络中有更多的人接纳该商品。在对“病毒式营销”的深入研究中,学者将其抽象为影响力最大化问题。经典的影响力最大化问题主要研究的是单条信息在一个网络中传播的
工业污泥可通过热解技术快速转化为热解气、油及污泥炭等产品,实现资源化利用。然而,污泥含水率高、热值低、重金属含量高导致热解过程耗能高、反应特性差和产物品质低等问题。添加生物质进行共热解可为热解反应提供能量、固化重金属以及提高产物品质,具有良好的应用前景。本文从工业污泥与生物质共热解制炭及其对重金属固化特性出发,首先研究了共热解成炭特性和反应协同耦合机制,其次研究了共热解过程中重金属迁移与转化规律,
数字化X射线摄影(Digitial Radiography,DR)是计算机数字图像处理技术与X-射线放射技术结合而形成的常规X线摄影技术。DR因辐射剂量小、灵敏度高、图像分辨率高、处理速度快等优点,一直受到医疗人员的认可,已经被广泛应用在医学影像领域。但是,DR摄影成像过程中,会不可避免地产生一些影响图像成像质量的散射射线。因此,有效地校正DR图像中的散射射线将可以提高DR图像的成像质量,并且降低