【摘 要】
:
随着英语在世界各地的普及率越来越高,关于自动英语语法纠错的研究分别在学术界和工业界受到越来越多的关注。纠错能力强的算法能够帮助人们在英语学习和使用过程中减少语法
论文部分内容阅读
随着英语在世界各地的普及率越来越高,关于自动英语语法纠错的研究分别在学术界和工业界受到越来越多的关注。纠错能力强的算法能够帮助人们在英语学习和使用过程中减少语法错误的产生,提高生活与生产效率。在本文中,我们将英语语法纠错看成是分类问题。对于不同种类的语法错误,当目标单词被确定后,分类器将从一些给定的标签中预测目标单词的正确形式。我们提出了一套新颖的英语语法纠错算法:首先,在定义模型的输入时,根据语言学信息定位句子中的目标单词,从而提取目标单词的上下文;接着,使用带有两种注意力机制的循环神经网络计算目标单词上下文的特征表示,并用多层感知机来根据得到的信息选择分类标签。我们通过计算加工大量互联网上可免费获取的纯文本得到带有标签的训练数据,解决了当前监督式英语语法纠错算法缺乏大量标注数据的困难。最后,我们的模型采用端到端的方式进行训练。本文在CoNLL-2014测试集上进行实验,计算并分析本算法的准确率、召回率和F0.5。实验结果表明,本文算法在CoNLL-2014测试集指标上大幅超过了其他分类方法(F0.5 45.05%vs.41.6%),达到了领先水平。
其他文献
作为上海市重点建设课程、上海市精品课程(候选)和上海理工大学医学影像工程专业的核心课程,加强医学图像处理的课程建设对培养合格的医学影像工程专业人才具有重要意义。本文
针对当今少年儿童普遍存在的不爱运动、身体素质较差、肥胖率和视力不良率增多、心理健康也出现问题的状况,通过原因分析,认为,培养体育运动兴趣是让少年儿童动起来的关键;寻
大型通用有限元软件ADINA具有强大的非线性计算能力,广泛用于岩土工程数值模拟分析中.ADINA不仅自带常用岩土类本构模型,同时用户可通过子程序实现本构模型的二次开发.本文详
“三严三实”是以习近平同志为总书记的党中央站在实现中华民族伟大复兴的时代高度,向全党提出的一项重要政治要求。牢牢把握“三严三实”专项教育的主旨,修身正己,严于律己,才能
目的分析乙肝患者的血清标志物和乙肝病毒(HBV)DNA联合检测在HBV感染诊断中的应用价值。方法以2013年6月-2015年6月在珠海市妇幼保健院就诊的120例乙肝患者血清样本作为研究
开发信息系统的方法很多,但系统开发的成败在很大程度上取决于系统分析工作,因此,无论是计算机开发公司还是医院管理者在建立新系统时一定要把前期的这项工作做好,认真对待,
近年来,关键词推广所导致的商标侵权问题是网络商标领域的高发问题,同时该问题在学术界和司法实务上也面临很多争议。通过考察国内外司法判例和关键词推广服务提供者企业的商
认知弹性理论是多媒体课件设计的重要理论基础,它要求课件在结构上能表现多维交叉的复杂逻辑关系。但应用最广泛的PPT课件却以逐页演示的线性结构为特征,对非线性结构的支持
随着社会医疗保险费用的持续快速增长,医疗费用控制问题已经成为世界各国普遍关注的热点问题。费用控制的目的是利用有限的医疗资源使更大范围的人群享受到公平和基本的医疗
采用醋酸溶液和乙醇提取了6支鲜二杠马鹿茸的主干顶部(未骨化部分)、中部(部分骨化)、根部(大部分骨化)3个部位的多肽,进行了多肤的SDS-PAGE分析和胰岛素样生长因子-1(IGF-1)