英语短文的上下文连贯质量分析模型研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:ymlazy64
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能及其细分领域的不断发展,人们对摘要器、信息抽取系统等文本生成器产出结果的自动评价研究产生了极大的兴趣。与此同时随着科技不断发展,高校逐步开始采用计算机来进行辅助教学,借助计算机来缓解由于师生比例不足带来的教学压力,如英语教师对学生作文的批改压力。在这样的背景下人们开始研发英语短文的自动批改系统,从单词语法的准确性、主题的偏离度、句法的复杂性等方面来对文本质量进行分析。语篇连贯质量作为人工评分标准的重要依据之一,在大学生英语四、六级考试的作文评分中其好坏程度将分别导致25.8%和23.6%的分数差异,然而在现有的英语作文自动批改系统中却往往缺少该评价参数。由此本文以对学生英语作文的自动批改为研究背景,针对自动批改系统中缺乏语篇连贯质量分析模块的问题,设计实现了一个英语短文的上下文连贯质量分析模型。实验表明,本文模型的批改结果与人工批改结果的平均误差分为3.19,皮尔逊系数达到0.70,相比于传统的语篇连贯分析模型,本文模型有较高的准确率和有效性。本文的研究内容如下:
  1. 语篇关系作为一种衔接机制,对保持语篇结构的完整性和连贯性都有着非常重要的作用,而在以往的语篇连贯分析模型中却忽略了它与文本连贯之间的关系,基于此本文从修辞结构理论出发,通过分析提取英语短文中的语篇关系信息来捕捉文本的连贯信息。
  2.针对现有的大多数语篇解析器仅能在句子内部操作,无法对英语短文中的语篇关系信息进行长距离编码的问题,本文基于Hernault等人的框架设计了一个全文级的RST-style语篇解析器,将英语短文的语篇关系信息分析从句子级扩展到语篇级。
  3. 传统的语篇连贯分析模型大多只能分析语篇的局部连贯性,针对该问题本文将RST-style语篇解析器全文级的分析结果与Barzilay的实体网格模型相结合,构建英语短文的语篇关系矩阵,并通过提取分析矩阵中语篇关系的分布特征和转换模式来对英语短文整体连贯质量进行量化考究。
其他文献
电压稳定问题是系统稳定性研究的一个重要方面,虽然已取得一些进展,但总体上对电压稳定性的研究尚处于初期阶段。由于近年来国内外已发生了数起电压崩溃事故,因此加强电压稳定性及其相关问题的基础性研究具有特别重要的意义。  本文从静态角度出发对与电压稳定性密切相关的几个问题进行了分析,这主要包括:  (1)对π型电路的极限工况进行了讨论,求出了恒功率负荷的临界点特性,如临界电压(幅值和相角)、临界(有功、无
学位
由于海水中存在着蓝绿光低损耗窗口,且光通信带宽较大,所以可见光通信成为水下短距高速数据传输的主流方案。然而,目前的发光二极管调制带宽往往只有几MHz,限制了可见光通信速率的进一步提高。多输入多输出(Multiple Input Multiple Output,MIMO)技术可以通过空间复用并行传输多路数据,提高通信速率。所以,将MIMO技术与可见光通信相结合,建立光MIMO通信系统,提高系统容量,
下一代的射电望远镜,如我国作为核心成员国正在进行建设的平方公里阵列射电望远镜,将以其前所未有的灵敏度和分辨率获取射电图像,彻底改变我们对宇宙的理解,极大程度推动人类在天文领域的科学研究。在这一背景下,需要有效的成像方法来处理大数据量的射电图像。传统的算法如洁化算法和最大熵算法得到的重构图像质量有限,对于大规模数据的效果不佳,已经越来越不能满足如今的需要。因而本文旨在研究一种能够有效克服大规模数据处
学位
超分辨率重建技术能够突破数字成像系统的限制,能以低廉的成本有效地提高图像的分辨率和视觉质量,已广泛应用于诸多领域,如安全监控、医疗影像应用、卫星遥感图像等等。近年来,深度卷积神经网络在超分辨率重建上的应用获得了令人印象深刻的性能。但目前基于深度卷积网络的超分辨率重建的方法,仍存在对图像高频细节重建不足,网络模型参数规模过大等问题。为了进一步恢复图像中的细节纹理来提高重建图像的质量,本文将注意力机制
现有路径规划算法大多基于路网,在用于求解数字高程模型(Digital Elevation Model,DEM)下的路径规划时,因数据量大,效率低下。  针对上述问题,本文基于真实地形数字高程模型,在研究现有启发式寻路算法的基础上,给出了相应的解决思路与方法,具体工作如下:  (1)给出一种基于改进遗传与蚁群算法相结合的DEM路径规划算法。针对遗传算法和蚁群算法在 DEM 数据下进行路径规划时的效率
近年来无线传感器网络开始广泛应用于各类生产生活当中。通过安放在监控区域内的传感器节点,可以对周围环境中的物理信息进行感知并收集其相关数据,这些数据经过分析之后,能够有效地检测出该区域内发生的各类异常事件。在现有的无线传感器网络异常检测方法中,一般需要已知异常数据的统计模型或者其他相关参数,但在实际应用中这类信息往往不容易获得。此外,随着监控区域的不断扩大,需要部署的节点数量也相应增加,采集到的数据
Hash函数作为信息安全领域中一个重要的研究分支,被广泛用于数字签名方案、数据完整性检测以及区块链等方面。自2012年Keccak算法被选为美国新一代Hash算法标准SHA-3以来,其安全性一直备受关注。本文基于Keccak算法核心部件的性质研究,利用代数特性对Keccak算法进行了线性化分析,并给出了新的区分攻击方法,主要成果如下:  1.给出了Keccak-f的5个逆变换,并探究了核心部件的特
学位
近几年以小型无人机为代表的低空飞行器发展迅猛,由于廉价、易操控、不易被探测的特性,安全性能差,对人们的生命构成了威胁,因此无人机的检测与识别问题成了亟待解决的问题。基于无人机“低小慢”的特点,以及雷达具有全天候、全方位工作等探测优势,用雷达检测与识别小型无人机无疑是一个很好地选择,可以实现低成本高精度的无人机检测与识别。研究雷达检测与识别无人机时特征提取方法变得尤为重要,特征的优良直接影响检测与识
目的:评价~(18)F-脱氧葡萄糖正电子发射体层摄影术(~(18)F-FDG PET-CT)在预测肝癌肝移植术后肿瘤复发及判断预后中的临床应用价值。方法:回顾性分析我院100例肝癌肝移植受者术前PET-CT显像~(18)F-FDG摄取高低与肝移植术后无瘤生存率及肿瘤复发的关系。结果:65例(65%)肝癌肝移植受者术前PET-CT阳性(~(18)F-FDG摄取明显增高),35例(35%)呈阴性(~(
近年来,蜂窝车联网(Cellular-Vehicle to Everything, C-V2X)使得车辆与周围环境以及云端互联,达到降低事故率与优化交通效率目的,如何有效地协调干扰、分配资源、选择最佳通信模式成为提升蜂窝车联网性能的关键。本文以蜂窝车联网作为研究对象,主要研究了如何对该网络进行干扰协调管理,并采用协作通信策略降低网络中的能量消耗以及收到信息的错误概率。本文对蜂窝车联网的研究主要工作