【摘 要】
:
随着计算机和自然语言处理技术的不断发展,英语作文自动评分系统愈发成熟,已逐渐应用到高校的练习及考试中。跑题分析功能是英语作文自动评分系统中的重要组成部分,关系到评分的鲁棒性和可信度。国内现存的英语作文自动评分系统并不具备有效的作文跑题分析算法,而国外的相关技术大多基于有监督算法,需要大量与待测作文同主题的语料进行训练,存在着较大局限性。因此,研究出一种无监督的英语作文跑题分析模型具有重要的意义。本
论文部分内容阅读
随着计算机和自然语言处理技术的不断发展,英语作文自动评分系统愈发成熟,已逐渐应用到高校的练习及考试中。跑题分析功能是英语作文自动评分系统中的重要组成部分,关系到评分的鲁棒性和可信度。国内现存的英语作文自动评分系统并不具备有效的作文跑题分析算法,而国外的相关技术大多基于有监督算法,需要大量与待测作文同主题的语料进行训练,存在着较大局限性。因此,研究出一种无监督的英语作文跑题分析模型具有重要的意义。本课题以中国学习者的英语作文为研究对象,针对英语作文自动评分系统,设计了一种英语作文主题观点跑题分析模型。该模型无需参考范文,仅需待测作文和作文题目即可自动分析出待测作文的跑题程度,并能抽取出作文中与主题无关的句子。为了实现这一目标,本文的主要研究内容如下:(1)结合了分布式语义空间和结构化语义空间,构造了一个名为混合语义空间的语义表示模型,通过该模型可以准确得到英语单词和短语间的语义相似度。(2)结合混合语义空间模型和改进的光滑逆频率算法实现了一种句子级的英语作文表示方法。(3)根据我国英语写作的实际情况,确定了两种完全跑题的作文类型:恶意作文和与待测主题无关的作文,并结合英语作文表示方法分别设计了两种算法实现了对这两类跑题作文的检测。(4)同时为不属于完全跑题的待测英语作文设计了一种英语作文跑题句子抽取算法,并根据跑题句子数占作文句子总数的比重对待测作文进行切题程度评分。(5)通过上述步骤构建了一种英语作文主题观点跑题分析模型,并在真实的数据集中对其进行实验,结果表明,本模型相较于现有的无监督的跑题分析模型具有更高的准确率和更好的实用性。
其他文献
近年来,高校毕业生就业问题日益凸显。大学生就业难真是扩招导致的吗?要回答这个问题,本文运用劳动经济学的失业和职业搜寻理论对该现象进行解释,并通过对大学生就业市场的分
近年来快速崛起的微博,已成为当下互联网重要的信息交流平台之一,广泛而深刻地影响着大学生群体的性格、情感和学习生活等方面。本研究通过对广西大学194名大学生的问卷调查,
审计终结阶段,实际上就是审计报告的提出、沟通、审核、复核和审定阶段。审计报告的“凝练”,贯穿于审计终结阶段始终。学习和实践中发现,有些文件对此规定“语焉不详”,有些
以针叶樱桃和粳米为原料,在单因素实验的基础上,采用Box-Behnken响应面法对针叶樱桃黄酒发酵工艺进行优化。结果表明,在酒曲添加量0.8%、糖化温度31℃、糖化时间68 h、酿酒酵
说起防卫,人们就会想起那绵延万里的长城。孙中山先生称道:“古无其匹,为世界独一之奇观。”它的宏伟与壮丽,怎么形容也不过分。
目的建立HPLC法测定复方间苯二酚搽剂中间苯二酚和水杨酸含量的方法,提高复方间苯二酚搽剂的质量标准。方法色谱柱为SHIMADZU VP-ODS(150 mm×4.6 mm,5μm);流动相:0.1%磷酸-
2014年3月19日,全球领先的工业气体与功能材料供应商——空气产品公司宣布公司再次赢得了三星电子有限公司的一项重要合同,为后者在西安的芯片厂提供全套大宗特种气体以及化
民族传统体育承载了中华民族重要而宝贵的文化内容。民族传统体育要想从传统走向现代化、从民族走向世界化就得借助于高等教育这一平台以国家和民族发展视角加以审视民族传统
考察外国刑法中正当防卫的限度,对于研究我国刑法中正当防卫的限度条件具有重要意义。在大陆法系国家的刑法中,防卫行为须具有必要性与相当性就是正当防卫的限度条件。而英美
政府规制是在弥补市场缺陷的政策基点上,对企业行为和市场结构进行的微观干预,广泛存在于各个国家的产业政策体系之中。我国传统政府规制体系的强行政性、弱法治性,制约了规