论文部分内容阅读
随着句酷、冰果等英语作文自动评分系统的发展与成熟,越来越多高校开始使用自动评分系统辅助大学英语写作教学。离题检测功能对英语作文自动评分系统来说必不可少,但目前国内自动评分系统中并没有一套完备的离题检测算法,而国外的相关技术没有公开,所以研究出一种通用的、适合大学英语写作教学的离题检测算法显得颇为重要。因此,本文的目标就是根据中国大学生英语作文写作特点,研究和实现适合中国大学生英语写作教学的离题检测子系统。本文通过对当前国内外离题检测技术的研究比较,从适合中国英语作文学习者的角度出发,研究并实现一个离题检测子系统。为了实现这一目标,本文尝试从以下四个方面着手:第一,通过调研国内大学生英语写作的特点,并与经验丰富的英语教师商讨,将离题作文进行分类,确定研究对象;第二,收集不同类型英语作文并请两名专业的英语老师对每篇作文进行评定,判断作文是否离题及离题类型,计算两位老师评分的一致性,筛选语料,构建本文研究语料库:第三,调研国内外离题检测技术,针对所测作文是否有优秀范文及待测作文的数量,分别给出基于优秀范文、文本聚类及题目排序三种离题检测算法并对算法的效果进行了验证;第四,对离题检测子系统的需求做了具体的分析,在此基础上确定了离题检测子系统的实现方案,并对系统的实现进行了总体设计与实现。首先,本文通过调研中国大学生英语作文写作特点,将离题作文分为五类,并确定本文研究对象为其中三种离题类型作文。然后,针对不同场景,分别给出基于优秀范文、文本聚类和题目排序三种离题检测算法,相较于国外的研究,三种算法的效果都有明显提升,其中基于优秀范文的离题检测算法正确率、召回率和F1测度分别达到了60.56%、67.19%和63.71%。最后,根据离题检测子系统的需求,设计并实现了一个适合大学英语写作教学的离题检测子系统。