论文部分内容阅读
评分在教学过程中有着重要的地位,他是考核学生学习效果的手段,也是考查教师教学水平的必要方式,而评分最关注的是评分的公平性与客观性。随着人工智能的快速发展,利用人工智能的机器自动评分逐渐走入人们的视野,不难看出,机器自动评分技术具有人工评分不具备的客观性、中立性,同时高效而省时省力,可以反复的完成评卷工作等,具有诸多优异的特性。高考是全省乃至全国范围内的大型升学资格考试,每年愈百万人参加,它决定了考生选择大学和进入大学的资格标准,在我国有着不可替代的重要作用。高考中文作文评分为评分的一个特殊应用场景,由于绝大部分考生受到了良好的教育与培养,作文评分的评分对象有着较强的语言能力,语文作文考查考生语言能力的同时还需要考查考生的理解能力、逻辑思维能力、文学素养、知识积累等多各方面内容。然而,与高考评分的严肃性相对的,是高考中文作文评分紧迫的阅卷时间,评卷老师工作量极大,可以说作文人工评卷是对高考作文评分公平性与权威性的极大挑战。本文尝试使用自动评分技术对高考中文作文进行自动评分。为解决人工评分局限性,首先需要理解、分析中文作文考试以及评分过程的复杂性,也是本课题面对的机遇与挑战。本文将着重探讨基于回归分析的中文作文自动评分的核心技术,主要内容包括了:(1)评分过程概念的分离与抽象,提出合理的评价指标与目标优化参数,为后续实验与实验工作的评价建立了基础;(2)采用启发式的特征抽取方法,建立基于浅层语言特征的回归模型,设定了实验的基线(baseline)。归纳出本课题基于启发式特征抽取的基本实验方法与思路;(3)建立基于启发式的深层语言特征的回归模型,对深层的语言特征进行分析、拆分与抽取,并对实验结果进行了合理的归因,更加深入的理解问题本质,了解了作文评分的难点与要点,使得后续的工作更加聚焦。(4)尝试使用深度学习的方法,用篇章向量来表示文章,利用回归模型进行训练和测试,以探索自动特征抽取方法对系统的影响,从而突破系统某些的特定指标的瓶颈。